编程技术 - 军军小站|张军博客
Python

python爬虫---实现项目(四) 用BeautifulSoup分析新浪新闻

这次只演示了,如何在真实项目内用到BeautifulSoup库来解析网页,而新浪的新闻是ajax加载过来的数据,在这里我们只演示解析部分数据(具体反扒机制没做分析)。代码地址:https://gitee.com/dwyui/BeautifulSoup_xinlang.git。关于的爬虫的博客已经越来越多,使用到的技术也越来越多,后期我还会持续写下去,大概从几个角度去写,多线程爬取(提高效率),如何更好的做到爬取数据(破解反扒)。用redis管理多线程和代理

系统 2019-09-27 17:45:54 1849

Python

Python爬虫入门【3】:美空网数据爬取

美空网数据----简介从今天开始,我们尝试用2篇博客的内容量,搞定一个网站叫做“美空网”网址为:http://www.moko.cc/,这个网站我分析了一下,我们要爬取的图片在下面这个网址http://www.moko.cc/post/1302075.html然后在去分析一下,我需要找到一个图片列表页面是最好的,作为一个勤劳的爬虫coder,我找到了这个页面http://www.moko.cc/post/da39db43246047c79dcaef44c2

系统 2019-09-27 17:45:41 1849

Python

Python编程实现tail-n查看日志文件的方法

1、函数实现#-*-coding:utf-8-*-deftail(filename,n=10):withopen(filename,"r")asf:lines=f.readlines()[-n:]return"".join(lines)2、测试文件poetry.txt为了方便验证,每行之前加上行号数字1.虞美人・宜州见梅作2.3.宋代:黄庭坚4.5.天涯也有江南信。6.梅破知春近。7.夜阑风细得香迟。8.不道晓来开遍、向南枝。9.10.玉台弄粉花应妒。11

系统 2019-09-27 17:45:33 1849

Python

python虚拟环境virualenv的安装与使用

前言在安装完python及pip,setuptools等工具后,即可以创建virualenv虚拟环境了,这个类似于虚拟机的工具,可以让同一台电脑中运行多个不同版本的python程序,互不影响,不用的时候,可以退出或删除,挺不错的一个开发工具。一、安装virtualenv#installpiponmacbrewinstallpythoncurlhttps://bootstrap.pypa.io/ez_setup.py-o-|sudopythonsudoeas

系统 2019-09-27 17:45:32 1849

Python

Python 备份程序代码实现

Python的一个备份程序这是一个备份脚本。路径请自行更换。这是一个备份脚本,按照当前日期分目录,以时间作为文件名,并且可以在文件名加入备注信息.以zip方式作为压缩方式,有特殊需求可以更改.实例代码:#!/usr/bin/python#coding=utf-8#这是一个备份脚本,按照当前日期分目录,以时间作为文件名,并且可以在文件名加入备注信息.#以zip方式作为压缩方式,有特殊需求可以更改.importosimporttimesource=['/hom

系统 2019-09-27 17:38:29 1849

Python

Python入门学习之字符串与比较运算符

Python字符串字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为:s="a1a2・・・an"(n>=0)它是编程语言中表示文本的数据类型。python的字串列表有2种取值顺序:从左到右索引默认0开始的,最大范围是字符串长度少1从右到左索引默认-1开始的,最大范围是字符串开头如果你的实要取得一段子串的话,可以用到变量[头下标:尾下标],就可以截取相应的字符串,其中下标是从0开始算起,可以是正数或负数,下标可以为空表示取到头或尾。比如

系统 2019-09-27 17:38:20 1849

Python

Python 使用PIL numpy 实现拼接图片的示例

python纵向合并任意多个图片,files是要拼接的文件list#-*-coding:utf-8-*-defmergeReport(files):fromPILimportImageimportnumpyasnpbaseimg=Image.open(files[0])sz=baseimg.sizebasemat=np.atleast_2d(baseimg)forfileinfiles[1:]:im=Image.open(file)#resizetosam

系统 2019-09-27 17:37:43 1849

Python

简单介绍Python的Django框架加载模版的方式

一般说来,你会把模板以文件的方式存储在文件系统中,但是你也可以使用自定义的templateloaders从其他来源加载模板。Django有两种方法加载模板django.template.loader.get_template(template_name):get_template根据给定的模板名称返回一个已编译的模板(一个Template对象)。如果模板不存在,就触发TemplateDoesNotExist的异常。django.template.loade

系统 2019-09-27 17:37:43 1849

编程技术

junit 4学习

JUNIT4中,有几个地方要注意一下的,归纳之1@Test(expected=ArithmeticException.class)publicvoidtestDivide(){assertEquals(3,Math.divide(9,3));Math.divide(10,0);//除数不能为0,会抛出异常}junit4中不用trycatach了,用这样声明“@Test(expected=ArithmeticException.class)”Junit4就会

系统 2019-08-29 23:34:25 1849

编程技术

Clover在JUnit中的使用

下面还是简要的介绍一下Clover在JUnit中的使用(构建工具为Ant):1.在使用Clover做测试覆盖率分析之前请确保您的代码及测试代码无误。2.如果采用Ant作为构建工具,则将clover.jar放入Ant的classpath下。也可采用另一种方法,可先将clover.jar及Clover中的另一个jar包cenquatasks.jar放入项目的lib下,采用cenquatasks.jar中的extendclasspath方法将clover.jar

系统 2019-08-29 23:33:06 1849

编程技术

4月10日下午,C语言技术专家作客51CTO技术聊天

简单即是美——品C语言的幽雅C语言技术专家作客51CTO技术聊天室近期机械工业出版社华章公司在C语言技术领域,为广大读者准备了两本C语言技术图书——《C语言教程(原书第4版)》及《C语言初级编程(原书第3版)》,4

系统 2019-08-29 23:10:33 1849

编程技术

来北京,是对的

==================================我的人生履历:2002-2004江苏迈技电子有限公司20岁2004-2008江苏鱼跃医疗设备股份有限公司22岁2008-2009江苏华帝集团(连锁超市)26岁2010-2011江苏丹阳团购网28岁2012年3月9日LAMP兄弟连-43期高薪就业班30岁==================================初次来到北京,是在2002年,我堂哥在北京设立了公司办事处,我跟公司业务

系统 2019-08-29 22:46:29 1849

编程技术

js 做货币验证

functionisMoney(obj){varregu="/^(\d{1,3},?)+(\.\d+)?$/";varre=newRegExp(regu);if(re.test(obj)){returntrue;}else{returntrue;}}js关闭浏览器(不弹出提示框)关键字:window.closejavascript关闭浏览器使用IE7,关闭浏览器时,会弹出一个提示框解决方法:Js代码functioncloseWindow(){window.

系统 2019-08-29 22:43:57 1849

编程技术

经济危机下的国际名牌

最近几天的CCTV2都在讲经济危机,从去年的美国次贷开始,危机已经开始从银行、投行影响到实体经济,进而影响到老百姓的生活。虽然因为春节的关系,最近消费挺旺,餐馆人满为患,路上添了不少新车,但2009年无论在职的,还是就业的,无论是投资的,还是做实业的,都会面对巨大的困难,这已经是不争的事实了。在网上看到恶搞的国际知名品牌的Logo,比如没有墨粉的施乐、一副哭脸的LG,一路向下的Yahoo、变成瘦马的法拉利、遇上雷电的花旗、SaySorry的SONY(索尼)

系统 2019-08-29 22:34:00 1849

编程技术

SIP交流PPT

昨天集团架构委员会(虚拟组织)作了第二次交流,各个子公司都说了当前的一些进度,问题和想法,我也大致讲了一下阿里软件的服务集成平台的一些进展和自己的一些思考,这里先贴一下PPT的图片,后面想整理以下关于当前OpenAPI的一些想法以及对OpenAPIFramework的一些思路。SIP交流PPT

系统 2019-08-29 22:25:42 1849