- 军军小站|张军博客
搜索到与相关的文章
Python

Python爬虫:现学现用xpath爬取豆瓣音乐

爬虫的抓取方式有好几种,正则表达式,Lxml(xpath)与BeautifulSoup,我在网上查了一下资料,了解到三者之间的使用难度与性能三种爬虫方式的对比。抓取方式性能使用难度正则表达式快困难Lxml快简单BeautifulSoup慢简单这样一比较我我选择了Lxml(xpath)的方式了,虽然有三种方式,但肯定是要选择最好的方式来爬虫,这个道理大家都懂,另外有兴趣的朋友也可以去了解另外两种爬虫方式!好了现在来讲讲xpath由于Xpath属于lxml模块
Python

python实现的jpg格式图片修复代码

最近为客户修复损坏的jpg写的,效果还可以,但不保证适用任何情况。如果你有损坏照片,不妨试一试,如果可以使用给我留个言哦。复制代码代码如下:#-*-coding:utf8-*-#!/usr/bin/envpython__author__='fengxing'__date__='2012-1-1820:13'importsysdefjpgfix(name):sig='\xFF\xD8\xFF\xDB'withopen(name,"r")asfd:fd.see
Python

python元组,字典,集合

元组类型元组可以存储任意数据类型,与列表不同的是就是不能改变,列表拥有的方法元组大部分都拥有元组是什么:元组可以装任意数据类型,是一个特殊的列表,也是有序的数据类型元组用()来装数据类型,也是用,来分割元组创建:元组访问:和列表一样,都是通过下标来访问的,通过切片来截取一段数据也可以使用for循环来遍历元组列表与字符串都可以用for循环遍历元组的操作:列表字符串都有的操作len():计算元组的个数+来连接会建立新的元组*就是复制几个一样的值放在元组里会建立
Python

Python实现计算最小编辑距离

最小编辑距离或莱文斯坦距离(Levenshtein),指由字符串A转化为字符串B的最小编辑次数。允许的编辑操作有:删除,插入,替换。具体内容可参见:维基百科―莱文斯坦距离。一般代码实现的方式都是通过动态规划算法,找出从A转化为B的每一步的最小步骤。从Google图片借来的图,Python代码实现,(其中要注意矩阵的下标从1开始,而字符串的下标从0开始):defnormal_leven(str1,str2):len_str1=len(str1)+1len_s
编程技术

meta标签

meta是html语言head区的一个辅助性标签。下面这段的html代码:也许你认为这些代码可有可无。其实如果你能够用好meta标签,会给你带来意想不到的效果,例如加入关键字会自动被大型搜索网站自动搜集;可以设定页面格式及刷新等等。meta标签的组成meta标签共有两个属性,它们分别是http-equi
编程技术

C3P0连接池详细配置与实现

C3P0连接池详细配置与实现330