Python - 军军小站|张军博客
Python

【Python3网络爬虫开发实战】4.3-使用pyquery

【摘要】如果你对Web有所涉及,如果你比较喜欢用CSS选择器,如果你对jQuery有所了解,那么这里有一个更适合你的解析库——pyquery。接下来,我们就来感受一下pyquery的强大之处。在上一节中,我们介绍了BeautifulSoup的用法,它是一个非常强大的网页解析库,你是否觉得它的一些方法用起来有点不适应?有没有觉得它的CSS选择器的功能没有那么强大?如果你对Web有所涉及,如果你比较喜欢用CSS选择器,如果你对jQuery有所了解,那么这里有一

系统 2019-09-27 17:57:26 2172

Python

详解Python3序列赋值、序列解包

上节我们提到解决赋值中等号两边参数不一致的方法可以通过切片,但在Python3中我们可以利用特定的语法更加方便的处理这种情况,如下示例。当带*出现在结尾间时L=[1,2,3,4,5]a,*b=Lprint(a,b)示例结果:1[2,3,4,5]我们可以看到a匹配了列表中第一个元素值,而b匹配了后面所有的内容,并且为列表。即当我们利用带*符号匹配时,就可以解决赋值时等号两边元素数量不相等的情形,那么这种带*的处理方式都有哪些详细的使用场景和用法呢?当带*出现

系统 2019-09-27 17:56:23 2172

Python

使用python在本地电脑上快速处理数据

大数据一般是在“云”上玩的,但“云”都是要钱的,而且数据上上下下的也比较麻烦。所以,在本地电脑上快速处理数据的技能还是要的。pandas在比赛中学到的一个工具,本地可以在亿级别的数据上进行聚合等操作。内部的数据包括:•Series:一维数组,每个元素有一个标签•DataFrame:二维表格,可以看做Series的集合•Panel:三维数据数据的初始化我们可以通过构造函数来初始化,从下面的代码中可以想象得到数据是样子:frompandasimportSeri

系统 2019-09-27 17:55:02 2172

Python

学生时代的经历,利用Python在机房杀红蜘蛛,脱离老师控制!

这个为什么说是一次学生时代的经历呢,我的出发点并没有是为了吊胃口。确实,这个Python小应用,只能在学生时代用得着吧,尤其是高中和大学,如果你没有想到也没关系,看完我下面说的就会明白了。对红蜘蛛软件感到陌生?由于电脑教学机房都是没有投影仪的,所以才有了这款红蜘蛛控制软件,在局域网络上控制学生电脑,实现屏幕监视和远程控制的功能。简单来说,就是老师为了防止学生不好好上课,利用机房电脑去做其它事情的一种流氓类型软件。为何称之为牛皮糖软件?因为你的电脑都被老师控

系统 2019-09-27 17:54:31 2172

Python

Python:线程为什么搞个setDaemon

前言使用Python都不会错过线程这个知识,但是每次谈到线程,大家都下意识说GIL全局锁,但其实除了这个老生常谈的话题,还有很多有价值的东西可以探索的,譬如:setDaemon()。线程的使用与存在的问题我们会写这样的代码来启动多线程:importtimeimportthreadingdeftest():whileTrue:printthreading.currentThread()time.sleep(1)if__name__=='__main__':t

系统 2019-09-27 17:54:09 2172

Python

Python中实现从目录中过滤出指定文件类型的文件

最近学习下python,将从指定目录中过滤出指定文件类型的文件输出的方法总结一下,供日后查阅复制代码代码如下:#!/usr/bin/envpythonimportglobimportosos.chdir(“./”)forfileinglob.glob(“*.py”):printfileprint“#######AnotherOne##########”forfileinos.listdir(“./”):iffile.endswith(“.py”):prin

系统 2019-09-27 17:52:35 2172

Python

浅谈Python中的作用域规则和闭包

在对Python中的闭包进行简单分析之前,我们先了解一下Python中的作用域规则。关于Python中作用域的详细知识,有很多的博文都进行了介绍。这里我们先从一个简单的例子入手。Python中的作用域假设在交互式命令行中定义如下的函数:>>>a=1>>>deffoo():b=2c=3print"locals:%s"%locals()return"result:%d"%(a+b+c)>>>a=1>>>deffoo():b=2c=3print"locals:%

系统 2019-09-27 17:51:51 2172

Python

在Python中使用SimpleParse模块进行解析的教程

与大多数程序员一样,我经常需要标识存在于文本文档中的部件和结构,这些文档包括:日志文件、配置文件、分隔的数据以及格式更自由的(但还是半结构化的)报表格式。所有这些文档都拥有它们自己的“小语言”,用于规定什么能够出现在文档内。我编写处理这些非正式解析任务的程序的方法总是有点象大杂烩,其中包括定制状态机、正则表达式以及上下文驱动的字符串测试。这些程序中的模式大概总是这样:“读一些文本,弄清是否可以用它来做些什么,然后可能再多读一些文本,一直尝试下去。”各种形式

系统 2019-09-27 17:50:18 2172

Python

Python使用sklearn库实现的各种分类算法简单应用小结

本文实例讲述了Python使用sklearn库实现的各种分类算法简单应用。分享给大家供大家参考,具体如下:KNNfromsklearn.neighborsimportKNeighborsClassifierimportnumpyasnpdefKNN(X,y,XX):#X,y分别为训练数据集的数据和标签,XX为测试数据model=KNeighborsClassifier(n_neighbors=10)#默认为5model.fit(X,y)predicted=

系统 2019-09-27 17:48:52 2172

Python

用python实现刷网页访问量

仅供python学习,不用作商业用途一点私心,为什么我想刷自己的博客呢?因为我觉得我写的博客还是蛮不错的,可以帮很多人少走一些弯路,而低的阅读量在搜索排名中是很不占优的,所以希望我的博客能让更多人受益,刷一点访问量啦,还请原谅。看到网上那么多资料,感觉都太复杂,还要去买什么ip,我的意图很简单,学习python和urllib库的使用,用最简单的代码实现这一功能,刷访问量本来就不太好,我发现很多访问量点进去一下就能加1,所以我这相当于是徒手在点击网页增加访问

系统 2019-09-27 17:47:37 2172

Python

在Python中操作列表之list.extend()方法的使用

extend()方法追加序列内容到列表。语法以下是extend()方法的语法:list.extend(seq)参数seq--这是列表的元素返回值此方法不返回任何值,但添加内容到现有列表中例子下面的例子显示了extend()方法的使用#!/usr/bin/pythonaList=[123,'xyz','zara','abc',123];bList=[2009,'manni'];aList.extend(bList)print"ExtendedList:",a

系统 2019-09-27 17:47:02 2172

Python

Python yield 使用浅析

初学Python的开发者经常会发现很多Python函数中用到了yield关键字,然而,带有yield的函数执行流程却和普通函数不一样,yield到底用来做什么,为什么要设计yield?本文将由浅入深地讲解yield的概念和用法,帮助读者体会Python里yield简单而强大的功能。您可能听说过,带有yield的函数在Python中被称之为generator(生成器),何谓generator?我们先抛开generator,以一个常见的编程题目来展示yield

系统 2019-09-27 17:46:53 2172

Python

对python3 sort sorted 函数的应用详解

python3sorted取消了对cmp的支持。python3帮助文档:sorted(iterable,key=None,reverse=False)key接受一个函数,这个函数只接受一个元素,默认为Nonereverse是一个布尔值。如果设置为True,列表元素将被倒序排列,默认为False着重介绍key的作用原理:key指定一个接收一个参数的函数,这个函数用于从每个元素中提取一个用于比较的关键字。默认值为None。例1:students=[('john

系统 2019-09-27 17:54:32 2171

Python

《Python3爬虫、数据清洗和可视化实战》之阅读不懂处、主要代码总结(11章)

《Python3爬虫、数据清洗和可视化实战》零一韩要宾黄园园著第11章数据可视化11.1matplotlib调用matplotlib有下面四个步骤:(1)设定画图背景样式mpl.style.use(“ggplot”)(2)设定画布#命名画布为fig,并把fig分为两个小画布(ax1,ax2),设置fig的大小为12*4点fig,(ax1,ax2)=plt.subplots(1,2,figsize=(12,4))(3)画图及设定元素df_mean.价格.pl

系统 2019-09-27 17:54:24 2171

Python

Python面向对象编程——组合与重用性

Python面向对象编程——组合与重用性组合与重用性软件重用的重要方式除了继承之外还有另外一种方式,即组合。组合指的是,在一个类中以另外一个类的对象作为数据属性,称为类的组合。>>>classEquip:#武器装备类...deffire(self):...print('releaseFireskill')...>>>classRiven:#英雄Riven的类,一个英雄需要有装备,因而需要组合Equip类...camp='Noxus'...def__init

系统 2019-09-27 17:53:46 2171