Python

python爬虫开发第一步——熟悉网络编程,python线程与进程

最近博主手上有一个爬虫项目,开始深入研究python爬虫开发,这是我篇博客也相当于是我的学习笔记,我认为学习爬虫第一步,先学习python多线程与多进程,熟悉网络编程,接下来会陆续以博客的方式跟大家做分享。多进程Python实现多进程的方式主要有两种,一种方法是使用os模块中的fork方法,另一种方法是使用multiprocessing模块。这两种方法的区别在于前者仅适用于Unix/Linux操作系统,对Windows不支持,后者则是跨平台的实现方式,目前

系统 2019-09-27 17:53:30 1896

Python

python爬取分析30万条微博评论,看毕业生与翟天临的爱恨情仇|凹凸数读

使用python爬取微博评论:本文首发于《凹凸数读》,关注后台回复“源码”获取相关python代码2019年5月27日凌晨,翟天临又上了热搜。我们爬取了翟天临2月道歉微博下的30万余条评论,看看毕业生们是如何吐槽他的?本文首发于《凹凸数读》,关注后台回复“源码”获取相关python代码

系统 2019-09-27 17:53:21 1896

Python

Python函数系列之嵌套及闭包(二)

函数的嵌套在Python编程语言中,在函数体内创建另外一个函数(对象,因为Python一切皆对象,函数其实也是对象)是完全合法的,这种函数叫做内部/嵌套函数。例子:#coding:utf-8defouter():definner():print("isInnerMethod")print("IsouterMethod")inner()#调用outer函数outer()#调用outer()的内部函数,报错#inner()运行结果:IsouterMethodi

系统 2019-09-27 17:52:56 1896

Python

025 Python基础小结

目录一、执行Python程序的两种方式1.1交互式1.2命令行式二、变量2.1什么是变量2.2如何定义变量2.3变量的组成2.4变量名的规范2.5变量名的两种命名风格三、常量四、Python变量内存管理4.1引用计数4.2垃圾回收机制4.3小整数池五、花式赋值5.1链式赋值5.2交叉赋值六、注释6.1单行注释6.2多行注释七、数据类型基础7.1为什么要有数据类型八、解压缩九、Python与用户交互十、Python格式化输出的三种方式10.1占位符%10.2

系统 2019-09-27 17:51:57 1896

Python

python实现代码统计器

本文实例为大家分享了python中的代码行数统计,供大家参考,具体内容如下思路:统计文件中代码的总行数减去空行单行注释以及多行注释功能:1.获取文件内容的总行数2.排除空行单行注释多行注释defcode_statistics(path):##打开这个文件withopen(path,'r',encoding='utf-8')asopenFile:#按列读取fileline=openFile.readlines()#给非代码行一个变量i=0#整个文件里面内容的

系统 2019-09-27 17:51:02 1896

Python

Python何时应该使用Lambda函数

Python中定义函数有两种方法,一种是用常规方式def定义,函数要指定名字,第二种是用lambda定义,不需要指定名字,称为Lambda函数。Lambda函数又称匿名函数,匿名函数就是没有名字的函数,函数没有名字也行?当然可以啦。有些函数如果只是临时一用,而且它的业务逻辑也很简单时,就没必要非给它取个名字不可。好比电影里面的群众演员,往往他们的戏份很少,最多是衬托主演,跑跑龙套,他们需要名字吗?不需要,因为他们仅仅只是临时出镜,下次可能就用不着了,所以犯

系统 2019-09-27 17:50:41 1896

Python

module in Python i...

转:https://www.jianshu.com/p/4be85de84d2a本机环境:Windows1064位Anacondapython3.7报错信息:pipisconfiguredwithlocationsthatrequireTLS/SSL,howeverthesslmoduleinPythonisnotavailable.解决方法:原因:Anaconda环境变量未配置完全需要配置的环境变量:D:\ProgramData\Anaconda3D:\

系统 2019-09-27 17:50:37 1896

Python

使用Python自动生成HTML的方法示例

python自动化批量生成前端的HTML可以大大减轻工作量下面演示两种生成HTML的方法方法一:使用webbrowser#coding:utf-8importwebbrowser#命名生成的htmlGEN_HTML="test.html"#打开文件,准备写入f=open(GEN_HTML,'w')#准备相关变量str1='mynameis:'str2='--MichaelAn--'#写入HTML界面中message="""%s%s"""%(str1,str

系统 2019-09-27 17:49:58 1896

Python

python 处理键盘输入 方法汇总

注意:python3.x已经不支持raw_input了,已经更替成了input。raw_input()str=raw_input("Enteryourinput:")input(),不能读到\n,读入一行,可以用连续的input来实现读入多行。input()函数和raw_input()函数基本能够互换。可是input会如果你的输入是一个有效的Python表达式,并返回运算结果。str=input("Enteryourinput:")n,k,m=map(in

系统 2019-09-27 17:49:31 1896

Python

python数据可视化之 Matplotlib

可视化是在整个数据挖掘的关键辅助工具,可以清晰的理解数据,从而调整我们的分析方法。1.Matplotlib基本概念Matplotlib是python的一个数据可视化工具库,专门用于开发2D图表(包括3D图表),操作简单。2.Matplotlib三层结构容器层容器层由Canvas、Figure、Axes三部分组成。Canvas位于最底层的系统层,充当画板,即放置Figure的工具。Figure是Canvas上方的第一层,也是需要用户来操作的应用层的第一层,在

系统 2019-09-27 17:49:11 1896

Python

Python thread demo

frommultiprocessingimportProcess,Queuefromtimeimporttimedeftask_handler(current_list,result_queue):total=0fornincurrent_list:total+=nresult_queue.put(total)defmain():processes=[]number_list=[xforxinrange(1,10000001)]result_queue=Q

系统 2019-09-27 17:48:29 1896

Python

关于python,这些知识点你学会了吗?

阅读更多变量1.变量•指在程序执行过程中,可变的量;•定义一个变量,就会伴随有3个特征,分别是内存ID、数据类型和变量值。•其他语言运行完之前,一定要手动把程序的内存空间释放掉。但python解释器是自带内存回收机制的,一旦python程序运行完后,会自动释放内存空间。age=10print(id(age),type(age),age)常量2.常量•指在程序执行过程中,不可变的量;•一般都用大写字母定义常量。AGE=10print(AGE)3.变量的命名方

系统 2019-09-27 17:48:22 1896

Python

Python3 使用pillow库生成随机验证码

Python3使用pillow库生成随机验证码的代码如下所示:importrandom#pillow包的使用fromPILimportImage,ImageDraw,ImageFont,ImageFilter#Image负责处理图片#ImageDraw负责处理画笔#ImageFont负责处理文字#ImageFilter负责处理路径img=Image.new('RGB',(150,50),(255,255,255))#建立一个图片'''RGB:表示采用RGB

系统 2019-09-27 17:47:55 1896

Python

Python采用raw_input读取输入值的方法

本文较为详细的介绍了python中raw_input的用法,使用raw_input能够很方便的丛控制台读入数据。具体用法示例如下:1.输入字符串#13222319810101****nID=''while1:nID=raw_input("Inputyouridplz")iflen(nID)!=len("13222319810101****"):print'wringlengthofid,inputagain'else:breakprint'youridis

系统 2019-09-27 17:47:47 1896

Python

Python实现保证只能运行一个脚本实例

保证只能运行一个脚本实例,方法是程序运行时监听一个特定端口,如果失败则说明已经有实例在跑。使用装饰器实现,便于重用复制代码代码如下:importfunctoolsdefjust_one_instance(func):'''装饰器如果已经有实例在跑则退出复制代码代码如下::return:'''@functools.wraps(func)deff(*args,**kwargs):importsockettry:#全局属性,否则变量会在方法退出后被销毁globa

系统 2019-09-27 17:45:27 1896