上面的博客把基本的HTML解析库已经说完了,这次我们来给予几个实战的项目。这次主要用Requests库+正则表达式来解析HTML。项目一:爬取猫眼电影TOP100信息代码地址:https://gitee.com/dwyui/maoyan-Requests.git项目二:美食爬取(包含多层爬取)代码地址:https://gitee.com/dwyui/meishi_Requests.git
系统 2019-09-27 17:47:06 1879
一、python判断文件和文件夹是否存在、创建文件夹复制代码代码如下:>>>importos>>>os.path.exists('d:/assist')True>>>os.path.exists('d:/assist/getTeacherList.py')True>>>os.path.isfile('d:/assist')False>>>os.path.isfile('d:/assist/getTeacherList.py')True>>>os.maked
系统 2019-09-27 17:47:00 1879
本章将覆盖所有在Python中使用的基本I/O功能。有关更多函数,请参考标准Python文档。打印到屏幕上:产生输出最简单的方法是使用print语句,可以通过用逗号分隔的零个或多个表达式。该函数将传递到一个字符串表达式,并将结果写到标准输出,如下所示:#!/usr/bin/pythonprint"Pythonisreallyagreatlanguage,","isn'tit?";这将产生结果输出在标准屏幕上,结果如下:Pythonisreallyagrea
系统 2019-09-27 17:46:33 1879
开发堡垒机之前,先来学习Python的paramiko模块,该模块基于SSH用于连接远程服务器并执行相关操作安装paramiko模块pip3installparamiko基于用户密码方式importparamiko#创建SSH对象ssh=paramiko.SSHClient()#允许连接不在know_hosts文件中的主机ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())#连接服务器ssh.c
系统 2019-09-27 17:45:58 1879
开个贴,用于记录平时经常碰到的Python的错误同时对导致错误的原因进行分析,并持续更新,方便以后查询,学习。知识在于积累嘛!微笑+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++错误:复制代码代码如下:>>>deff(x,y):printx,y>>>t=('a','b')>>>f(t)Traceback(mostrecentcalllast):File"",line1,inf(t)Typ
系统 2019-09-27 17:45:53 1879
问题背景:同一个python脚本项目同时处理elasticseach6.2.1.和elasticseach5.1.1中存储的数据解决因为包冲突带来的问题解决思路:开一个python虚拟环境python安装虚拟环境:https://www.jianshu.com/p/4c898236cf35.3、创建虚拟环境mkvirtualenves5附:切换虚拟环境:workones5退出虚拟环境:deactivate4、查看当前虚拟环境安装的插件piplist5、py
系统 2019-09-27 17:45:40 1879
1.安装ubuntu有uwsgi的ppa:add-apt-repositoryppa:stevecrozz/ppaapt-getupdateapt-getinstalluwsgi2.用uwsgi代替mod_wsgiNginx的整体配置这里不说了,假设已经明白Nginx的基本配置,那么uwsgi就类似这么配置:location/{includeuwsgi_paramsuwsgi_pass127.0.0.1:9090}再比如django就是:.......fr
系统 2019-09-27 17:38:46 1879
1、安装virtulenv、virtulenvwrapper包pipinstallvirtualenvvirtualenvwrapper2、virtualenvwrapper是virtualenv的扩展工具,可以方便的创建、删除、复制、切换不同的虚拟环境。3、设置环境变量,把下面两行添加到~/.bash_profile里exportWORKON_HOME=/software/venvsource/usr/local/bin/virtualenvwrappe
系统 2019-09-27 17:38:34 1879
1.如果模块是被导入,__name__的值为模块名字2.如果模块是被直接执行,__name__的值为'__main__'Py1.py复制代码代码如下:#!/usr/bin/envpythondeftest():print'__name__=',__name__if__name__=='__main__':test()Py2.py复制代码代码如下:#!/usr/bin/envpythonimportPy1.pydeftest():print'__name__
系统 2019-09-27 17:38:30 1879
Python是用于编码图形界面的极佳语言。由于可以迅速地编写工作代码并且不需要费时的编译周期,所以可以立即使界面启动和运行起来,并且不久便可使用这些界面。将这一点与Python易于链接本机库的能力结合起来,就可以形成一个出色的环境。gnome-python是为Python封装GNOME及其相关库的软件包。这使您能够用Python编写外观与核心GNOME应用程序完全相同的应用程序,而所花的时间只是用C编写该应用程序所花的一部分。然而,不用C进行编程会有一个缺
系统 2019-09-27 17:38:29 1879