- 军军小站|张军博客
搜索到与相关的文章
Python

python爬虫常用模块

对于一些简单的爬虫,python(基于python3)有更好的第三方库来实现它,且容易上手。Python标准库–logging模块logging模块能够代替print函数的功能,将标准输出到日志文件保存起来,利用loggin模块可以部分替代debugre模块正则表达式sys模块系统相关模块sys.argv(返回一个列表,包含所有的命令行)sys.exit(退出程序)Python标准库–urllib模块urllib.requset.urlioen可以打开HT

系统 2019-09-27 17:56:28 1914

Python

python assert的作用

一、pythonassert的作用:根据Python官方文档解释(https://docs.python.org/3/reference/simple_stmts.html#assert),"Assertstatementsareaconvenientwaytoinsertdebuggingassertionsintoaprogram".二、一般的用法是:assertcondition用来让程序测试这个condition,如果condition为false

系统 2019-09-27 17:56:07 1914

Python

CentOS7安装python3

一:背景CentOS7里内置了一些应用,比如python2。现在需要在系统中安装python3。二:实验环境CentOS7系统中一个普通用户(root也无所谓,如果你愿意的话三:实验步骤准备工作(1)更新yum源。yum是基于RedHat的Linux系统中常用的包管理工具,可以使用yum安装、更新、移除软件安装包。使用sudoyum-yupdate,-y的主要作用就是省略确认步骤,详情见manyum。(2)安装yum-utils。yum-utils是拓展y

系统 2019-09-27 17:56:06 1914

Python

鲜为人知的 Python 语法

编译:Python开发者-伯乐在线读者,英文:mediumhttp://python.jobbole.com/89252/所有人(好吧,不是所有人)都知道python是一门用途广泛、易读、而且容易入门的编程语言。但同时python语法也允许我们做一些很奇怪的事情。使用lambda表达式重写多行函数众所周知python的lambda表达式不支持多行代码。但是可以模拟出多行代码的效果。deff():x='string'ifx.endswith('g'):x=x

系统 2019-09-27 17:54:03 1914

Python

快讯!“Python背后有推手?”程序员:真相扎心!

人红是非多,最近Python就遇到了这样的问题。与国际技术社区上一片「形势大好」对比鲜明的是,国内技术圈却一直存在对Python,「力挺」和「吃瓜」两派阵营,针锋相对,那么,Python到底有没有用,真相究竟如何?是谁推波助澜了Python?Python究竟能做什么?程序员:该重新定义都说Python易学,究竟好学在哪里呢?因为其拥有大量第三方库,所以开发人员不必重复造轮子,就像搭积木一样,只要擅于利用这些库就可以完成绝大部分工作。它可以做网络爬虫。不夸张

系统 2019-09-27 17:53:43 1914

Python

Python内存管理机制 之 垃圾回收

参考链接:https://www.cnblogs.com/alexzhang92/p/9416692.htmlhttps://www.cnblogs.com/neillee/p/6259590.html目录一、基本知识二、GC垃圾回收1、引用计数引用计数的增减引用计数法有很明显的优点:引用计数机制的缺点:2、画说Ruby与Python垃圾回收2.1应用程序那颗跃动的心一个简单的例子免费清单在Python中分配对象Ruby开发人员住在凌乱的房子里Python

系统 2019-09-27 17:53:41 1914

Python

python爬虫第6关csv&excel

前面讲到json是特殊的字符串。其实,csv也是一种字符串文件的格式,它组织数据的语法就是在字符串之间加分隔符——行与行之间是加换行符,同列之间是加逗号分隔。它可以用任意的文本编辑器打开(如记事本),也可以用Excel打开,还可以通过Excel把文件另存为csv格式(因为Excel支持csv格式文件)。将我们刚刚写入的csv文件下载到本地电脑,再用记事本打开,你会看到:用Excel打开,则是这样的:发现了吗?csv文件里的逗号可以充当分隔同列字符串的作用。

系统 2019-09-27 17:53:37 1914

Python

Python 分享10个PyCharm技巧

#0.PyCharm常用快捷键#1.查看使用库源码PyCharm主程序员在Stackoverflow上答道经常听人说,多看源码。源码不仅能帮我们搞清楚运行机制,还能学习优秀的库或者框架的最佳实践。调用库时,你可以在你好奇的几乎任何地方点击Command+B,就可以很方便的跳转到源码里的类,方法,函数,变量的定义。#2.让你的代码PEP8写Python代码时,你会严格遵守pep8规范么?还是要遵守的,不然代码传到github或者知乎上被人怼就不好了。但是如果

系统 2019-09-27 17:53:10 1914

Python

python爬虫豆瓣网的模拟登录实现

思路一、想要实现登录豆瓣关键点分析真实post地址----寻找它的formdata,如下图,按浏览器的F12可以找到。实战操作实现:模拟登录豆瓣,验证码处理,登录到个人主页就算是success数据:没有抓取数据,此实战主要是模拟登录和处理验证码的学习。要是有需求要抓取数据,编写相关的抓取规则即可抓取内容。登录成功展示如图:spiders文件夹中DouBan.py主要代码如下:#-*-coding:utf-8-*-importscrapy,urllib,re

系统 2019-09-27 17:52:01 1914

Python

Python实现数据可视化看如何监控你的爬虫状态【推荐】

今天主要是来说一下怎么可视化来监控你的爬虫的状态。相信大家在跑爬虫的过程中,也会好奇自己养的爬虫一分钟可以爬多少页面,多大的数据量,当然查询的方式多种多样。今天我来讲一种可视化的方法。关于爬虫数据在mongodb里的版本我写了一个可以热更新配置的版本,即添加了新的爬虫配置以后,不用重启程序,即可获取刚刚添加的爬虫的状态数据。1.成品图这个是监控服务器网速的最后成果,显示的是下载与上传的网速,单位为M。爬虫的原理都是一样的,只不过将数据存到InfluxDB的

系统 2019-09-27 17:50:52 1914