- 军军小站|张军博客
搜索到与相关的文章
Python

python3简单实现微信爬虫

使用ghost.py通过搜搜的微信搜索来爬取微信公共账号的信息#-*-coding:utf-8-*-importsysreload(sys)importdatetimeimporttimesys.setdefaultencoding("utf-8")fromghostimportGhostghost=Ghost(wait_timeout=20)url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5

系统 2019-09-27 17:47:10 1905

Python

Python中多线程thread与threading的实现方法

学过Python的人应该都知道,Python是支持多线程的,并且是native的线程。本文主要是通过thread和threading这两个模块来实现多线程的。python的thread模块是比较底层的模块,python的threading模块是对thread做了一些包装的,可以更加方便的被使用。这里需要提一下的是python对线程的支持还不够完善,不能利用多CPU,但是下个版本的python中已经考虑改进这点,让我们拭目以待吧。threading模块里面主

系统 2019-09-27 17:46:35 1905

Python

使用Python爬了4400条淘宝商品数据,竟发现了这些“潜规则”

本文记录了笔者用Python爬取淘宝某商品的全过程,并对商品数据进行了挖掘与分析,最终得出结论。项目内容本案例选择>>商品类目:沙发;数量:共100页4400个商品;筛选条件:天猫、销量从高到低、价格500元以上。项目目的1.对商品标题进行文本分析词云可视化2.不同关键词word对应的sales的统计分析3.商品的价格分布情况分析4.商品的销量分布情况分析5.不同价格区间的商品的平均销量分布6.商品价格对销量的影响分析7.商品价格对销售额的影响分析8.不同

系统 2019-09-27 17:46:23 1905

Python

OpenCV3.0+Python3.6实现特定颜色的物体追踪

一、环境win10、Python3.6、OpenCV3.x;编译器:pycharm5.0.3二、实现目标根据需要追踪的物体颜色,设定阈值,在视频中框选出需要追踪的物体。三、实现步骤1)根据需要追踪的物体颜色,设定颜色阈值,获取追踪物体的掩膜代码:generate_threshold.py#-*-coding:utf-8-*-#Author:TomYuimportcv2importnumpyasnpcap=cv2.VideoCapture(0)#获取摄像头图

系统 2019-09-27 17:46:23 1905

Python

php应用不及python广泛的一个重要原因

python比php更流行,原因何在?php诞生之日起,就专注于风网页应用,在其它的领域没有什么知名度。python一开始就是想简化C,定位为一种通用的全面性的开发语言。但是更重要的一点是,python建立起了方便的扩展机制,可以方便用python或c编写库,发布库,用pip安装库。而php在可扩展性上就要差得许多,很长时间都没有库的发布与安装机制,所以只能定位在网页脚本上,在应用的广泛性上远不如python。一门语言不可能在一开始就尽善尽美,如果提供一种

系统 2019-09-27 17:46:18 1905

Python

python 爬取微信文章

本人想搞个采集微信文章的网站,无奈实在从微信本生无法找到入口链接,网上翻看了大量的资料,发现大家的做法总体来说大同小异,都是以搜狗为入口。下文是笔者整理的一份python爬取微信文章的代码,有兴趣的欢迎阅读#coding:utf-8author='haoning'**#!/usr/bin/envpythonimporttimeimportdatetimeimportrequests**importjsonimportsysreload(sys)sys.se

系统 2019-09-27 17:38:27 1905

Python

python3编码问题汇总

这两天写了个监测网页的爬虫,作用是跟踪一个网页的变化,但运行了一晚出现了一个问题。。。。希望大家不吝赐教!我用的是python3,错误在对htmlresponse的decode时抛出,代码原样为:response=urllib.urlopen(dsturl)content=response.read().decode('utf-8')抛出错误为File"./unxingCrawler_p3.py",line50,ingetNewPhonescontent=

系统 2019-09-27 17:38:24 1905

Python

在Python的Django框架中获取单个对象数据的简单方法

相对列表来说,有些时候我们更需要获取单个的对象,``get()``方法就是在此时使用的:>>>Publisher.objects.get(name="Apress")这样,就返回了单个对象,而不是列表(更准确的说,QuerySet)。所以,如果结果是多个对象,会导致抛出异常:>>>Publisher.objects.get(country="U.S.A.")Traceback(mostrecentcalllast):...MultipleObjectsRe

系统 2019-09-27 17:37:47 1905

编程技术

得到数据库中所有的表以及表字段

邹建写的selectcasewhenc.colid=1theno.nameelse''end表名,--得到表名,重复的表名不显示c.colid顺序,c.name字段名,t.name字段类型,columnproperty(c.id,c.name,'PRECISION')字段长度,isnull(c.Scale,'')小数位,c.length占用字节,casewhenc.isnullable=1then'√'else''end可为空,casewhenc.coli

系统 2019-08-29 23:41:41 1905

编程技术

Eclipse代码片断编辑测试窗

OS:WindowsXP+SP1JDK:1.4.21。代码片断编辑测试窗介绍:JDT(Eclipse中Java开发工具)添加了代码片断编辑测试窗,可以用来在构建完整Java程序之前对Java代码片段进行试验和求值。从Java代码片断编辑测试窗编辑器中,可以选择代码片段、对其进行求值并以字符串形式显示结果,还可以在调试器的表达式视图中显示对代码片段求值所产生的对象。并允许在调试器的控制下运行、检查和显示Java表达式,断点和异常的行为将象在常规调试中一样。在

系统 2019-08-29 23:34:15 1905