搜索到与相关的文章
Python

python3简单实现微信爬虫

使用ghost.py通过搜搜的微信搜索来爬取微信公共账号的信息#-*-coding:utf-8-*-importsysreload(sys)importdatetimeimporttimesys.setdefaultencoding("utf-8")fromghostimportGhostghost=Ghost(wait_timeout=20)url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5

系统 2019-09-27 17:47:10 2067

Python

在Python程序中操作文件之isatty()方法的使用教程

如果文件已连接(与终端设备相关联)到一个tty(状)的设备,isatty()方法返回True,否则返回False。语法以下是isatty()方法的语法:fileObject.isatty();参数NA返回值如果该文件被连接(与终端设备相关联)到一个tty(类似终端)设备此方法返回true,否则返回false。例子下面的例子显示了isatty()方法的使用。#!/usr/bin/python#Openafilefo=open("foo.txt","wb")p

系统 2019-09-27 17:46:53 2067

Python

Python中多线程thread与threading的实现方法

学过Python的人应该都知道,Python是支持多线程的,并且是native的线程。本文主要是通过thread和threading这两个模块来实现多线程的。python的thread模块是比较底层的模块,python的threading模块是对thread做了一些包装的,可以更加方便的被使用。这里需要提一下的是python对线程的支持还不够完善,不能利用多CPU,但是下个版本的python中已经考虑改进这点,让我们拭目以待吧。threading模块里面主

系统 2019-09-27 17:46:35 2067

Python

Python利用requests模块下载图片实例代码

本文主要介绍的是关于Python利用requests模块下载图片的相关,下面话不多说了,来一起看看详细的介绍吧MySQL中事先保存好爬取到的图片链接地址。然后使用多线程把图片下载到本地。示例代码:#coding:utf-8importMySQLdbimportrequestsimportosimportrefromthreadingimportThreadimportdatetimeheader={'User-Agent':'Mozilla/5.0(Win

系统 2019-09-27 17:46:10 2067

Python

Python中的默认参数详解

文章的主题不要使用可变对象作为函数的默认参数例如list,dict,因为def是一个可执行语句,只有def执行的时候才会计算默认默认参数的值,所以使用默认参数会造成函数执行的时候一直在使用同一个对象,引起bug。基本原理在Python源码中,我们使用def来定义函数或者方法。在其他语言中,类似的东西往往只是一一个语法声明关键字,但def却是一个可执行的指令。Python代码执行的时候先会使用compile将其编译成PyCodeObject.PyCodeOb

系统 2019-09-27 17:45:28 2067

Python

浅谈Python中函数的参数传递

1.普通的参数传递>>>defadd(a,b):returna+b>>>printadd(1,2)3>>>printadd('abc','123')abc1232.参数个数可选,参数有默认值的传递>>>defmyjoin(string,sep='_'):returnsep.join(string)>>>myjoin('Test')'T_e_s_t'>>>myjoin('Test',';')'T;e;s;t'?>>>defmyrange(start=0,st

系统 2019-09-27 17:38:15 2067

Python

浅谈python中set使用

浅谈python中set使用In[2]:a=set()#常用操作1In[3]:aOut[3]:set()In[4]:type(a)Out[4]:setIn[5]:b=set([1,3])In[6]:bOut[6]:{1,3}In[7]:type(b)Out[7]:setIn[8]:b.update(2)---------------------------------------------------------------------------Typ

系统 2019-09-27 17:38:07 2067

Python

在Python的Django框架中包装视图函数

我们最终的视图技巧利用了一个高级python技术。假设你发现自己在各个不同视图里重复了大量代码,就像这个例子:defmy_view1(request):ifnotrequest.user.is_authenticated():returnHttpResponseRedirect('/accounts/login/')#...returnrender_to_response('template1.html')defmy_view2(request):ifno

系统 2019-09-27 17:37:44 2067

Python

Python 性能优化技巧总结

1.使用测量工具,量化性能才能改进性能,常用的timeit和memory_profiler,此外还有profile、cProfile、hotshot等,memory_profiler用了psutil,所以不能跟踪cpython的扩展;2.用C来解决费时的处理,c是效率的代名词,也是python用来解决效率问题的主要途径,甚至有时候我都觉得python是c的完美搭档。常用的是Cython,直接把py代码c化然后又能像使用py包一样使用,其次是ctypes,效

系统 2019-09-27 17:37:43 2067

编程技术

Lucene.net中文分词探究

一、中文分词方式:中文分词几种常用的方式:A.单字分词单字分词,顾名思义,就是按照中文一个字一个字地进行分词。如:我们是中国人,效果:我\们\是\中\国\人。B.二分法二分法,就是按两个字进行切分。如:我们是中国人,效果:我们\们是\是中\中国\国人。C.词库分词词库分词,就是按某种算法构造词然后去匹配已建好的词库集合,如果匹配到就切分出来成为词语。通常词库分词被认为是最理想的中文分词算法如:我们是中国人,通成效果为:我们\是\中国\中国人。二、Lucen

系统 2019-08-29 23:46:24 2067