importrequestsimportreheaders={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/67.0.3396.99Safari/537.36'}data={'cate':'realtimehot'}try:r=requests.get('http://s.weibo.com/top/summary?',
系统 2019-09-27 17:57:08 2322
初学Python之爬虫的简单入门一、什么是爬虫?1.简单介绍爬虫爬虫的全称为网络爬虫,简称爬虫,别名有网络机器人,网络蜘蛛等等。网络爬虫是一种自动获取网页内容的程序,为搜索引擎提供了重要的数据支撑。搜索引擎通过网络爬虫技术,将互联网中丰富的网页信息保存到本地,形成镜像备份。我们熟悉的谷歌、百度本质上也可理解为一种爬虫。如果形象地理解,爬虫就如同一只机器蜘蛛,它的基本操作就是模拟人的行为去各个网站抓取数据或返回数据。2.爬虫的分类网络爬虫一般分为传统爬虫和聚
系统 2019-09-27 17:56:55 2322
1、创建项目打开pycharm终端,输入如下,创建项目#进入pycharm项目目录下cdpyWebdjango-adminstartprojectpyweb_dome#pyweb_dome是django项目名称2、创建应用#进入项目根目录pyweb_dome下cdpyweb_domepythonmanage.pystartappwebserver#webserver为应用名3、创建前端项目使用vue-cli在根目录创建一个名称叫【frontend】的Vue
系统 2019-09-27 17:54:37 2322
前言python的时间格式分为多种,几种格式之间的转换方法时常是我们遇到的而且是经常忘记的点,python不像php,时间字符串和datetime是一起的,只需要strtotime和date函数就可以相互转化。虽然网上已经有很多python时间转换的文章,但是由于作者本人经常做海外业务,需要各种时区之间的转换,所以这篇文章会对按时区转换各种时间格式做一个总结。转换方法图示(图片转自网络):一、字符串转时间戳1、默认:importtimedeftime_st
系统 2019-09-27 17:54:33 2322
本文实例讲述了python中os操作文件及文件路径的方法。分享给大家供大家参考。具体分析如下:python获取文件上一级目录:取文件所在目录的上一级目录复制代码代码如下:os.path.abspath(os.path.join(os.path.dirname('settings.py'),os.path.pardir))os.path.pardir是父目录,os.path.abspath是绝对路径举例具体看一下输出:复制代码代码如下:printos.pat
系统 2019-09-27 17:52:59 2322
1.位置参数位置参数就是普通的参数定义defpower(x):print(x**2)2.默认参数当调用函数时没有给参数值,那么会给使用定义的默认值。下面定义的函数可以定义参数值也可以不定义,不定义时x默认为9defpower(x=3):print(x**2)默认参数注意事项,当默认参数使用的是可变的类型参数时,会产生不同的结果。当函数定义默认的参数是一个空列表时,第一次调用函数时,变量L设为['end'],当第二次调用时,会以['end']为默认参数,因为
系统 2019-09-27 17:52:14 2322
本项目使用Python和OpenCv实现身份证图片生成工具,填入信息,选择一张头像图片(即可生成黑白和彩色身份证图片)。可以选择是否自动抠图,自动抠图目前仅支持蓝色背景,对自动抠图效果不满意可以手动抠图。在线抠图地址:https://burner.bonanza.com/https://www.gaoding.com/koutu参照标准:正面“姓名”、“性别”、“民族”、“出生年月日”、“住址”、“公民身份号码”为6号黑体字,用蓝色油墨印刷;登记项目中的姓
系统 2019-09-27 17:51:51 2322
使用python2.7,初学,代码比较简单。numPrinter.py复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf-8-*-'''@Author:QuicoTomy@Function:Inputaphonenumberandprintbyline@DemoTime:2015-3-16'''numstr=raw_input("Inputnumber:")num=list(numstr)f=open('num.doc'
系统 2019-09-27 17:51:32 2322
uwsgi配置在项目文件夹同级目录创建logs文件夹,创建log、pid、sock文件例:~/project/foodtopmkdirlogscdlogstouchfoodtop.logfoodtop.pidfoodtop.sock在项目文件夹同级目录创建文件uwsgi.ini在uwsgi.ini文件中加入如下内容:注意:①其中目录必须是绝对路径②必须在开头加上[uwsgi],否则无法识别③配置项中的文件必须先创建,否则在云心uwsgi服务器时会报错[uw
系统 2019-09-27 17:50:51 2322
#!/usr/bin/python3--coding:utf-8--“”"通过datetime和dateutil进行常用日期的获取如:今年,去年,明年当前季度本月,上月,去年同期,今年一月今天,昨天,明天,本周、本月、本季度、本年第一天,本周、本月、本季度、本年最后一天“”"importdatetime获取常用特定日期(如去年/季度/当月/本周/首日/)=======================================关于年(今年,去年,明年)
系统 2019-09-27 17:50:37 2322
初学Python的开发者经常会发现很多Python函数中用到了yield关键字,然而,带有yield的函数执行流程却和普通函数不一样,yield到底用来做什么,为什么要设计yield?本文将由浅入深地讲解yield的概念和用法,帮助读者体会Python里yield简单而强大的功能。您可能听说过,带有yield的函数在Python中被称之为generator(生成器),何谓generator?我们先抛开generator,以一个常见的编程题目来展示yield
系统 2019-09-27 17:46:53 2322
一、什么是Selenium?Selenium是一个基于浏览器的自动化测试工具,它提供了一种跨平台、跨浏览器的端到端的web自动化解决方案。Selenium主要包括三部分:SeleniumIDE、SeleniumWebDriver和SeleniumGrid。SeleniumIDE:Firefox的一个扩展,它可以进行录制回放,并把录制的操作以多种语言(例如java、python等)的形式导出成测试用例。SeleniumWebDriver:提供Web自动化所需
系统 2019-09-27 17:45:48 2322
NLTK是使用Python教学以及实践计算语言学的极好工具。此外,计算语言学与人工智能、语言/专门语言识别、翻译以及语法检查等领域关系密切。NLTK包括什么NLTK会被自然地看作是具有栈结构的一系列层,这些层构建于彼此基础之上。那些熟悉人工语言(比如Python)的文法和解析的读者来说,理解自然语言模型中类似的――但更深奥的――层不会有太大困难。术语表全集(Corpora):相关文本的集合。例如,莎士比亚的作品可能被统称为一个文集(corpus);而若干个
系统 2019-09-27 17:38:32 2322
写这个文章的主要原因,就是因为没有相关的东西,导致我完全不知道应该怎么做,经过了两个晚上的摸索,终于搞清楚了,如果有谁需要tornado+swagger的输出模式,可以照这个套;主要是static文件的生成我们用swagger就是为了做一个静态页面,也就是生成一个static文件:几个必备的工具:swagger-py-codegen我们不用他们的文件框架只需要其生成的static文件,拷贝到自己文件夹下即可;1)需要注意的是生成文件需要用yaml文件,当编
系统 2019-09-27 17:57:05 2321
本文实例讲述了python实现比较类的两个instance(对象)是否相等的方法。分享给大家供大家参考,具体如下:对于同一个Class,可以创建不同的实例(instance),如何比较这两个instance是否相等呢?我们知道,对于计算机来说,要判断两个对象是否相等,就是看在内存中的地址是否同一个。如果内存地址一样,那么肯定是相等的。这种情况通常出现在一个对象是另外一个对象的引用时出现。但在实际的开发过程中,要比较两个对象是否相等,并不是通过内存地址来判断
系统 2019-09-27 17:55:33 2321