看知乎的时候发现了一个“如何正确地吐槽”收藏夹,里面的一些神回复实在很搞笑,但是一页一页地看又有点麻烦,而且每次都要打开网页,于是想如果全部爬下来到一个文件里面,是不是看起来很爽,并且随时可以看到全部的,于是就开始动手了。工具1.Python2.72.BeautifulSoup分析网页我们先来看看知乎上该网页的情况:网址:,容易看到,网址是有规律的,page慢慢递增,这样就能够实现全部爬取了。再来看一下我们要爬取的内容:我们要爬取两个内容:问题和回答,回答
系统 2019-09-27 17:53:39 2187
来源|Python语音识别作者|深度学习与python(ID:PythonDC)Python是目前编程领域最受欢迎的语言。在本文中,我将总结Python面试中最常见的100个问题。每道题都提供参考答案,希望能够帮助你在2019年求职面试中脱颖而出,找到一份高薪工作。这100道面试题涉及Python基础知识、Python编程、数据分析以及Python函数库等多个方面。前50道面试题:Q51、python中编译和链接过程?编译和链接允许正确编译新扩展而不会出现
系统 2019-09-27 17:52:55 2187
玩转Python量化金融工具之NumPy一切事物的开头总是困难这句话,在任何一种科学上都是适用的。——马克思前言“手把手教你”系列将为Python初学者一一介绍Python在量化金融中运用最广泛的几个库(Library):NumPy(数组、线性代数)、SciPy(统计)、pandas(时间序列、数据分析)、matplotlib(可视化分析)。建议安装Anaconda软件(自带上述常见库),并使用JupyterNotebook交互学习。1、使用“import
系统 2019-09-27 17:49:04 2187
01前言Python现有的版本多,每个项目使用的Python版本都不一样,管理起来比较麻烦。github有一个项目叫做pyenv,它是一个多版本管理工具,非常好用,不但支持多版本,而且可以自由切换。本文以CentOS7平台为例,演示pyenv的功能。本文转自我个人的公众号:天目星,请大家多多关注。请关注我的微信公众号一、安装pyenv的项目地址:https://github.com/pyenv/pyenvPS:安装pyenv前需要安装相关依赖包$yumin
系统 2019-09-27 17:48:50 2187
1、先来看一个函数:defsum(x,y):returnx+y用lambda来实现:p=lambdax,y:x+yprint(p(1,2))2、传入一个参数的lambda函数a=lambdax:x*xprint(a(2))#注意:这里直接a(2)可以执行,但没有输出的,因为没有print3、多个参数的lambda形式:a=lambdax,y,z:x*y*zprint(a(5,6,7))匿名函数lambda:是指一类无需定义标识符(函数名)的函数或子程序。l
系统 2019-09-27 17:48:43 2187
计算机的系统时钟设置为特定的日期、时间和时区。内置的time模块让Python程序能读取系统时钟的当前时间。在time模块中,time.time()和time.sleep()函数是最有用的模块。time模块time.time()函数Unix纪元是编程中经常参考的时间:1970年1月1日0点,即协调世界时(UTC)。time.time()函数返回自那一刻以来的秒数,是一个浮点值(回想一下,浮点值只是一个带小数点的数)。这个数字称为UNIX纪元时间戳。纪元时间
系统 2019-09-27 17:48:32 2187
1.安装SublimeText3虽然现在的Sublime3还处于beta阶段,但已经非常稳定了,而且速度比Sublime2得到了增强.Sublime3可以到官网下载并安装.Sublime虽然是免费软件,但如果有足够的经济能力,可以考虑购买以表示支持.2.安装PackageControlSublimePackageControl可以说是必须安装的插件,因为其方便的提供了安装/升级/删除Sublime插件的功能,安装方法见PackageControl官网.安装
系统 2019-09-27 17:47:56 2187
今天发现了一个好玩的小项目,做的就是坦克大战的,看到它的一瞬间让我想起了小时候泡在4399网站里面的时光了,我果断下载下来跑了起来,做的还是可以的,这里的可以就是说视觉效果上的可以,至于具体内容细节什么还是有一些bug的,比如我自己摧毁“老窝”的时候居然没有游戏结束,等等。既然项目别人已经做好了,我就不多做什么工作了,想着运行py脚本多麻烦,能够把游戏打包成为exe文件就好了,想到这里就开始着手进行游戏的打包工作,这里主要使用的是pyinstaller模块
系统 2019-09-27 17:47:08 2187
本文对Python爬虫常用的模块做了较为深入的分析,并以实例加以深入说明。分享给大家供大家参考之用。具体分析如下:creepy模块某台湾大神开发的,功能简单,能够自动抓取某个网站的所有内容,当然你也可以设定哪些url需要抓。地址:https://pypi.python.org/pypi/creepy功能接口:set_content_type_filter:设定抓取的content-type(header中的contenttype)。包括text/htmla
系统 2019-09-27 17:45:57 2187
1.爬取豆瓣top250书籍importrequestsimportjsonimportcsvfrombs4importBeautifulSoupbooks=[]defbook_name(url):res=requests.get(url)html=res.textsoup=BeautifulSoup(html,'html.parser')items=soup.find(class_="grid-16-8clearfix").find(class_="in
系统 2019-09-27 17:45:26 2187