看知乎的时候发现了一个“如何正确地吐槽”收藏夹,里面的一些神回复实在很搞笑,但是一页一页地看又有点麻烦,而且每次都要打开网页,于是想如果全部爬下来到一个文件里面,是不是看起来很爽,并且随时可以看到全部的,于是就开始动手了。工具1.Python2.72.BeautifulSoup分析网页我们先来看看知乎上该网页的情况:网址:,容易看到,网址是有规律的,page慢慢递增,这样就能够实现全部爬取了。再来看一下我们要爬取的内容:我们要爬取两个内容:问题和回答,回答
系统 2019-09-27 17:53:39 2165
运行环境我的运行环境如下:系统版本Windows10。Python版本Python3.5,推荐使用Anaconda这个科学计算版本,主要是因为它自带一个包管理工具,可以解决有些包安装错误的问题。去Anaconda官网,选择Python3.5版本,然后下载安装。IDE我使用的是PyCharm,是专门为Python开发的IDE。这是JetBrians的产品实战上面提到过,网易云音乐的网页跟普通的网页相比主要有两点不同:网页是js动态加载的使用了iframe框架
系统 2019-09-27 17:52:52 2165
摘要数据分析与建模的时候大部分时间在数据准备上,包括对数据的加载、清理、转换以及重塑。pandas提供了一组高级的、灵活的、高效的核心函数,能够轻松的将数据规整化。这节主要对pandas合并数据集的merge函数进行详解。(用过SQL或其他关系型数据库的可能会对这个方法比较熟悉。)码字不易,喜欢请点赞!!!1.merge函数的参数一览表2.创建两个DataFrame3.pd.merge()方法设置连接字段。默认参数how是inner内连接,并且会按照相同的
系统 2019-09-27 17:51:27 2165
首先,先介绍两种引入模块的方法。法一:将整个文件引入import文件名文件名.函数名()/文件名.类名通过这个方法可以运行另外一个文件里的函数法二:只引入某个文件中一个类/函数/变量需要从某个文件中引入多个函数或变量时,用逗号隔开即可from文件名import函数名,类名,变量名接下来,通过一个具体的例子说明引入模块的具体方法:假设新建一个python包test2,里边有一个名为run.py的python文件,run.py文件里有一个名为running()
系统 2019-09-27 17:51:22 2165
8.计数排序8.1算法思想计数排序是一个非基于比较的排序算法。它的优势在于在对一定范围内的整数排序时,它的复杂度为Ο(n+k)(其中k是整数的范围),当o(k)O(nlog(n))的时候其效率反而不如基于比较的排序(基于比较的排序的时间复杂度在理论上的下限是O(nlog(n)),如归并排序,堆排序)。作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围
系统 2019-09-27 17:49:42 2165
文件操作是开发中经常遇到的场景,那么如何判断一个对象是文件对象呢?下面我们总结了3种常见的方法。方法1:比较类型第一种方法,就是判断对象的type是否为file>>>fp=open(r"/tmp/pythontab.com")>>>type(fp)>>>type(fp)==fileTrue注意:该方法对于从file继承而来的子类不适用,看下面的实例classfileDetect(file):pass#中间代码无所谓,直接跳过不处理fp2=fileDetec
系统 2019-09-27 17:49:34 2165
一、Q:如何用Python来进行查询和替换一个文本字符串?A:可以使用sub()方法来进行查询和替换,sub方法的格式为:sub(replacement,string[,count=0])replacement是被替换成的文本string是需要被替换的文本count是一个可选参数,指最大被替换的数量,示例:#!/usr/bin/envpython#-*-coding:utf-8-*-importrep=re.compile('(blue|white|red
系统 2019-09-27 17:49:14 2165
本人新学python,发现python程序转成软件好麻烦,为了方便大家,同时自己整理下资源,发布以下教程哦。下载“pywin32”软件,选择最新的build文件夹,支持新版本的python下载完毕后进行安装,需要相应版本的python作为支持安装完成后,打开cmd,输入“pipinstallpywin32”,如果pywin32程序老旧,会提示你输入“python-mpipinstall--upgradepip”命令自动更新,成功后如下图:执行“pipins
系统 2019-09-27 17:49:00 2165
前言本文介绍如何使用Python制作一个简单的猜数字游戏。游戏规则玩家将猜测一个数字。如果猜测是正确的,玩家赢。如果不正确,程序会提示玩家所猜的数字与实际数字相比是“大(high)”还是“小(low)”,如此往复直到玩家猜对数字。准备好Python3首先,需要在计算机上安装Python。可以从Python官网下载并安装。本教程需要使用最新版的Python3(版本3.x.x)。确保选中将Python添加到PATH变量的框。如果不这样做,将很难运行该程序。现在
系统 2019-09-27 17:47:57 2165
前言python本身使用\来转义一些特殊字符,比如在字符串中加入引号的时候s='i\'msuperman'print(s)#i'msuperman为了防止和字符串本身的引号冲突,使用\来转义,一般情况下这个也不会引起什么问题,但是当你要使用\来转义\的时候,就比较混乱了,比如我们想要输出一个\,得写两个\,否则会报语法错误,因为\把后面的引号给转义了,必须使用\#错误写法#print'\'#正确写法print('\\')#\#原生字符串print(r'\\
系统 2019-09-27 17:46:09 2165