搜索到与相关的文章
Python

python爬虫实现教程转换成 PDF 电子书

写爬虫似乎没有比用Python更合适了,Python社区提供的爬虫工具多得让你眼花缭乱,各种拿来就可以直接用的library分分钟就可以写出一个爬虫出来,今天就琢磨着写一个爬虫,将廖雪峰的Python教程爬下来做成PDF电子书方便大家离线阅读。开始写爬虫前,我们先来分析一下该网站1的页面结构,网页的左侧是教程的目录大纲,每个URL对应到右边的一篇文章,右侧上方是文章的标题,中间是文章的正文部分,正文内容是我们关心的重点,我们要爬的数据就是所有网页的正文部分

系统 2019-09-27 17:55:45 2158

Python

如何安装并使用conda指令管理python环境

一、动机最近打算折腾vn.py,但只有py27版本的,因为一向习惯使用最新稳定版的,所以不得不装py27的环境,不得不说Python的全局锁真的很烦。身为懒癌患者,必然使用全功能的anaconda,但不想同时装py27和py35两个版本的anaconda巨无霸(同时装两个,不知道conda是否也可以管理环境),于是选择用conda装python27的环境及一些必要的包。弄了几天终于把办公电脑和家里的Mac机上的环境都配好了,即使有了官方的安装教材,也踩了不

系统 2019-09-27 17:55:36 2158

Python

八大排序算法的Python实现

八大排序算法的Python实现原文地址插入排序插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中,从而得到一个新的、个数加一的有序数据,算法适用于少量数据的排序,时间复杂度为O(n^2)。是稳定的排序方法。插入算法把要排序的数组分成两部分:第一部分包含了这个数组的所有元素,但将最后一个元素除外(让数组多一个空间才有插入的位置),而第二部分就只包含这一个元素(即待插入元素)。在第一部分排序完成后,再将这个最后元素插入到已排好序的第一部分中。代码实现

系统 2019-09-27 17:55:35 2158

Python

Python在Matplotlib图中显示中文字体的操作方法

1.说明本篇主要针对在Ubuntu系统中,matplotlib显示不了中文的问题,尤其是在无法安装系统字体的情况下,解决Python绘图时中文显示的问题。2.在系统中安装字体$fc-list:lang=zh#查看中文字体名称及其安装路径,相对于英文字体,中文字体文件一般较大。如果无中文字体,可使用apt-get安装,具体方法如下:$apt-cachesearchfont|grepChinese#查看可安装的中文字体$sudoapt-getinstallfo

系统 2019-09-27 17:54:48 2158

Python

零基础写python爬虫之神器正则表达式

接下来准备用糗百做一个爬虫的小例子。但是在这之前,先详细的整理一下Python中的正则表达式的相关内容。正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。一、正则表达式基础1.1.概念介绍正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。它拥有自己独特的语法以及一个独立的处理引擎,在提供了正则表达式的语言里,正则表达

系统 2019-09-27 17:54:47 2158

Python

python爬虫_自动获取seebug的poc实例

简单的写了一个爬取www.seebug.org上poc的小玩意儿~首先我们进行一定的抓包分析我们遇到的第一个问题就是seebug需要登录才能进行下载,这个很好处理,只需要抓取返回值200的页面,将我们的headers信息复制下来就行了(这里我就不放上我的headers信息了,不过headers里需要修改和注意的内容会在下文讲清楚)headers={'Host':******,'Connection':'close','Accept':******,'Use

系统 2019-09-27 17:54:11 2158

Python

Python小白丁笔记(13)------封装工具——类

例子:classFileTool:def__init__(self,filepath):self.filepath=filepathdefwrite_to_file(self,line):f=open(self.filepath,'a')f.write(line)f.close()defread_to_file(self):f=open(self.filepath,'r')lines=f.readlines()f.close()returnlines

系统 2019-09-27 17:53:57 2158

Python

Python面向对象编程——元类

Python面向对象编程——元类一、只是储备exec:三个参数参数一:字符串形式的命令参数二:全局作用域(字典形式),如果不指定,默认为globals()参数三:局部作用域(字典形式),如果不指定,默认为locals()exec的使用#可以把exec命令的执行当成是一个函数的执行,会将执行期间产生的名字存放于局部名称空间中g={'x':1,'y':2}l={}exec('''globalx,zx=100z=200m=300''',g,l)print(g)#

系统 2019-09-27 17:53:16 2158

Python

推荐经典算法实现之BPMF(python+MovieLen)

因前一篇https://blog.csdn.net/fjssharpsword/article/details/97000479采样问题未解决,发现如下github上有BPMF代码,采用wishart先验,性能和pymc3一致。参考:https://github.com/LoryPack/BPMF#coding:utf-8'''@author:Jason.F@data:2019.08.01@function:baselineBPMF(BayesianPro

系统 2019-09-27 17:52:22 2158

Python

Python学习---超详细字符串用法大全,好文推荐!

来自:Python编程与实战(微信号:pthon1024),作者:Jerryning没有办法转,整个复制下来了本文要点字符串拼接拆分含有多种分隔符的字符串判读字符串a是否以字符串b开头或结尾调整字符串中文本的格式对字符串进行左,右,居中对齐删除字符串中不需要的字符字符串拼接实际场景:把列表中的数据拼接成一个字符串解决方案:使用str.join()方法>>>li=['cxk','cxk','kk','caibi']>>>''.join([str(i)fori

系统 2019-09-27 17:52:00 2158