搜索到与相关的文章
Python

Python爬虫:现学现用xpath爬取豆瓣音乐

爬虫的抓取方式有好几种,正则表达式,Lxml(xpath)与BeautifulSoup,我在网上查了一下资料,了解到三者之间的使用难度与性能三种爬虫方式的对比。抓取方式性能使用难度正则表达式快困难Lxml快简单BeautifulSoup慢简单这样一比较我我选择了Lxml(xpath)的方式了,虽然有三种方式,但肯定是要选择最好的方式来爬虫,这个道理大家都懂,另外有兴趣的朋友也可以去了解另外两种爬虫方式!好了现在来讲讲xpath由于Xpath属于lxml模块

系统 2019-09-27 17:49:52 2173

Python

在Python上基于Markov链生成伪随机文本的教程

首先看一下来自Wolfram的定义马尔可夫链是随机变量{X_t}的集合(t贯穿0,1,...),给定当前的状态,未来与过去条件独立。Wikipedia的定义更清楚一点儿...马尔可夫链是具有马尔可夫性质的随机过程...[这意味着]状态改变是概率性的,未来的状态仅仅依赖当前的状态。马尔可夫链具有多种用途,现在让我看一下如何用它生产看起来像模像样的胡言乱语。算法如下,找一个作为语料库的文本,语料库用于选择接下来的转换。从文本中两个连续的单词开始,最后的两个单词

系统 2019-09-27 17:49:12 2173

Python

编写Python脚本来实现最简单的FTP下载的教程

访问FTP,无非两件事情:upload和download,最近在项目中需要从ftp下载大量文件,然后我就试着去实验自己的ftp操作类,如下(PS:此段有问题,别复制使用,可以参考去试验自己的ftp类!)importosfromftplibimportFTPclassFTPSync():def__init__(self,host,usr,psw,log_file):self.host=hostself.usr=usrself.psw=pswself.log_

系统 2019-09-27 17:48:23 2173

Python

Python中转换角度为弧度的radians()方法

radians()方法把角度转化为弧度角x。语法以下是radians()方法的语法:radians(x)注意:此函数是无法直接访问的,所以我们需要导入math模块,然后需要用math的静态对象来调用这个函数。参数x--这必须是一个数值。返回值此方法返回一个角度的弧度值。例子下面的示例演示radians()方法的使用。#!/usr/bin/pythonimportmathprint"radians(3):",math.radians(3)print"radi

系统 2019-09-27 17:47:26 2173

Python

小白学习python之路(一):安装python3

引言作为一个python小白,之前学的是java,不过听说python很流行,功能很强大,可以用很少的代码实现更强的功能,因此我也是被吸引了过来,并且把我的学习经历记录下来。当然了,要学习python,首先要先把他下载下来,安装一下,因为python2和python3在语法上有很大的不同,所以学的时候要注意版本,我们这里用的是python3。python3.7下载链接:https://u20538204.ctfile.com/fs/20538204-383

系统 2019-09-27 17:46:59 2173

Python

Python fileinput模块使用实例

fileinput模块可以遍历文本文件的所有行.它的工作方式和readlines很类似,不同点在于,它不是将全部的行读到列表中而是创建了一个xreadlines对象.下面是fileinput模块中的常用函数input()#它会返回能够用于for循环遍历的对象.filename()#返回当前文件的名称lineno()#返回当前(累计)的行数filelineno()#返回当前文件的行数isfirstline()#检查当前行是否是文件的第一行复制代码代码如下:#

系统 2019-09-27 17:46:50 2173

Python

简单介绍Python中的readline()方法的使用

readline()方法从文件中读取一整行。尾部的换行符保持在字符串中。如果大小参数且非负,那么一个最大字节数,包括结尾的换行和不完整的行可能会返回。遇到EOF时立即返回一个空字符串。语法以下是readline()方法的语法:fileObject.readline(size);参数size--这是可以从文件中读取的字节数。返回值此方法返回从文件中读取的行。例子下面的例子显示了readline()方法的使用。#!/usr/bin/python#Openafi

系统 2019-09-27 17:46:26 2173

Python

python字典操作(Dictionary)

字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值key=>value对用冒号:分割,每个键值对之间用逗号,分割,整个字典包括在花括号{}中,格式如下所示:d={key1:value1,key2:value2}键一般是唯一的,如果重复最后的一个键值对会替换前面的,值不需要唯一。值可以取任何数据类型,但键必须是不可变的,如字符串,数字或元组。一个简单的实例:dict={'WJ':'female','CT':'male'}这里主要说明一键一值和一键

系统 2019-09-27 17:46:12 2173

Python

Python实现的统计文章单词次数功能示例

本文实例讲述了Python实现的统计文章单词次数功能。分享给大家供大家参考,具体如下:题目是这样的:你有一个目录,放了你一个月的日记,都是txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。其实就是统计一篇文章出现最多的单词,但是要去除那些常见的连词、介词和谓语动词等,代码:#coding=utf-8importcollectionsimportreimportosuseless_words=('the','a','an','a

系统 2019-09-27 17:45:54 2173

Python

python实现多线程的方式及多条命令并发执行

一、概念介绍Thread是threading模块中最重要的类之一,可以使用它来创建线程。有两种方式来创建线程:一种是通过继承Thread类,重写它的run方法;另一种是创建一个threading.Thread对象,在它的初始化函数(__init__)中将可调用对象作为参数传入.Thread模块是比较底层的模块,Threading模块是对Thread做了一些包装的,可以更加方便的被使用。另外在工作时,有时需要让多条命令并发的执行,而不是顺序执行。二、代码样例

系统 2019-09-27 17:38:29 2173