- 军军小站|张军博客
搜索到与相关的文章
Python

Python爬豆瓣电影实例

文件结构html_downloader.py-下载网页html内容#!/usr/bin/python#-*-coding:UTF-8-*-importurllib2classHtmlDownloader(object):defdownlod(self,url):ifurlisNone:returnNoneresponse=urllib2.urlopen(url)ifresponse.getcode()!=200:returnNonereturnrespon

系统 2019-09-27 17:52:08 1904

Python

python 缺失值处理的方法(Imputation)

一、缺失值的处理方法由于各种各样的原因,真实世界中的许多数据集都包含缺失数据,这些数据经常被编码成空格、nans或者是其他的占位符。但是这样的数据集并不能被scikit-learn算法兼容,因为大多数的学习算法都会默认数组中的元素都是数值,因此素偶有的元素都有自己的代表意义。使用不完整的数据集的一个基本策略就是舍弃掉整行或者整列包含缺失值的数值,但是这样处理会浪费大量有价值的数据。下面是处理缺失值的常用方法:1.忽略元组当缺少类别标签时通常这样做(假定挖掘

系统 2019-09-27 17:50:59 1904

Python

python学习 第二天

一、运算符1、算术运算符:+-*///**%+加两个数相加1+2=3-减两个数相减3-1=2*乘两个数相乘1*2=2/除两个数相除5/2=2.5//整除两个数相除得到整数5//2=2**幂幂次方2**3=8%取余两个数的余数5%2=1(可以用来判断奇偶数取余为0的时候为偶数取余为1的时候为奇数)2、比较运算符:>、<、>=、<=、==、!=结果只有真假truefalse为bool类型3、赋值运算符:+=-=*=/=//=%=**=num+=1等价于num=

系统 2019-09-27 17:49:47 1904

Python

【python】Leetcode(Data Structure

文章目录160.相交链表(链表)232.用栈实现队列69.x的平方根(二分法)215.数组中的第K个最大元素(快排)347.前K个高频元素(桶排序)378.有序矩阵中第K小的元素(排序)1051.高度检查器(排序)17.电话号码的字母组合(递归)241.为运算表达式设计优先级(分治)455.分发饼干(贪心)160.相交链表(链表)把两个链表连起来,不断遍历,相等停下!classSolution(object):defgetIntersectionNode(

系统 2019-09-27 17:49:15 1904

Python

手动实现把python项目发布为exe可执行程序过程分享

1.手动制作python的exe可执行程序Python没有内建一个编译为exe的功能。给python程序的部署带来不少的麻烦。所以就会出现一些py2exe之类的很不错的工具,用于自动把.py文件编译为.exe文件。最近抽空研究了一下手动实现类似py2exe的功能,希望加强对python的了解。结果还相当不错。把结果记录下来,与大家共享。1.1.原理文中所描述的方法,基于python的以下几个功能1)python程序运行时,会在sys.path指定的路径中查

系统 2019-09-27 17:47:34 1904

Python

Python序列之list和tuple常用方法以及注意事项

sequence序列sequence(序列)是一组有顺序的对象的集合。序列可以包含一个或多个元素,也可以没有任何元素。我们之前所说的基本数据类型,都可以作为序列的对象。对象还可以是另一个序列。序列有两种:list(表)和tuple(元组)。list和tuple的主要区别在于,一旦建立,tuple的各个元素不可再变更,而list的各个元素可以再变更。List获得list元素的个数:复制代码代码如下:>>>lst=['更新慢','python',5.44,Fa

系统 2019-09-27 17:47:24 1904

Python

Python 正则表达式 re.match/re.search/re.sub

FromPython正则表达式re.match(pattern,string,flags=0)尝试从字符串起始位置匹配一个模式;如果不是起始位置匹配成功,则re.match()返回none.匹配成功,re.match()返回一个匹配的对象,否则返回None.pattern-匹配的正则表达式string-要匹配的字符串flags-标志位,控制正则表达式的匹配方式,如,是否区分大小写,多行匹配等.e.g.#!/usr/bin/python#-*-coding:

系统 2019-09-27 17:46:48 1904

Python

python 专题训练收获(三)dict

默认dict,代表dict.keys(),而不是dict.items()排序字典,sorted(a.items(),key=lambdakv:kv[-1]),但是返回的是list,[('b',0),('a',1),('c',2)],然后再用dict[]一次,就能得到字典。注意,字典的Key可以不是字符。{0:'0'}dict.update({2:30})。添加字典的元素,两个字典的内容相加,就是用dict_a.updata(dict_b)。删除字典中的某个

系统 2019-09-27 17:46:33 1904

Python

Python利用requests模块下载图片实例代码

本文主要介绍的是关于Python利用requests模块下载图片的相关,下面话不多说了,来一起看看详细的介绍吧MySQL中事先保存好爬取到的图片链接地址。然后使用多线程把图片下载到本地。示例代码:#coding:utf-8importMySQLdbimportrequestsimportosimportrefromthreadingimportThreadimportdatetimeheader={'User-Agent':'Mozilla/5.0(Win

系统 2019-09-27 17:46:10 1904

Python

python小案例_工作报告词云

一、《新时代中国特色社会主义》的词云1、直接上代码:importjieba,wordcloudf=open("./data/新时代中国特色社会主义.txt","r",encoding="utf-8")#打开文件t=f.read()#读取文件f.close()#关闭文件ls=jieba.lcut(t)#分词txt="".join(ls)#将分好的词用空格串起来#配置参数#width:指定词云对象生成图片的宽度,默认400像素#height:指定词云对象生成图

系统 2019-09-27 17:45:38 1904