搜索到与相关的文章
Python

Python 打败 R 了吗?

随着编程语言的发展,有些语言有很好的发展,有些则面临淘汰,而要数较热门的,其中就有Python。Python作为一种通用脚本语言,后来逐渐成为数据科学中最流行的语言。据IT行业的一些人说,Python的成名是以R语言为踏脚石,R现在是一门垂死的语言。有一些证据表明,Python的流行导致R的使用率越来越低。根据TIOBE统计,Python目前是世界上第三大最受欢迎的语言,仅次于两大热门语言Java和C,从2018年8月到2019年8月,Python的使用率

系统 2019-09-27 17:57:12 1965

Python

python os模块

os模块os模块提供了很多可以操作系统里文件及目录相关的参数重点方法importosos.path.getsize('绝对路径')#获取指定文件的存储大小,但是不能准确的获得目录的大小os.path.isfile('绝对路径')#判断是否是文件,返回bool类型(True/False)os.path.isdir('绝对路径')#判断是否是目录,返回bool类型(True/False)os.path.join('文件夹的路径','文件或者其他名称')#拼接字

系统 2019-09-27 17:56:50 1965

Python

Python按行读取大文件

在工作中遇到一个需求,需要用Python脚本读取一个13G的文件,把每行的记录写入redis。由于机器的内存只有8G,所以不能一次将磁盘上的文件全部读入内存,需要一行一行读取文件。Python按行读取文件主要是使用file.readline方法或者利用file对象的迭代器性质,而file.readlines方法则是一次把所有内容从磁盘读入内存。当内存足够时,file.readlines方法显然会更快,因为磁盘I/O次数更少。下面给出了三种遍历文件每行的方式

系统 2019-09-27 17:56:36 1965

Python

Python:计算欧氏距离的两种写法

使用列表List作为样本点表示的欧氏距离计算方法:importmath#计算两点之间的距离defeucliDist(A,B):returnmath.sqrt(sum([(a-b)**2for(a,b)inzip(A,B)]))X=[1,2,3,4]Y=[0,1,2,3]print(eucliDist(X,Y))使用np.array作为样本点表示的欧氏距离计算方法:importnumpyasnp#计算两点之间的距离defeucliDist(A,B):retu

系统 2019-09-27 17:56:21 1965

Python

python如何匹配CSV文件某一列数据,并根据匹配到的数据的值在后面添加新

CSV数据格式如下所示:分类要求为:AAAI属于AI类,ICDM,SDM和KDD属于DM类,WWW属于NEW类上图所示第一列为名称,如何根据第一列的名称把前面的类别名称输出到第三列,实际效果为:如上图所示,第一列为名称,第三列为对应的类别名称,请给出python的实现代码答案对人有帮助,有参考价值0答案没帮助,是错误的答案,答非所问可以用pandas里面的map映射字典。In[1]:importpandasaspdIn[2]:df=pd.DataFrame

系统 2019-09-27 17:56:15 1965

Python

python中的json总结

1、json.dumps:是将dict转成str2、json.dump:是将python数据保存成json3、json.load:是将文件中的json数据读取出来,转换成python数据类型

系统 2019-09-27 17:56:12 1965

Python

python打造爬虫代理池过程解析

最近在使用爬虫爬取数据时,经常会返回403代码,大致意思是该IP访问过于频繁,被限制访问。限制IP访问网站最常用的反爬手段了,其实破解也很容易,就是在爬取网站是使用代理即可,这个IP被限制了,就使用其他的IP。对于高大上的公司来说,他们基本都使用收费的代理,基本不会有什么问题,比较稳定。像我这样的矮矬穷,肯定是用不起收费的代理。一般都是使用国内免费的代理,网上也有很多提供免费的代理。很多人都是从网上爬取一批免费的代理IP,存放在存储媒介中,例如excel文

系统 2019-09-27 17:56:04 1965

Python

python 利用浏览器 Cookie 模拟登录的用户访问知乎的方法

首先在火狐浏览器上登录知乎,然后使用火狐浏览器插件Httpfox获取GET请求的Cookie,这里注意使用状态值为200(获取成功)的某次GET.将Cookies复制出来,注意这一行非常长,不要人为添加换行符。而且Cookie中使用了双引号,最后复制到代码里使用单引号包起来。使用下边代码检验是否是模拟了登录的用户的请求:importrequestsimportreheaders={'User-Agent':'Mozilla/5.0(WindowsNT10.

系统 2019-09-27 17:55:03 1965

Python

详谈Python基础之内置函数和递归

一、内置函数下面简单介绍几个:1.abs()求绝对值2.all()如果iterable的所有元素都为真(或者如果可迭代为空),则返回True3.any()如果iterable的任何元素为真,则返回True。如果iterable为空,则返回False4.callable()如果object参数出现可调,则返回True,否则返回False5.divmod()以两个(非复数)数字作为参数,并在使用整数除法时返回由商和余数组成的一对数字。对于混合操作数类型,二进制

系统 2019-09-27 17:54:34 1965

Python

python itchat给指定联系人发消息的方法

itchat模块官方参考文档:https://itchat.readthedocs.io/zh/latest/安装pipinstallitchat/pip3installitchat原理Python模仿网页版微信登陆,并且现有一套操作网页版微信的API,可以将你使用微信中产生的数据爬下来,并做出相应的处理。操作1.导入这套微信API的包itchatimportitchat2.模仿网页版微信登陆itchat.auto_login()3.使用相关函数找到相关微

系统 2019-09-27 17:54:06 1965