1.Pandas简介Pandas是基于Numpy的一个开源Python库,被广泛用于快速分析数据,以及数据清洗和准备工作。Pandas中有两类重要的数据结构,就是序列Series和数据框DataFrame。2.Series和DataFrame数据结构importnumpyasnpimportpandasaspds1=pd.Series(np.array([1,2,3,4,5]))print(s1)print("***************")s2=pd.
系统 2019-09-27 17:57:14 2395
比如,你想采集标题中包含“58同城”的SERP结果,并过滤包含有“北京”或“厦门”等结果数据。该Python脚本主要是实现以上功能。其中,使用BeautifulSoup来解析HTML,可以参考我的另外一篇文章:Windows8下安装BeautifulSoup代码如下:复制代码代码如下:__author__='曾是土木人'#-*-coding:utf-8-*-#采集SERP搜索结果标题importurllib2frombs4importBeautifulSo
系统 2019-09-27 17:52:51 2395
Python中可迭代对象(Iterable)并不是指某种具体的数据类型,它是指存储了元素的一个容器对象,且容器中的元素可以通过__iter__()方法或__getitem__()方法访问。__iter__方法的作用是让对象可以用for…in循环遍历,getitem()方法是让对象可以通过“实例名[index]”的方式访问实例中的元素。老猿认为这两个方法的目的是Python实现一个通用的外部可以访问可迭代对象内部数据的接口。一个可迭代对象是不能独立进行迭代的
系统 2019-09-27 17:52:31 2395
最好的一种判断语言的方法就是在实践中使用它。人们选择Python的六个主要原因是:(1)软件质量。在很大程度上,Python更注重可读性、一致性和软件质量,从而与脚本语言世界中的其他工具区别开来。此外,Python支持软件开发的高级重用机制。比如面向对象程序设计(OOP)。(2)提高开发者的效率。Python代码的大小往往只有C++或Java代码的1/5~1/3。并且Python程序可以立即运行,无需传统编译/静态语言所必需的编译及链接等步骤,进一步提高了
系统 2019-09-27 17:50:28 2395
python爬虫1《1》什么是爬虫网络爬虫?网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。《2》爬虫的基本原理:我们把互联网比喻为一张大网,网络爬虫我们想象为网上的蜘蛛,网页与网页之间的连接我们理解为节点,爬虫就相当于是访问网页,获取网页的信息,又通过节点可以爬取另一个网站,然后不停的通过一个个节点即访问一个个网页,这样网站的数据就可以被我们获取下来了。《3》爬虫的分类:网络爬虫可分为通用爬虫和聚焦爬虫
系统 2019-09-27 17:50:05 2395
字典是python中唯一的映射类型,采用键值对(key-value)的形式存储数据。python对key进行哈希函数运算,根据计算的结果决定value的存储地址,所以字典是无序存储的,且key必须是可哈希的。可哈希表示key必须是不可变类型,如:数字、字符串、元组。特性:无顺序、去重、查询速度快,比列表快多了、比list占用内存多字典={key:value}创建1,使用”{}”创建:dd={'a':'aaa','b':'bbb'}2,使用dict创建:li
系统 2019-09-27 17:48:37 2395
遍历字典:keys()、values()、items()1.xxx.keys():返回字典的所有的key返回一个序列,序列中保存有字典的所有的键效果图:代码:#keys()该方法会返回字典的所有的key#该方法会返回一个序列,序列中保存有字典的所有的键d={'name':'孙悟空','age':18,'gender':'男'}print(d.keys())print()#通过遍历keys()来获取所有的键forkind.keys():print(k,d[k
系统 2019-09-27 17:47:12 2395
初学Python的开发者经常会发现很多Python函数中用到了yield关键字,然而,带有yield的函数执行流程却和普通函数不一样,yield到底用来做什么,为什么要设计yield?本文将由浅入深地讲解yield的概念和用法,帮助读者体会Python里yield简单而强大的功能。您可能听说过,带有yield的函数在Python中被称之为generator(生成器),何谓generator?我们先抛开generator,以一个常见的编程题目来展示yield
系统 2019-09-27 17:46:53 2395
importtimetime.sleep(100)print(time.time())print(time.strftime("%Y-%m-%d%a%H:%M:%S"))#yearmonthdayHOURMINUTESECONDprint(time.strftime("%Y/%m/%d%H:%M:%S"))#yearmonthdayHOURMINUTESECONDprint(time.strftime("%m-%d%H:%M:%S"))#yearmonth
系统 2019-09-27 17:46:46 2395
1.进程和线程2.同步和异步3.协程4.生成器到协程5.asyncio模块(协程模块)………………………………………………………………………………1.进程和线程进程相当于一个任务,比如做饭线程相当于操作,做饭需要解冻肉,洗菜,煮米饭一个进程任务,做饭下需要多进程做饭的多个进程,如上GIL全局解释器锁是用在IO密集型(大量的文件读写,多次请求网络数据)的多线程中对比单线程和多线程的例子:调用包time和线程包:threading先模拟请求网络数据的函数req
系统 2019-09-27 17:46:22 2395