到现在为止,我们的淘宝教程已经写到了第四篇,前三篇分别是:第一篇:Python模拟登录淘宝,详细讲解如何使用requests库登录淘宝pc端。第二篇:淘宝自动登录2.0,新增Cookies序列化,教大家如何将cookies保存起来。第三篇:Python爬取淘宝商品避孕套,教大家如何爬取淘宝pc端商品信息。今天,我们来看看淘宝系列的第四篇我们在上一篇的时候已经将淘宝数据爬取下来了,但是并没有做数据分析。所以今天这篇文章就是教大家如何去分析数据,得出一些有用的
系统 2019-09-27 17:50:12 2074
SeriesSeries类似一维数组,由一组数据及一组相关数据标签组成。使用pandas的Series类即可创建。importpandasaspds1=pd.Series(['a','b','c,','d'])print(s1)#输出:0a#1b#2c#3d#dtype:object上面是传入一个列表实现,上面的0,1,2,3就是数据的默认标签。另外可以通过index属性自定义标签。s2=pd.Series(['1','2','3,','4'],index
系统 2019-09-27 17:50:09 2074
s与==区别:is用于判断两个变量引用对象是否为同一个,==用于判断引用变量的值是否相等。aisb相当于id(a)==id(b),id()能够获取对象的内存地址。如果a=10;b=a;则此时a和b的内存地址一样的;但当a=[1,2,3];另b=a[:]时,虽然a和b的值一样,但内存地址不一样。如果此时定义a=10、b=10,然后再对比aisb会发现返回的结果是True,这是因为在Python中会实现创建一个小型的整形池,范围为[-5,256],为这些整形开
系统 2019-09-27 17:49:44 2074
threadpoolmakeRequests的原型如下defmakeRequests(callable_,args_list,callback=None,exc_callback=_handle_thread_exception),可以看出第一个参数是线程将要启动任务函数,第二个是要传个任务函数的参数列表,第三个是回调函数,可以用于收集任务结束后的结果或者环境清理args_list中每一项要么是一个单独的变量,要么是一个2个元素的元组,该元组第1项是位置参
系统 2019-09-27 17:49:19 2074
文章作者:Tyan博客:noahsnail.com|CSDN|1.引言众所周知,Python语言简单、易学、开源、具有丰富的库,Python的第一个编译器是用C语言实现的。但Python的缺点也非常明显,最让人诟病的就是Python的性能问题。因此,为了提高程序的运行效率,通常会将程序的关键部分使用C或C++重写,编译成动态链接库,然后在Python(CPython)中进行调用。运行环境:Ubuntu16.04、Python2.7、Python3.5。2.
系统 2019-09-27 17:49:18 2074
问题背景:源于公司的原来的代码是python2开发的,后来改为python3开发,设计到的property的用法有点不一样直接上代码公司原来的python2的代码classLineItem:def__init__(self,description,weight,price):self.description=descriptionself.__weight=weightself.price=price@propertydefweight(self):ret
系统 2019-09-27 17:49:16 2074
%用法1、整数的输出%o——oct八进制%d——dec十进制%x——hex十六进制2、浮点数输出(1)格式化输出%f——保留小数点后面六位有效数字%.3f,保留3位小数位%e——保留小数点后面六位有效数字,指数形式输出%.3e,保留3位小数位,使用科学计数法%g——在保证六位有效数字的前提下,使用小数方式,否则使用科学计数法%.3g,保留3位有效数字,使用小数或科学计数法(2)内置round()参数:number-这是一个数字表达式。ndigits-表示从
系统 2019-09-27 17:48:31 2074
说实话,都9012了,还在用这种背题式的方法来考核程序员,实在太不切合程序员的实际工作了……文末给出了一种更极客的考核方式,Talkischeap,Showmethecode(写代码,憋bb)——写得出工作代码,就说明你有工作能力;写不出,书背的再溜也不行面试官只需要:节选一段工作代码,然后把原有代码删除,让面试者自己写代码实现;或是保留一段有bug的代码,让面试者修改即可——这都是最常见的程序员工作场景,最能考核面试者的真实代码能力;而且题目随处可见,扒
系统 2019-09-27 17:48:17 2074
在任何语言中,都会规定某些对象(属性、方法、函数、类等)只能够在某个范围内访问,出了这个范围就不能访问了。这是“公”、“私”之分。此外,还会专门为某些特殊的东西指定一些特殊表示,比如类的名字就不能用class,def等,这就是保留字。除了保留字,python中还为类的名字做了某些特殊准备,就是“专有”的范畴。私有函数在某些时候,会看到有一种方法命名比较特别,是以“__”双划线开头的,将这类命名的函数/方法称之为“私有函数”。所谓私有函数,就是:私有函数不可
系统 2019-09-27 17:47:33 2074
0x00marshalmarshal使用的是与Python语言相关但与机器无关的二进制来读写Python对象的。这种二进制的格式也跟Python语言的版本相关,marshal序列化的格式对不同的版本的Python是不兼容的。marshal一般用于Python内部对象的序列化。一般地包括:基本类型booleans,integers,floatingpointnumbers,complexnumbers序列集合类型strings,bytes,bytearray
系统 2019-09-27 17:47:22 2074