先配图看一下框架:从上面两张结构图,大概讲讲每个模块下的类实现的一些方法:1、config||-config.yml配置文件,主要存放一些全局配置变量,如:(1)截图、报告、驱动存放路径;(2)发送邮件使用到的发件人邮箱及登录密码(因为发送邮件一般用于自动发送测试报告,所以发件人比较固定);(3)绕过登录验证码要写入的cookies信息||-config.py包含读取配置文件方法和一些全局参数2、data||-存放一些数据文件!!-generator一个生
系统 2019-09-27 17:53:05 2468
今天学习了用python生成仿真数据的一些基本方法和技巧,写成博客和大家分享一下。本篇博客主要讲解如何从给定参数的的正态分布/均匀分布中生成随机数以及如何以给定概率从数字列表抽取某数字或从区间列表的某一区间内生成随机数,按照内容将博客分为3部分,并附上代码。1从给定参数的正态分布中生成随机数当考虑从正态分布中生成随机数时,应当首先知道正态分布的均值和方差(标准差),有了这些,就可以调用python中现有的模块和函数来生成随机数了。这里调用了Numpy模块中
系统 2019-09-27 17:51:10 2468
学习Python的童鞋,对numpy都不陌生,小白最近学习了一些Numpy的方法,发现Numpy真的很强大。Numpy:本质的数字化的python,当然也可以存放string类型的数据。如何创建array?可以用tuple也可用list.其中,dtype用来指定数据类型,int32指,存放int类型最高32位,不过也可以去掉32,直接写int。数据类型float都可以定义数据的长度,也可以不定义。第一种用tupletuple=(1,2,3,4)a=np.a
系统 2019-09-27 17:50:11 2468
正则表达式是定义搜索模式的字符序列。通常这种模式被字符串搜索算法用于字符串上的“查找”或“查找和替换”操作,或者用于输入验证。1.正则表达式的语法.表示任何单个字符[]字符集,对单个字符给出取值范围[^]非字符集,对单个字符给出排除范围*前一个字符0次或者无限次扩展+前一个字符1次或无限次扩展?前一个字符0次或1次扩展|左右表达式任意一个{m}扩展前一个字符m次{m,n}扩展前一个字符m至n次^匹配字符串开头$匹配字符串结尾()分组标记,内部只能使用|操作
系统 2019-09-27 17:49:57 2468
python如何处理“”开头加数字的html字符,比如:风水这类数据。用python抓取数据时,有时会遇到想要数据是以“”开头加数字的字符,比如图中所示的这些:风水大术士这些字符需要再次转换才能变回中文内容。这些字符需要再次转换才能变回中文内容。Python2.7版本在python2.7版本中,使用importHTMLParser定义变量,再定义转换代码。代码中最重要的是“data_parser=HTMLParser.HTMLParser()”,通
系统 2019-09-27 17:49:11 2468
前言我看到最近几部电影很火,查了一下猫眼电影上的数据,发现还有个榜单,里面有各种经典和热映电影的排行榜,然后我觉得电影封面图还挺好看的,想着一张一张下载真是费时费力,于是突发奇想,好像可以用一下最近学的东西实现我的需求,学习了正则表达式之后,想着要感受一下它在爬虫里面的效果和优缺点。目标:爬取Top100榜单上电影的封面图Top100榜单规则:将猫眼电影库中的经典影片,按照评分和评分人数从高到低综合排序取前100名,每天上午10点更新。相关数据来源于“猫眼
系统 2019-09-27 17:48:31 2468
fromtypingimportListclassSolution:defintersect(self,nums1:List[int],nums2:List[int])->List[int]:#记录两个数组中每个数字出现的次数result1={}result2={}#遍历两个数组,然后将其数字出现次数添加入字典中foriinnums1:ifinotinresult1.keys():result1[i]=1else:result1[i]+=1foriinnu
系统 2019-09-27 17:48:30 2468
一、什么是决策树(decisiontree)――机器学习中的一个重要的分类算法决策树是一个类似于数据流程图的树结构:其中,每个内部节点表示一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或者类的分布,树的最顶层是根结点根据天气情况决定出游与否的案例二、决策树算法构建2.1决策树的核心思路特征选择:从训练数据的特征中选择一个特征作为当前节点的分裂标准(特征选择的标准不同产生了不同的特征决策树算法)。决策树生成:根据所选特征评估标准,从上至下递
系统 2019-09-27 17:47:26 2468
引用计数在Python源码中,每一个对象都是一个结构体表示,都有一个计数字段。typedefstruct_object{intob_refcnt;struct_typeobject*ob_type;}PyObject;PyObject是每个对象必有的内容,其中ob_refcnt就是作为引用计数。当一个对象有了新的引用时,它的ob_refcnt就会增加,引用它的对象被删除时则减少。一旦对象的引用计数为0,该对象立即被回收,占用空间就会被释放。优点简单易用实时
系统 2019-09-27 17:45:38 2468
1.浮点数的介绍float(浮点型)是Python基本数据类型中的一种,Python的浮点数类似数学中的小数和C语言中的double类型;2.浮点型的运算浮点数和整数在计算机内部存储的方式是不同的,整数运算永远是精确的,然而浮点数的运算则可能会有四舍五入的误差。比如观察以下运算,在数学中很容易得出结果应该是0.8965,而使用程序运算得出的结果却是:0.8965000000000001;a=1.25b=0.3535print(a-b)#输出:0.89650
系统 2019-09-27 17:38:29 2468