最近因为想要看漫画,无奈下载的漫画是jpg的格式,网上的转换器还没一个好用的,于是乎就打算用python自己DIY一下:这里主要用了reportlab。开始打算随便写几行,结果为若干坑纠结了挺久,于是乎就想想干脆把代码写好点吧。实现了以下的几项功能:将当前文件夹下的图片保存到一个pdf中,支持选择pdf大小等如果有需要可以遍历它下面的所有文件夹简单的来说完全满足我将漫画转成pdf格式的需求了。碰到了一些问题,这里记录下:一、中文路径:这个实在是略蛋疼,总之
系统 2019-09-27 17:52:39 2269
2019年7月15日17:24:49地点:武汉本人小白一枚记录一下学python的一点心得,主要记录python的基本数据类型。python基本数据类型包括:int(整型),float(浮点型),complex(复数),string(字符串),dict(字典),list(列表),tuple(元祖),set(集合),bool(布尔值)。记住查看数据类型时用type函数查看即可。int—整型a=0print(type(a))b=1**8#**表示乘方的意思,即
系统 2019-09-27 17:51:36 2269
何为标准化:在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。数据标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。数据无量纲化处理主要解决数据的可比性。几种标准化方法:归一化Ma
系统 2019-09-27 17:50:12 2269
个人理解这里的规范化处理指对提取后的特征集进行处理,不是对原始的数据信号进行处理,包括归一化和标准化。规范化的原因:不同特征具有不同量级时会导致:a.数量级的差异将导致量级较大的特征占据主导地位;b.数量级的差异将导致迭代收敛速度减慢;c.依赖于样本距离的算法对于数据的数量级非常敏感。归一化:,也就是原数据减去该特征列最小值,再除以该特征列的极差,将属性缩放到[0,1]之间。标准化:,也就是原数据减去该特征列的均值,再除以该特征列的标准差。注意:1.所谓规
系统 2019-09-27 17:48:10 2269
1、环境说明Windows7,Anconda+Python3.5.2,64位系统。2、开始安装pipinstallpyinstall安装成功,一切看起来很顺利,但实际上当你运行打包代码的时候,可能出现如下问题pyinstaller-Ftest.pyAttributeError:'str'objecthasnoattribute'items'通过网上查找资料,很快就解决了,原来是setuptools没有安装。看到有篇文章里写到报错虽然是在最后一行,但问题却是
系统 2019-09-27 17:48:03 2269
面向对象的语言有对象。对象是状态和行为的组合。对象需要访问自己的状态。这样做基本上有两个主要选择。要么你明确地说你何时访问一个对象的状态(通过self,this或者其他类似的东西),或者语言会为你找出。让我先讨论后一种情况。存在名称冲突的问题。例如,如果对象的数据成员与方法参数的名称匹配,或者如果声明与数据成员的名称匹配的局部变量,会发生什么。您要么不允许这种情况,要么具有某种解决机制。Smalltalk是一个像这样工作的语言的例子,但我不记得语言是如何处
系统 2019-09-27 17:55:44 2268
1.安装2.操作一个简单的Excel文档操作注释及代码:操作完成后,数据存储结果如下:3.操作简单Excel文档并添加数据格式操作代码如下:附带数据格式的定义操作效果如图所示:4.Excel中添加不同类型的数据操作代码如下:将不同的数据按照指定的格式添加到文件中代码执行结果如下:注意:xlsxwriter中提供了向excel中写入数据的多种方式,如下:write_string()【https://xlsxwriter.readthedocs.io/work
系统 2019-09-27 17:54:14 2268
一,分析代码运行时间第1式,测算代码运行时间平凡方法快捷方法(jupyter环境)第2式,测算代码多次运行平均时间平凡方法快捷方法(jupyter环境)第3式,按调用函数分析代码运行时间平凡方法快捷方法(jupyter环境)第4式,按行分析代码运行时间平凡方法快捷方法(jupyter环境)二,加速你的查找第5式,用set而非list进行查找低速方法高速方法第6式,用dict而非两个list进行匹配查找低速方法高速方法三,加速你的循环第7式,优先使用for循
系统 2019-09-27 17:52:26 2268
1.简介在编写代码时,往往涉及时间、日期、时间戳的相互转换。2.引入模块#引入模块importtime,datetime2.1str类型的日期转换为时间戳利用strptime()函数将时间转换成时间数组利用mktime()函数将时间数组转换成时间戳#字符类型的时间tss1='2013-10-1023:40:00'#转为时间数组timeArray=time.strptime(tss1,"%Y-%m-%d%H:%M:%S")printtimeArray#tim
系统 2019-09-27 17:50:41 2268
上一篇我们讲了关联分析的几个概念,支持度,置信度,提升度。以及如何利用Apriori算法高效地根据物品的支持度找出所有物品的频繁项集。Python--深入浅出Apriori关联分析算法(一)这次呢,我们会在上次的基础上,讲讲如何分析物品的关联规则得出关联结果,以及给出用apyori这个库运行得出关联结果的代码。一.基础知识上次我们介绍了几个关联分析的概念,支持度,置信度,提升度。这次我们重点回顾一下置信度和提升度:置信度(Confidence):置信度是指
系统 2019-09-27 17:50:15 2268
上一篇文章中我们介绍了python语言的几个特点,并在最后留了一个问题,python除了上下执行以外有没有其他的执行方式。今天我们就来介绍python中的数据类型和控制流。数据类型python中包含六个标准数据类型分别为:Number(数字)、String(字符串)、List(列表)、Tuple(元组)、Set(集合)、Dictionary(字典)。不同的数据类型往往对应不同的用途。这个很好理解。比如你可以用一个字符串用来储存一个人的名字。name="六小
系统 2019-09-27 17:48:08 2268
简介提到爬虫,大部分人都会想到使用Scrapy工具,但是仅仅停留在会使用的阶段。为了增加对爬虫机制的理解,我们可以手动实现多线程的爬虫过程,同时,引入IP代理池进行基本的反爬操作。本次使用天天基金网进行爬虫,该网站具有反爬机制,同时数量足够大,多线程效果较为明显。技术路线IP代理池多线程爬虫与反爬编写思路首先,开始分析天天基金网的一些数据。经过抓包分析,可知:./fundcode_search.js包含所有基金的数据,同时,该地址具有反爬机制,多次访问将会
系统 2019-09-27 17:57:51 2267
一、string模块常用函数ascii_letters获取所有ascii码中字母字符的字符串(包含大写和小写)ascii_uppercase获取所有ascii码中的大写英文字母ascii_lowercase获取所有ascii码中的小写英文字母digits获取所有的10进制数字字符octdigits获取所有的8进制数字字符hexdigits获取所有16进制的数字字符printable获取所有可以打印的字符whitespace获取所有空白字符punctuati
系统 2019-09-27 17:51:11 2267
1|0使用yield完成多任务importtimedeftest1():whileTrue:print("--1--")time.sleep(0.5)yieldNonedeftest2():whileTrue:print("--2--")time.sleep(0.5)yieldNoneif__name__=="__main__":t1=test1()t2=test2()whileTrue:next(t1)next(t2)2|0使用greenlet完成多任务
系统 2019-09-27 17:47:31 2267
阅读更多#importourmodulesimportsys,timefromPySide.QtGuiimportQApplication,QMainWindow#ourMainWindow!!classMainWindow(QMainWindow):"""puffing!!construstourMainWindow"""def__init__(self,arg):super(MainWindow,self).__init__()self.arg=arg
系统 2019-09-27 17:47:16 2267