Python

从头实现主成分分析(PCA)--Python

主成分分析是一种常用的降维方法,多见于数据预处理阶段,其伪代码如下:输入:样本数据集D={x1,x2,x3,x4},低空间维度数d'过程:1对所有样本进行中心化(每个特征维度都减去其均值)2计算所有样本的协方差矩阵3对协方差矩阵进行特征分解4取最大的d'个特征值的对应特征向量w1,w2,w3输出:投影矩阵W*=(w1,w2,wd')下面是其代码实现:首先是产生数据,我们使用sklearn的make_blobs方法产生三类数据,每类有三个特征。数据结构是(n

系统 2019-09-27 17:53:00 2267

Python

Python实现Selenium自动化Page模式

Selenium是当前主流的web自动化工具,提供了多种浏览器的支持(Chrome,Firefox,IE等等),当然大家也可以用自己喜欢的语言(Java,C#,Python等)来写用例,很容易上手。当大家写完第一个自动化用例的时候肯定感觉”哇...好牛x“,但是大家用余光扫了一下代码后,内心也许是崩溃的,因为太乱了!像这样:__author__='xua'fromseleniumimportwebdriverfromselenium.webdriver.c

系统 2019-09-27 17:52:50 2267

Python

《Python编程从入门到实践》笔记

阅读时间:2019.08.25----2019.08.30:第一部分基础知识。第2章:变量1、变量的命名和使用变量名只能包含字母、数字和下划线。可以字母或者下划线打头,但不能以数字打头。例如:可以为message_1,不能为1_message。变量名不能包含空格,但可使用下划线分隔。例如:变量名greeting_message,不能为greetingmessage。不能用Python关键字和函数名作为变量名。慎用小写字母l和大写字母O。2、字符串用引号括起

系统 2019-09-27 17:48:19 2267

Python

使用Python实现图像标记点的坐标输出功能

Sometimeswehaveneedtointeractwithanapplication,forexamplebymarkingpointsinanimage,oryouneedtoannotationsometrainingdata.PyLabcomeswithasimplefunctionginput()thelet'syoudojustthat.Here'sashortexample.fromPILimportImagefrompylabimpo

系统 2019-09-27 17:57:02 2266

Python

知识篇: 面向对象开发原则.高内聚.低耦合+Python安装详细教程

面系那个对象开发原则.高内聚.低耦合软件设计中通常用耦合度和内聚度作为衡量模块独立程度的标准。划分摸块的一个准则就是高内聚低耦合。这是软件工程中的概念,是判断设计好坏的标准,主要是面向OO的设计,主要是看类的内聚性是否高,偶合度是否低.每一个类完成特定的独立的功能,这个就是高内聚。耦合就是类之间的互相调用关系,如果耦合很强,互相牵扯调用很多,那么会牵一发而动全身,不利于维护和扩展。类之间的设置应该要低耦合,但是每个类应该要高内聚.耦合是类之间相互依赖的尺度

系统 2019-09-27 17:56:27 2266

Python

详解python pandas 分组统计的方法

首先,看看本文所面向的应用场景:我们有一个数据集df,现在想统计数据中某一列每个元素的出现次数。这个在我们前面文章《如何画直方图》中已经介绍了方法,利用value_counts()就可以实现(具体回看文章)但是,现在,我们考虑另外一个场景,我们假如要想统计其中两列元素出现次数呢?举个栗子:在df数据集中,如果我们想统计A、B两列的元素的出现情况,也就是说,得到如下表。从上面的最后一列可以看到,在A、B两列中,12出现了2次,14出现1次,16出现1次,23

系统 2019-09-27 17:54:01 2266

Python

Python标准库之sqlite3使用实例

Python自带一个轻量级的关系型数据库SQLite。这一数据库使用SQL语言。SQLite作为后端数据库,可以搭配Python建网站,或者制作有数据存储需求的工具。SQLite还在其它领域有广泛的应用,比如HTML5和移动端。Python标准库中的sqlite3提供该数据库的接口。我将创建一个简单的关系型数据库,为一个书店存储书的分类和价格。数据库中包含两个表:category用于记录分类,book用于记录某个书的信息。一本书归属于某一个分类,因此boo

系统 2019-09-27 17:53:53 2266

Python

python多线程共享变量的使用和效率方法

python多线程可以使任务得到并发执行,但是有时候在执行多次任务的时候,变量出现“意外”。importthreading,timen=0start=time.time()defb1(num):globalnn=n+numn=n-numdefb2(num):foriinrange(1000000):b1(num)t1=threading.Thread(target=b2,args=(5,))t2=threading.Thread(target=b2,arg

系统 2019-09-27 17:51:27 2266

Python

Python字典(Dictionary)序列化和反序列化

最近在项目中遇到把字典类型的数据保存文件,在另一个模块又把文件中的内容转换为字典的需求,在这里记录一下。字典保存成文件importpickledata=dict(key="aaa",val=22)withopen("data.txt","wb")asf:pickle.dump(data,f)文件读取为字典importpickledata={}withopen("data.txt","rb")asf:data=pickle.load(f)print(data

系统 2019-09-27 17:51:02 2266

Python

LeetCode:翻转链表||(python)

1.题目描述反转从位置m到n的链表。请使用一趟扫描完成反转。说明:1≤m≤n≤链表长度。示例:输入:1->2->3->4->5->NULL,m=2,n=4输出:1->4->3->2->5->NULL2.思路题目要求一趟遍历。处理链表的题,一般会生成一个dummyNode,使得dummyNode指向链表的头结点。另外需要先定位到要反转链表的开始节点,并标记开始节点的前一节点,使得在翻转的过程中,始终能找到这一节点。假设要反转的链表段如下:1—>2—>3翻转过

系统 2019-09-27 17:50:18 2266

Python

Python正则表达式和re库知识点总结

正则表达式是定义搜索模式的字符序列。通常这种模式被字符串搜索算法用于字符串上的“查找”或“查找和替换”操作,或者用于输入验证。1.正则表达式的语法.表示任何单个字符[]字符集,对单个字符给出取值范围[^]非字符集,对单个字符给出排除范围*前一个字符0次或者无限次扩展+前一个字符1次或无限次扩展?前一个字符0次或1次扩展|左右表达式任意一个{m}扩展前一个字符m次{m,n}扩展前一个字符m至n次^匹配字符串开头$匹配字符串结尾()分组标记,内部只能使用|操作

系统 2019-09-27 17:49:57 2266

Python

【python入门学习】Selenium库的使用

一、什么是Seleniumselenium是一套完整的web应用程序测试系统,包含了测试的录制(seleniumIDE),编写及运行(SeleniumRemoteControl)和测试的并行处理(SeleniumGrid)。Selenium的核心SeleniumCore基于JsUnit,完全由JavaScript编写,因此可以用于任何支持JavaScript的浏览器上。selenium可以模拟真实浏览器,自动化测试工具,支持多种浏览器,爬虫中主要用来解决J

系统 2019-09-27 17:49:29 2266

Python

对Python函数设计规范详解

Python函数的设计规范1、Python函数设计时具备耦合性和聚合性1)、耦合性:(1).尽可能通过参数接受输入,以及通过return产生输出以保证函数的独立性;(2).尽量减少使用全局变量进行函数间通信;(3).不要在函数中直接修改可变类型的参数;(4).避免直接改变定义在另外一个模块中的变量;2)、聚合性:(1).每个函数都应该有一个单一的、目的统一的目标;(2).每个函数的功能都应该相对简单;2、Python函数在脚本中应用示例例1:将/etc/p

系统 2019-09-27 17:49:05 2266

Python

基于Python实现对PDF文件的OCR识别

最近在做一个项目的时候,需要将PDF文件作为输入,从中输出文本,然后将文本存入数据库中。为此,我找寻了很久的解决方案,最终才确定使用tesseract。所以不要浪费时间了,我们开始吧。1.安装tesseract在不同的系统中安装tesseract非常容易。为了简便,我们以Ubuntu为例。在Ubuntu中你仅仅需要运行以下命令:这将会安装支持3种不同语言的tesseract。2.安装PyOCR现在我们还需要安装tesseract的Python接口。幸运的是

系统 2019-09-27 17:37:44 2266

Python

python学习036-----python之文件(一):文件的读取和写入

【打开文件】我们使用open()函数来打开文件,并返回文件对象。open()的参数有很多,如下:这些参数中的第一、二个参数是重点。第一个参数是传入文件名:若只有文件名,不带路径的话,python会在当前路径下查找该文件并打开。第二个参数是文件的打开模式:其有以下几种参数:===========================================================1.r以只读方式打开文件(默认)。2.w以写入的方式打开文件,会覆盖已

系统 2019-09-27 17:56:34 2265