Python

Python+sklearn机器学习应该了解的33个基本概念

机器学习(MachineLearning)根据已知数据来不断学习和积累经验,然后总结出规律并尝试预测未知数据的属性,是一门综合性非常强的多领域交叉学科,涉及线性代数、概率论、逼近论、凸分析、算法复杂度理论等多门学科。目前机器学习已经有了十分广泛的应用,例如数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。总体上说,机器学习算法和问题可以分为有监督学习和无

系统 2019-09-27 17:53:49 2102

Python

Python爬虫实战之爬取糗事百科段子

首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把,这次我们尝试一下用爬虫把他们抓取下来。友情提示糗事百科在前一段时间进行了改版,导致之前的代码没法用了,会导致无法输出和CPU占用过高的情况,是因为正则表达式没有匹配到的缘故。现在,博主已经对程序进行了重新修改,代码亲测可用,包括截图和说明,之前一直在忙所以没有及时更新,望大家海涵!糗事百科又又又又改版了,博主已经没心再去一次次匹配它了,如果大家遇到长时间运行不出结果也不报错的情况,请大家参考最新

系统 2019-09-27 17:52:43 2102

Python

Python字典遍历的几种方法

转https://www.cnblogs.com/ducklu/p/8943903.html1.遍历key值1>>>d={'Python':'astonishing','C++':'complicated','Java':'versatile'}2>>>forkeyind:3...print(key+':'+d[key])4...5Python:astonishing6C++:complicated7Java:versatile同理,可把下列代码的d改为d

系统 2019-09-27 17:52:37 2102

Python

Python Web框架Flask中使用百度云存储BCS实例

对于部署在百度应用引擎BAE上的项目,使用百度云存储BCS(BaiduCloudStorage)是不错的存储方案。百度云存储已有PythonSDK,对它进行简单封装后,就可以直接在Flask中使用了,项目代码见GitHub上Flask-BCS。使用示例代码:复制代码代码如下:fromflaskimportFlaskfromflask_bcsimportBCSBCS_HOST='BCSHOST'BCS_ACCESS_KEY='BCSAccessKey'BCS

系统 2019-09-27 17:52:25 2102

Python

Python之装饰器

功能:为已存在的函数或对象添加额外的功能原则:不改变源代码为其添加功能不改变函数的调用方式方法:装饰器=高阶函数+嵌套函数(高阶函数:一个函数可以作为参数传递给另外一个函数,或者,一个函数的返回值是一个函数,即函数的入口地址)函数名作为参数传递给装饰器(@decorator_name)装饰函数返回函数名(函数地址)注意:默认情况下,装饰器会修改名字和文档说明,但是可以使用functools中的@wraps()解决。@wraps接受一个函数来进行装饰,并加入

系统 2019-09-27 17:51:46 2102

Python

Python 抓取微信公众号账号信息的方法

搜狗微信搜索提供两种类型的关键词搜索,一种是搜索公众号文章内容,另一种是直接搜索微信公众号。通过微信公众号搜索可以获取公众号的基本信息及最近发布的10条文章,今天来抓取一下微信公众号的账号信息爬虫首先通过首页进入,可以按照类别抓取,通过“查看更多”可以找出页面链接规则:importrequestsasreqimportrereTypes=r'id="pc_\d*"uigs="(pc_\d*)">([\s\S]*?)'Entry="http://weixin

系统 2019-09-27 17:51:38 2102

Python

Python3快速入门

Python3快速入门Python3快速入门(一)——Python简介https://blog.51cto.com/9291927/2385592Python3快速入门(二)——Python3基础https://blog.51cto.com/9291927/2409575Python3快速入门(三)——Python3标准数据类型https://blog.51cto.com/9291927/2409580Python3快速入门(四)——Python包管理ht

系统 2019-09-27 17:51:28 2102

Python

python 缺失值处理的方法(Imputation)

一、缺失值的处理方法由于各种各样的原因,真实世界中的许多数据集都包含缺失数据,这些数据经常被编码成空格、nans或者是其他的占位符。但是这样的数据集并不能被scikit-learn算法兼容,因为大多数的学习算法都会默认数组中的元素都是数值,因此素偶有的元素都有自己的代表意义。使用不完整的数据集的一个基本策略就是舍弃掉整行或者整列包含缺失值的数值,但是这样处理会浪费大量有价值的数据。下面是处理缺失值的常用方法:1.忽略元组当缺少类别标签时通常这样做(假定挖掘

系统 2019-09-27 17:50:59 2102

Python

浅析Python 3 字符串中的 STR 和 Bytes 有什么区别

Python2的字符串有两种:str和Unicode,Python3的字符串也有两种:str和Bytes。Python2的str相当于Python3的Bytes,而Unicode相当于Python3的Bytes。Python2里面的str和Unicode是可以混用的,在都是英文字母的时候str和unicode没有区别。而Python3严格区分文本(str)和二进制数据(Bytes),文本总是Unicode,用str类型,二进制数据则用Bytes类型表示,这

系统 2019-09-27 17:50:25 2102

Python

从 Python 之父的对话聊起,关于知识产权、知识共享与文章翻译

一、缘起前不久,我在翻译GuidovanRossum(Python之父)的文章时,给他留言,申请非商业用途的翻译授权。过程中起了点小误会,略去不表,最终的结果是:他的文章以CCBY-NC-SA4.0许可协议进行授权。部分对话如下:CC协议是一种授权许可协议,我曾看到过几次,但了解不多,所以便查阅了相关的内容。本文主要是作个记录,既是加深自己的理解,也给有需要的同学一个参考。二、著作权、著佐权与自由版权对于知识产权,通常有如下几种说法:AllRightsRe

系统 2019-09-27 17:50:18 2102

Python

Python配置文件解析模块ConfigParser使用实例

一、ConfigParser简介ConfigParser是用来读取配置文件的包。配置文件的格式如下:中括号“[]”内包含的为section。section下面为类似于key-value的配置内容。复制代码代码如下:[db]db_host=127.0.0.1db_port=22db_user=rootdb_pass=rootroot[concurrent]thread=10processor=20中括号“[]”内包含的为section。紧接着section为

系统 2019-09-27 17:50:05 2102

Python

python3.6生成器yield用法实例分析

本文实例讲述了python3.6生成器yield用法。分享给大家供大家参考,具体如下:今天看源码的时候看到了一个比较有意思的函数:yield功能与return类似,都是返回定义的函数的一个结果,不同的是return返回后这次调用函数就结束了,除了返回值,其余临时变量都会被清除。而yield会停止在当前步,并保留其余变量的值,等下次调用该函数时,从yield的下一步继续往下运行。yield的好处是如果函数需要很大的内存,比方说需要计算并返回一个很大的数列,如

系统 2019-09-27 17:49:49 2102

Python

python学习 第二天

一、运算符1、算术运算符:+-*///**%+加两个数相加1+2=3-减两个数相减3-1=2*乘两个数相乘1*2=2/除两个数相除5/2=2.5//整除两个数相除得到整数5//2=2**幂幂次方2**3=8%取余两个数的余数5%2=1(可以用来判断奇偶数取余为0的时候为偶数取余为1的时候为奇数)2、比较运算符:>、<、>=、<=、==、!=结果只有真假truefalse为bool类型3、赋值运算符:+=-=*=/=//=%=**=num+=1等价于num=

系统 2019-09-27 17:49:47 2102

Python

快速排序(python)

2.快速排序2.1算法思想快速排序是对冒泡排序的一种改进。通过一次排序(设要排序的数组是A[0]……A[N-1],首先任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它左边,所有比它大的数都放到它右边,这个过程称为一次快速排序)将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。快速排序的

系统 2019-09-27 17:49:43 2102

Python

python之模块和包

一Python模块简介1模块化一般来说,编程语言中,库,包,模块是同一种概念,是代码组织方式python中只有一种模块对象类型,但是为了模块化组织的便利,提供了一个概念:包模块(module):指的是python的源代码文件包(package):指的是模块组织在一起放入和包名同名的目录及相关文件可以将代码量较大的程序分割成多个有组织,彼此间独立但又能互相交互的代码片段,这些自我包含的有组织的代码段就是模块模块在物理形式上表现为以.py结尾的代码文件一个文件

系统 2019-09-27 17:49:43 2102