python字符串替换可以用2种方法实现:1是用字符串本身的方法。2用正则来替换字符串下面用个例子来实验下:a=‘helloword’把a字符串里的word替换为python1、用字符串本身的replace方法1a.replace(‘word’,‘python’)输出的结果是hellopython2、用正则表达式来完成替换1importre2strinfo=re.compile(‘word’)3b=strinfo.sub(‘python’,a)4print
系统 2019-09-27 17:53:40 2133
基础篇JupyterNotebook优点整合所有的资源交互性编程体验零成本重现结果实践站点Jupyter官方GoogleResearch提供的Colab环境安装运行列表与元组列表和元组,都是一个可以放置任意数据类型的有序集合。l=[1,2,'hello','world']#列表中同时含有int和string类型的元素l[1,2,'hello','world']tup=('jason',22)#元组中同时含有int和string类型的元素tup('jason
系统 2019-09-27 17:50:12 2133
一.概述首先需要先介绍一下无监督学习,所谓无监督学习,就是训练样本中的标记信息是位置的,目标是通过对无标记训练样本的学习来揭示数据的内在性质以及规律。通俗得说,就是根据数据的一些内在性质,找出其内在的规律。而这一类算法,应用最为广泛的就是“聚类”。聚类算法可以对数据进行数据归约,即在尽可能保证数据完整的前提下,减少数据的量级,以便后续处理。也可以对聚类数据结果直接应用或分析。而Kmeans算法可以说是聚类算法里面较为基础的一种算法。二.从样例开始我们现在在
系统 2019-09-27 17:50:00 2133
作者:chen_h微信号&QQ:862251340微信公众号:coderpai(一)机器学习中的集成学习入门(二)bagging方法(三)使用Python进行交易的随机森林算法(四)Python中随机森林的实现与解释(五)如何用Python从头开始实现Bagging算法(六)如何利用Python从头开始实现随机森林算法介绍随机森林是集成学习中一个主要的算法。简而言之,集成方法是一种将几个弱学习器的预测结果进行组合,最终形成一个强学习器的方法。可以直观的猜测
系统 2019-09-27 17:48:27 2133
从一篇文章中看到,PIL1.1.5已经内置了高斯模糊,但是并没有在文档中提及,而且PIL的高斯模糊中radius是硬编码,虽然构造方法中有传入radius参数,但压根就没有用到(看这里),所以需要自己进行改造,当然,知道了原因,修改起来自然非常简单了。结合帖子中的需求,对局部进行高斯模糊,所以还需要结合使用crop和paste方法实现局部使用滤镜。代码如下:#-*-coding:utf-8-*-fromPILimportImage,ImageFilterc
系统 2019-09-27 17:48:09 2133
定义代码如下importredisimportcontextlibimportpickleimportos,socket,threadingclassRedisLock:def__init__(self,lock_name,host='',port=6379,db=0):self.lock_name=lock_nameself.redis=redis.Redis(connection_pool=redis.ConnectionPool(host=host,
系统 2019-09-27 17:47:23 2133
概述在我们使用内置打印函数print时,打印出的Python数据结构对象总是一行的输出的方式,这样对数据结构较复杂或数据较多的对象的显示并不美观,这时我们可以利用pprint输出美化数据结构对象。pprint方法概览美化输出我们可以利用pprint中的PrettyPrinter控制输出的打印时的缩进,行宽、甚至打印深度等,定义类如下classpprint.PrettyPrinter(indent=1,width=80,depth=None,stream=N
系统 2019-09-27 17:45:58 2133
【import模块】和C中的#include不同,Python中的import语句并不是简单的把一个文件插入另外一个文件。导入其实是运行时的运算,程序第一次导入指定文件时,会执行以下步骤,1.找到模块文件2.编译成位码3.执行模块中的代码来创建所定义的模块并生成.pyc字节码文件,这三个步骤只在程序执行时,模块第一次导入时会进行。之后导入相同的模块时,会跳过这三个步骤,而只提取内存中已加载的模块对象,速度要快的多。NOTE:1.Python把已加载的模块放
系统 2019-09-27 17:45:52 2133
一、什么是Selenium?Selenium是一个基于浏览器的自动化测试工具,它提供了一种跨平台、跨浏览器的端到端的web自动化解决方案。Selenium主要包括三部分:SeleniumIDE、SeleniumWebDriver和SeleniumGrid。SeleniumIDE:Firefox的一个扩展,它可以进行录制回放,并把录制的操作以多种语言(例如java、python等)的形式导出成测试用例。SeleniumWebDriver:提供Web自动化所需
系统 2019-09-27 17:45:45 2133
近几日遇到采集某网页的时候大部分网页OK,少部分网页出现乱码的问题,调试了几日,终于发现了是含有一些非法字符造成的..特此记录1.在正常情况下..可以用importchardetthischarset=chardet.detect(strs)["encoding"]来获取该文件或页面的编码方式或直接抓取页面的charset=xxxx来获取2.遇到内容中有特殊字符时指定的编码一样会造成乱码..即内容中非法字符造成的,可以采用编码忽略非法字符的方式来处理.st
系统 2019-09-27 17:38:01 2133