天在刷题的时候用到了正则,用的过程中就感觉有点不太熟练了,很久没有用正则都有点忘了。所以现在呢,我们就一起来review一下python中正则模块re的用法吧。今天是review,所以一些基础的概念就不做介绍了,先来看正则中的修饰符以及它的功能:修饰符•re.I使匹配对大小写不敏感•re.L做本地化识别匹配•re.M多行匹配,影响^和$•re.S使.匹配包括换行在内的所有字符•re.U根据Unicode字符集解析字符.这个标志影响\w\W\b\B•re.X
系统 2019-09-27 17:55:26 2533
声明:代码的运行环境为Python3。Python3与Python2在一些细节上会有所不同,希望广大读者注意。本博客以代码为主,代码中会有详细的注释。相关文章将会发布在我的个人博客专栏《Python从入门到深度学习》,欢迎大家关注~K-Means算法、K-Means++算法以及MeanShift算法都是基于距离的聚类算法,一般此类聚类的聚类结果都是球状的簇,但当聚类结果是非球状的时候,基于距离聚类的聚类算法得到的聚类结果并不是那么的好,然而,基于密度的聚类
系统 2019-09-27 17:52:43 2533
使用流程:-导包:frombs4importBeautifulSoup-使用方式:可以将一个html文档,转化为BeautifulSoup对象,然后通过对象的方法或属性去查找指定的节点内容。(1)转化本地文件:-soup=BeautifulSoup(open(‘本地文件’),‘lxml’)(2)转化网络文件(与requests配合):-page_text=requests.get(url=url,headers=headers).text-soup=Bea
系统 2019-09-27 17:52:15 2533
因为要将js的一个签名算法移植到python上,遇到一些麻烦。int无限宽度,不会溢出算法中需要用到了32位int的溢出来参与运算,但是python的int是不会溢出的,达到界限后会自己转为long,所以很麻烦。#使用-342686650:ret=123456789<<20print(ret)得到结果129453825982464print(bin(ret))这个二进制是1110101101111001101000101010000000000000000
系统 2019-09-27 17:51:46 2533
python一直被病垢运行速度太慢,但是实际上python的执行效率并不慢,慢的是python用的解释器Cpython运行效率太差。“一行代码让python的运行速度提高100倍”这绝不是哗众取宠的论调。我们来看一下这个最简单的例子,从1一直累加到1亿。最原始的代码:importtimedeffoo(x,y):tt=time.time()s=0foriinrange(x,y):s+=iprint('Timeused:{}sec'.format(time.t
系统 2019-09-27 17:38:37 2533
与python交互之前我们需要安装一个MySQL的驱动模块Connector,这个驱动模块直接在cmd命令行输入pipinstallmysql.connector安装是否成功可以接着输入python#输入之后,会进入python解释器(前提是python已经配置好了环境变量#导入安装的模块,没有报错即安装成功importmysql.connector进入自己的编辑器(pycharm)首先连接数据库方式:数据库连接1、当前模块直接连接importmysql.
系统 2019-09-27 17:50:55 2532
通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器(Generator)。简单生成器
系统 2019-09-27 17:50:14 2532
一、python线程的模块1.1thread和threading模块thread模块提供了基本的线程和锁的支持threading提供了更高级别、功能更强的线程管理的功能。1.2Queue模块Queue模块允许用户创建一个可以用于多个线程之间共享数据的队列数据结构。1.3注意模块的选择避免使用thread模块因为更高级别的threading模块更为先进,对线程的支持更为完善而且使用thread模块里的属性有可能会与threading出现冲突;其次低级别的th
系统 2019-09-27 17:48:47 2532
如下所示:importosimportsysimporttimeprocessNmae='parent'print"Programexecutingntpid:%d,processNmae:%s"%(os.gitpid(),processNmae)#attempttoforkchildprocesstry:forkPid=os.fork()exceptOSError:sys.exit("Unabletocreatenewprocess.")#AmIpare
系统 2019-09-27 17:48:16 2532
最后一次更新于2019/07/10ICMPPing目的此任务是重新创建第3讲(延迟,丢失和吞吐量)中讨论的ping客户端。Ping是一个用于在计算机网络中测量延迟和丢失的工具。在实际应用中,我们可以通过ping命令分析判断网络失败的原因。当然,这类信息也可用于帮助我们选择性能更佳的IP地址作为代理服务器。原理Ping通常使用Internet控制消息协议(ICMP)报文来测量网络中的延迟和丢失:本机在ICMP包中发送回响请求(ICMP类型代码为8)给另一个主
系统 2019-09-27 17:56:16 2531
CentOS7.2默认安装了python2.7.5因为一些命令要用它比如yum它使用的是python2.7.5。使用python-V命令查看一下是否安装Python然后使用命令whichpython查看一下Python可执行文件的位置python指向的是python2.7安装1.因为我们要安装python3版本,所以python要指向python3才行,目前还没有安装python3,先备份,备份之前先安装相关包,用于下载编译python3yuminstal
系统 2019-09-27 17:54:10 2531
faster-rcnn错误信息:tensorflow.python.framework.errors_impl.InvalidArgumentError:Assignrequiresshapesofbothtensorstomatch.lhsshape=[21]rhsshape=[2]1Traceback(mostrecentcalllast):2File"C:\Users\Administrator\AppData\Local\Programs\Pyth
系统 2019-09-27 17:51:07 2531
之前在公司做一个项目,项目需求是按照标签分类,去不同网站上爬取文章的内容,标题等。然后我就一个网站一个网站的去配xpath,可是网站特别多的时候,领导就会对我提出一个需求能不能,写一种程序然后用来解析所有的网站,也就是智能化解析。这对我一个刚刚做爬虫不久的新手就是很头疼了。于是各种网上找资料,于是发现了DIFFBOT这个东西。官网https://www.diffbot.com,注册后会有15天的免费使用的时间。注册后会发邮件给你一个token,通过toke
系统 2019-09-27 17:57:24 2530
一、明确学习方向全栈开发:就是web应用开发,是用来写网站后台的;数据分析:就是做大数据分析的,数据量级起码是千万级别的,做的是大数据分析;网络爬虫:其实属于数据分析的部分,就是获取数据源的方式;机器学习:这也是python最有魅力的地方,善于做图形分析,算法建模等等。二、找准学习目标转行就业为目的:那么建议学python全栈开发。python全栈目前是市场的需求量最大,入行也是最容易的。看重前景方向:那么学python大数据分析或是python机器学习。
系统 2019-09-27 17:55:43 2530
用python另一个抢票神器,你get到了吗?2017年时间飞逝,转眼间距离2018年春节还有不到1个月的时间,还在为抢不到火车票发愁吗?作为程序员的我们撸一个抢票软件可好?难以想象的数据,预示着今年春运回程和返程车票购买难度将进一步加大…抢购车票怕是比李白跨越“蜀道”的难度还大哦~当你想查询一下火车票信息的时候,还在为打开无响应的12306官网和广告n秒的APP吗而懊恼吗?不如用Python写一个命令行版的火车票查看器,只要在命令行敲一行命令就能获得你想
系统 2019-09-27 17:52:28 2530