接下来准备用糗百做一个爬虫的小例子。但是在这之前,先详细的整理一下Python中的正则表达式的相关内容。正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。一、正则表达式基础1.1.概念介绍正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。它拥有自己独特的语法以及一个独立的处理引擎,在提供了正则表达式的语言里,正则表达
系统 2019-09-27 17:54:47 2020
Python数据科学入门DmitryZinoviev著熊子源译第二章数据科学的Python核心第4单元理解基本的字符串函数大小写转换函数:lower()将所有字符转换为小写upper()将所有字符转换为大写capitalize()将第一个字符转换为大写,同时将后面的字符都转化为小写(这些操作都不会影响其他非字母字符)字符串判定函数:islower()判断字符串中的所有字母是否都是小写isupper()判断字符串中的所有字母是否都是大写isspace()检查
系统 2019-09-27 17:53:59 2020
原文链接:https://www.liaoxuefeng.com/wiki/1016959663602400/1017075323632896注:本篇博客是学习廖雪峰老师网站的摘抄,是为了方便以后的学习。如有侵权,请联系删除!联系邮箱:1103540209@qq.com文章目录1.字符编码2.Python的字符串3.格式化format()4.小结5.参考1.字符编码我们已经讲过了,字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题。因为计算机
系统 2019-09-27 17:52:40 2020
阅读更多本文分享自6丁一的猫的博客,主要是python调用hanlp进行命名实体识别的方法介绍。以下为分享的全文。1、python与jdk版本位数一致2、pipinstalljpype1(python3.5)3、类库hanlp.jar包、模型data包、配置文件hanlp.properties放在一个新建目录4、修改hanlp.properties中root根目录,找到data代码调用如下:1|#coding:utf-82|'''3|Createdon20
系统 2019-09-27 17:52:23 2020
有时网页中会嵌套一个或者多个Frame,此时我们直接去找嵌套在Frame里面的元素会抛出异常,所以在操作的时候我们需要将页面焦点切换到Frame里面,下面我们就以一个实例演示一下!首先先创建三个html文件,文件代码如下:1)frameset.html2)frame_left.html3)frame_right.html4)frame_middle.html5)把这四个html文件放在同一个文件夹下<以下是python实现该逻辑的代码:importunit
系统 2019-09-27 17:50:57 2020
今天来介绍一下Python解释器包含的一系列的内置函数,下面表格按字母顺序列出了内置函数:下面就一一介绍一下内置函数的用法:1、abs()返回一个数值的绝对值,可以是整数或浮点数等。print(abs(-18))print(abs(0.15))result:180.152、all(iterable)如果iterable的所有元素不为0、''、False或者iterable为空,all(iterable)返回True,否则返回False。print(all(
系统 2019-09-27 17:50:56 2020
是不是已经很有感觉,Python你觉得自己可以做点简单的事情了?恭喜了。(还不行?重新看看1-6课时,另外请我吃饭,慢慢教你也可以)本课,我们说bool-布尔;只有2种情况真/假;或者叫0/1;或者True/Flase在python中True/Flase第1个字母都是大写,为什么?规定。。。。。。你写了true报错,别要说我无跟你说;其次bool用在什么场景?条件判断的时候,好像if或while的情况,都需要如果为真,就如何的场景:name="samly7
系统 2019-09-27 17:50:37 2020
本文实例讲述了Python使用微信itchat接口实现查看自己微信的信息功能。分享给大家供大家参考,具体如下:itchat是python的一个api,可以访问自己的微信信息,功能还蛮好玩的,可以扒取朋友信息,自动回复短信等等。package:itchat1.3.10+python3.5+wordcloud1.4.1登录登出:itchat.login()#hotReload设置为True,可以保持一段时间登录itchat.autologin(hotReloa
系统 2019-09-27 17:50:35 2020
python2和python3实现在图片上加汉字,最主要的区别还是内部编码方式不一样导致的,在代码上表现为些许的差别。理解了内部编码原理也就不会遇到这些问题了,以下代码是在WIN10系统上时测好用的。Python2在图片上加汉字代码实现#-*-coding:cp936-*-importcv2importnumpyasnpfromPILimportImage,ImageDraw,ImageFontdefID_2_Word(txt):tmp_ID=txt.sp
系统 2019-09-27 17:50:33 2020
经历移植jinja2到python3的痛苦之后,我把项目暂时放一放,因为我怕打破python3的兼容。我的做法是只用一个python2的代码库,然后在安装的时候用2to3工具翻译成python3。不幸的是哪怕一点点的改动都会打破迭代开发。如果你选对了python的版本,你可以专心做事,幸运的避免了这个问题。来自MoinMoin项目的ThomasWaldmann通过我的python-modernize跑jinja2,并且统一了代码库,能同时跑python2,
系统 2019-09-27 17:49:06 2020