正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。Python自1.5版本起增加了re模块,它提供Perl风格的正则表达式模式。re模块使Python语言拥有全部的正则表达式功能。compile函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。re模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。本章节主要介绍Python中常用
系统 2019-09-27 17:54:25 2063
importnumpyasnpfromsklearn.datasetsimportload_irisiris=load_iris()#data=iris.data#print(data[0])#print(data[2])#print(type(iris.data))#print(iris.data.shape)#LenRow,LenColumn=iris.data.shape#print("LenRow={}".format(LenRow))#print
系统 2019-09-27 17:54:15 2063
一、协程协程,又叫微线程,纤程。英文名Coroutine。协程本质上就是一个线程优点1:协程极高的执行效率。因为子程序切换不是线程切换,而是由程序自身控制,因此,没有线程切换的开销,和多线程比,线程数量越多,协程的性能优势就越来越明显。(简单来说没有切换的消耗)优点2:不需要多线程的锁机制,因为只有一个线程,也不存在同时写变量冲突,在协程中控制共享资源不加锁,只需要判断状态就好,所以执行效率比多线程高很多。(没有锁的概念)因为协程是一个线程执行,那怎么利用
系统 2019-09-27 17:54:05 2063
Python之身份运算和None一、身份运算Python中有很多种数据类型,查看一个数据的类型的方法是type()name='Kwan'age=1print(type(name),type(age))判断一个数据类型是不是str,orint等,可以用身份运算符is运算符描述实例isis是判断两个标识符是不是引用自一个对象xisy,类似id(x)==id(y),如果引用的是同一个对象则返回True,否则返回Falseisnotisnot是判断两个标识符是不是
系统 2019-09-27 17:53:44 2063
原来字符为Abbeville(AL)USABBtrim(REVERSE(SUBSTRING(REVERSE('Abbeville(AL)USABB'),LOCATE('',REVERSE('Abbeville(AL)USABB')),LENGTH('Abbeville(AL)USABB'))))//结果为Abbeville(AL)原:SAMARINDA,KALIMANTA,INDONESIASELECTtrim(REVERSE(SUBSTRING(REVE
系统 2019-09-27 17:53:01 2063
前言刚开始开发Web的时候,没太在意隔离虚拟环境,用了系统的那一套,Python2.7版本是系统自带的,虽说明年就结束了,但是现在开发都会有一套3.x以上的环境,即使你开发不注意,你部署的时候总归是要隔离出来的。1.方便隔离,不同环境编写测试2.方便迁移,pipfreeze到出包文件依赖,随后提交管理和迁移都很方便virtualenv前提是你有两套PythonmikejingdeMacBook-Pro:~MKJ$whichpython/usr/bin/py
系统 2019-09-27 17:52:33 2063
介绍此教程为我的数篇文章中的一个重点。主题是魔术方法。什么是魔术方法?他们是面向对象的Python的一切。他们是可以给你的类增加"magic"的特殊方法。他们总是被双下划线所包围(e.g.__init__或者__lt__)。然而他们的文档却远没有提供应该有的内容。Python中所有的魔术方法均在Python官方文档中有相应描述,但是对于他们的描述比较混乱而且组织比较松散。很难找到有一个例子(也许他们原本打算的很好,在开始语言参考中有描述很详细,然而随之而来
系统 2019-09-27 17:52:15 2063
博主写了一个智联招聘的爬虫,只要输入职位关键字,就能快速导出智联招聘上的数据,存在excel表里~importrequests,openpyxl#建立excel表joblist=[]wb=openpyxl.Workbook()sheet=wb.activesheet.title='智联招聘数据'sheet['A1']='职位名称'sheet['B1']='薪资'sheet['C1']='工作经验'#爬虫keyword=str(input('请输入查找职位的
系统 2019-09-27 17:49:32 2063
一、写在前面在上一篇博客中提到过对于网络爬虫这种包含大量网络请求的任务,是可以用Celery来做到加速爬取的,那么,这一篇博客就要具体说一下怎么用Celery来对我们的爬虫进行一个加速!二、知识补充1.classcelery.groupgroup这个类表示创建一组要并行执行的任务,不过一组任务是懒惰的,所以你需要运行并对其进行评估。要了解这个类,可以查看文档,或者在Pycharm中直接Ctrl+左键就能直接查看源码了,如下图:当然了,直接看源码还不够,最好
系统 2019-09-27 17:48:01 2063
前言:自动化测试存在比较多的使用限制,会存在某段时间无法使用的生疏期。通过这篇文章记录项目编写程序中遇到的问题以及解决思路,希望对以后的自动化开发能有些帮助。本篇记录5个问题:问题1:如何激活pycharm问题2.搭建selenium+unittest开发环境问题3:显示等待、隐式等待理解错误问题4:格式化字符串方法问题5:某一步页面无法响应,如何保证自动化程序能够继续运行,不受报错影响问题1:如何激活pycharm:网上找的攻略,想在已经激活了,但是忘了
系统 2019-09-27 17:47:48 2063