拥有Python标签的文章
Python

python 爬取boss直聘招聘信息实现

1、一些公共方法的准备获取数据库链接:importpymysql'''遇到不懂的问题?Python学习交流群:821460695满足你的需求,资料都已经上传群文件,可以自行下载!'''#获得数据库链接对象defgetConnect(database):DATABASE={'host':'localhost','database':database,'user':'root','password':'123456'}returnpymysql.connect

系统 2019-09-27 17:51:26 2310

Python

Python.numpy中常用的几种产生随机数的方法

在利用numpy时,经常会用到随机数。这里将几种常用的容易混淆的用法进行总结。分别是:np.random.randint(low,high,size,dtype)numpy.random.rand(d0,d1,…,dn)np.random.randnrandom_sample(size)numpy.random.random([size])numpy.random.ranf([size])numpy.random.sample([size])具体使用直接上

系统 2019-09-27 17:50:23 2310

Python

Python多进程并发操作中进程池Pool的应用

在利用Python进行系统管理的时候,特别是同时操作多个文件目录,或者远程控制多台主机,并行操作可以节约大量的时间。当被操作对象数目不大时,可以直接利用multiprocessing中的Process动态成生多个进程,10几个还好,但如果是上百个,上千个目标,手动的去限制进程数量却又太过繁琐,这时候进程池Pool发挥作用的时候就到了。Pool可以提供指定数量的进程,供用户调用,当有新的请求提交到pool中时,如果池还没有满,那么就会创建一个新的进程用来执行

系统 2019-09-27 17:48:11 2310

Python

对Python3之方法的覆盖与super函数详解

#覆盖覆盖:在继承关系中,子类实现了与基类同名的方法,在子类的实例调用该方法时,实例调用的是子类的覆盖版本。通俗的讲,就是小明继承了他⑧的自行车,经过自己的改装,成了电动车,那么小明每次骑的就是电动车了(这个电动车是可以脚蹬的,后边栗子会继续使用)举个简单的栗子:classBicycle():defrun(self):print('我是自行车的run方法')classE_Bicycle(Bicycle):#继承自行车defrun(self):print('

系统 2019-09-27 17:55:39 2309

Python

python爬虫增加访问量的方法

看着自己少得可怜的访问量,突然有一个想用爬虫刷访问量的想法,主要也是抱着尝试的心态,学习学习。其实市面上有一些软件可以代刷流量比如流量精灵,使用感确实比我们自己写的代码要好一些第一版:网上借鉴了一下以下代码运行在python3importurllib.requestimporttime#使用build_opener()是为了让python程序模仿浏览器进行访问opener=urllib.request.build_opener()opener.addhea

系统 2019-09-27 17:50:47 2309

Python

python小程序实现刷票功能详解

刷票一般要突破以下限制:1、验证码识别2、同一ip不可连续投票解决办法1、用tesseract工具,链接在此https://code.google.com/p/tesseract-ocr/(人人还是加不了https链接)2、使用代理,国内可以的代理服务器可以从这里找到http://cn-proxy.com/程序语言当然用python浏览器投票的流程如下1、向服务器发送请求,服务器返回验证码和表单2、填好表单,发送到服务器可以用firefox+httpfox

系统 2019-09-27 17:50:15 2309

Python

【Python】1行Python代码统计文本中每个英文单词出现次数...(python词频统计) | 附完整代码

今天来试一下如何利用python来统计文本中每个英文单词出现的次数列出了两种方法,一种是直接调用Counter函数,核心代码一行搞定另一种是手写的利用python中的字典来统计1.首先将文本文件导入文本是长这样子的f=open(r"C:\Users\aaa\Desktop\new.txt",encoding="utf-8")a=f.read().split()open文本之后,将文本read进来,然后用split将单词利用空格切分开输出的是一个列表,也就是

系统 2019-09-27 17:49:43 2309

Python

Python之读取Excel

介绍现在交给你一份2010年美国各州县人口普查表:censuspopdata.xlsx。共72864条记录。每一行代表一个县某统计区的人口数。需要你统计出:各县统计区数量和人口数。表格内容长这样:通过本练习你讲学习到:python如何读取excel内容使用字典存储excel统计内容利用pprint格式化字典结构代码新建:readCensusExcel.py#!python3#readCensusExcel.py-Tabulatespopulationand

系统 2019-09-27 17:48:33 2309

Python

Python中Random和Math模块学习笔记

由于最近经常使用到Python中random,math和time``datetime模块,所以决定花时间系统的学习一下1.math模块math中的函数不可以用于太过复杂的数的运算,如果需要复杂数的运行最好使用cmath模块中同名函数,如果想要更加高级的数学功能,可以考虑选择标准库之外的numpy和scipy模块,它们不但支持数组和矩阵运算,还有丰富的数学和物理方程可供使用1.1.数学常量math.pi这个数学常量等于3.141592...math.e这个数

系统 2019-09-27 17:38:08 2309

Python

007 Python程序语法元素分析

目录一、概述二、程序的格式框架2.1代码高亮2.2缩进2.3注释2.4缩进、注释三、命名与保留字3.1变量3.2命名3.3保留字3.4变量、命名、保留字四、数据类型4.1字符串、整数、浮点数、列表4.210,011,101该如何解释呢?4.3供计算机程序理解的数据形式4.410,011,1014.5字符串4.5.1字符串的序号4.5.2字符串的使用4.6数字类型4.7列表类型五、语句与函数5.1赋值语句5.2分支语句5.3函数5.4赋值语句、分支语句、函数

系统 2019-09-27 17:55:35 2308

Python

Python在OpenCV里实现极坐标变换功能

在中学里学习过直角坐标系,也叫做笛卡尔坐标系,它是正交坐标系,不过也学习过极坐标系,这种坐标系比较适合大炮发射的场合。极坐标系的定义如下:在平面内取一个定点O,叫极点,引一条射线Ox,叫做极轴,再选定一个长度单位和角度的正方向(通常取逆时针方向)。对于平面内任何一点M,用ρ表示线段OM的长度,θ表示从Ox到OM的角度,ρ叫做点M的极径,θ叫做点M的极角,有序数对(ρ,θ)就叫点M的极坐标,这样建立的坐标系叫做极坐标系。极坐标很方便应用到雷达上面,因为雷达不

系统 2019-09-27 17:54:31 2308

Python

python爬虫第7关项目利用扇贝网做个测单词的小工具

要求实现功能:利用扇贝网:https://www.shanbay.com/,做个测单词的小工具。扇贝网已经有一个测单词量的功能,我们要做的就是把这个功能复制下来,并且做点改良,搞一个网页版没有的功能————自动生成错词本。1.根据选择的题库,获取50个单词点开检查->Network->选中Perservelog->查看XHR->点开刷新之后出现的XHR->查看Response会发现题库在response这里,于是我们需要找到真正的URL,也就是在Heade

系统 2019-09-27 17:53:27 2308

Python

python3的url编码和解码,自定义gbk、utf-8的例子

因为很多时候要涉及到url的编码和解码工作,所以自己制作了一个类,废话不多说码上见!#coding:utf-8importurllib.parseclassUrlchuli():"""Url处理类,需要传入两个实参:Urlchuli('实参','编码类型'),默认utf-8url编码方法:url_bm()url解码方法:url_jm()"""def__init__(self,can,mazhi='utf-8'):self.can=canself.mazhi

系统 2019-09-27 17:50:45 2308

Python

python补充知识点-----为什么python中的read()语句只能生效

实际上这是一种误读,read()并不是只能生效一次。之所以会有之生效一次的误解是因为在已经read完所有的字符后,没有重新打开(open)就接着进行了下一次read,此时指针已经移到了字符串末尾,所以不再能读取出任何字符了。'''【思考】:下面的代码会读出什么?'''a=f.read()b=f.read(-1)c=f.read(10)print(a)print(b)print(c)'''乍一看,会读出如下数据:thisisatestforthefuncti

系统 2019-09-27 17:48:35 2308

Python

python使用jieba实现中文文档分词和去停用词

阅读更多分词工具的选择:现在对于中文分词,分词工具有很多种,比如说:jieba分词、thulac、SnowNLP等。在这篇文档中,笔者使用的jieba分词,并且基于python3环境,选择jieba分词的理由是其比较简单易学,容易上手,并且分词效果还很不错。分词前的准备:待分词的中文文档存放分词之后的结果文档中文停用词文档(用于去停用词,在网上可以找到很多)分词之后的结果呈现:图1去停用词和分词前的中文文档图2去停用词和分词之后的结果文档分词和去停用词代码

系统 2019-09-27 17:47:54 2308