- 军军小站|张军博客
搜索到与相关的文章
Python

零基础写python爬虫之神器正则表达式

接下来准备用糗百做一个爬虫的小例子。但是在这之前,先详细的整理一下Python中的正则表达式的相关内容。正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。一、正则表达式基础1.1.概念介绍正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。它拥有自己独特的语法以及一个独立的处理引擎,在提供了正则表达式的语言里,正则表达

系统 2019-09-27 17:54:47 1831

Python

python elasticsearch环境搭建详解

windows下载ziplinux下载tar下载地址:https://www.elastic.co/downloads/elasticsearch解压后运行:bin/elasticsearch(orbin\elasticsearch.batonWindows)检查是否成功:访问http://localhost:9200linux下不能以root用户运行,普通用户运行报错:java.nio.file.AccessDeniedException原因:当前用户没

系统 2019-09-27 17:54:44 1831

Python

详解Python用三种方式统计词频的方法

三种方法:①直接使用dict②使用defaultdict③使用Counterps:`int()`函数默认返回0①dicttext="I'mahandsomeboy!"frequency={}forwordintext.split():ifwordnotinfrequency:frequency[word]=1else:frequency[word]+=1②defaultdictimportcollectionsfrequency=collections.d

系统 2019-09-27 17:54:44 1831

Python

详解Python 切片语法

Python的切片是特别常用的功能,主要用于对列表的元素取值。使用切片也会让你的代码显得特别Pythonic。切片的主要声明如下,假设现在有一个list,命名为alist:alist=[0,1,2,3,4]切片语法的基本形式为:alist[start:stop:step]可以看出对于列表的切片操作有三个参数,分别为:start:起始位置stop:终止位置step:步长三个参数都是可选参数,意义为list的下标,即index。step参数默认值为1。表现形式

系统 2019-09-27 17:54:32 1831

Python

python获取文件后缀名及批量更新目录下文件后缀名的方法

本文实例讲述了python获取文件后缀名及批量更新目录下文件后缀名的方法。分享给大家供大家参考。具体实现方法如下:1.获取文件后缀名:复制代码代码如下:#!/usr/bin/pythonimportosdict={}ford,fd,flinos.walk('/home/ahda/Program/'):forfinfl:sufix=os.path.splitext(f)[1][1:]ifdict.has_key(sufix):dict[sufix]+=1el

系统 2019-09-27 17:54:31 1831

Python

python3.6中@property装饰器的使用方法示例

本文实例讲述了python3.6中@property装饰器的使用方法。分享给大家供大家参考,具体如下:1、@property装饰器的使用场景简单记录如下:负责把一个方法变成属性调用;可以把一个getter方法变成属性,@property本身又创建了另一个装饰器@score.setter,负责把一个setter方法变成属性赋值;只定义getter方法,不定义setter方法就是一个只读属性2、通过一个例子来加深对@property装饰器的理解:利用@prop

系统 2019-09-27 17:54:23 1831

Python

使用python爬取微博数据打造一颗“心”

前言一年一度的虐狗节终于过去了,朋友圈各种晒,晒自拍,晒娃,晒美食,秀恩爱的。程序员在晒什么,程序员在加班。但是礼物还是少不了的,送什么好?作为程序员,我准备了一份特别的礼物,用以往发的微博数据打造一颗“爱心”,我想她一定会感动得哭了吧。哈哈准备工作有了想法之后就开始行动了,自然最先想到的就是用Python了,大体思路就是把微博数据爬下来,数据经过清洗加工后再进行分词处理,处理后的数据交给词云工具,配合科学计算工具和绘图工具制作成图像出来,涉及到的工具包有

系统 2019-09-27 17:53:34 1831

Python

菜鸟学习python:逻辑语句小结

今天学习了python的逻辑语句。感觉与其他语言不通,鲜明的特点是除了Ture和False,有时返回的是数值。简单小结如下:1、and(逻辑与)乘法性质:同时为真方为真,只要一假就是假。计算方法:遇假跳出,否则返回最后真(值)。2、or(逻辑或)加法性质:同时为假方为假,只要一真就是真。计算方法:遇真跳出,直接返回跳出真(值)。3、not(逻辑非)取反性质:结果总是Ture或False。最后,跳出返回的真值可能是非零的数值或是Ture,返回假(值)可能是F

系统 2019-09-27 17:52:38 1831

Python

Python可视化数据库Dash

Dash简介Dash是一个用于构建Web应用程序的Python数据可视化库。它基于PythonWeb框架Flask以及Javascript绘图库Plotly.js和用于构建用户界面的Javascript库React.js,所以它非常适合用于构建后端基于Flask,前端数据可视化的Web网页。因为Dash应用程序可以在Web浏览器中显示,所以可以将这些Dash应用程序部署到服务器,通过URL共享。Dash应用程序由两部分组成,第一部分是布局(Layout),

系统 2019-09-27 17:52:31 1831

Python

Python的MRO

Python的MRO即MethodResolutionOrder(方法解析顺序),也就是在Python中的类的继承顺序是怎样的。在Python2.3之前,MRO的实现是基于DFS的,而在Python2.3以后MRO的实现是基于C3算法(我这里两种算法的具体实现都不详述)。C3算法最早被提出是用于Lisp的,应用在Python中是为了解决原来基于深度优先搜索算法不满足本地优先级,和单调性的问题。本地优先级:指声明时父类的顺序,比如C(A,B),如果访问C类对

系统 2019-09-27 17:50:47 1831