拥有Python标签的文章
Python

Python爬虫初接触(六)

这篇博客做一个爬虫的实例今天刚看到一个新闻,在7月26日上映的《哪吒之魔童降世》,密钥第二次延期至10月26日。截止至9月17日,《哪吒之魔童降世》票房已超49亿票房,在豆瓣上对该电影的评价有好有坏。说实话,博主看了这个电影真的觉得蛮不错的,因此把短评中的差评爬取下来,看下差评包括哪些方面。目录一、BeautifulSoup二、xpath三、正则表达式一、BeautifulSoup首先需要了解下差评文字内容在哪些标签下:进入豆瓣该电影短评界面,检查元素:可

系统 2019-09-27 17:53:05 2098

Python

python 装饰器详解

1、python装饰器最基础的函数1defsum1():2sum=1+23print(sum)4sum1()查看函数执行用了多长时间,写了几句代码插进去了:1importtime23defsum1():4start=time.clock()5sum=1+26print(sum)7end=time.clock()8print("timeused:",end-start)910sum1()可是随着继续翻看,对越来越多的函数感兴趣了,都想看下他们的运行时间如何,

系统 2019-09-27 17:52:26 2098

Python

Python 列表 List

列表List讓Python的資料型態DataType更有彈性。列表中的值稱為元素element或列表項item。列表的定義如下:[item1,item2,item3,...]列表中元素的datatype可為任意項,甚至可以是嵌入Nested列表,例如:['Apple',85,['Big','Small'],4.0]列表可被視為一個集合Set。1.子集合相加>>>A=[1,2,3]>>>B=[4,5,6]>>>C=A+B>>>C[1,2,3,4,5,6]2.

系统 2019-09-27 17:51:42 2098

Python

趣学python3(8)-循环语句(2)

num1=-1whilenum1<1ornum1>500:print("请输入一个整数(1-500):")num1=int(input())dividend=[3,5,7,9,11,13,15]fornum2individend:ifnum1%num2==0:print(f"{num1}被{num2}整除")else:print(f"{num1}不能被{num2}整除")请输入一个整数(1-500):2900请输入一个整数(1-500):-13请输入一个整

系统 2019-09-27 17:50:51 2098

Python

解读Python中 locals() 和 globals() 内置函数

首先globals()和locals()是作用于作用域下的内置函数,所以我将它们分为作用域类型的内置函数1.作用域相关:1)globals()#返回全局作用域中的所有名字2)locals()#返回本地作用域中的所有名字可能对于这个作用域相关的内置函数,大家一接触都会很懵,这个东西是干什么的?它怎么用?今天小编就给大家来解释一下,首先我们来先看下官方的解释:globals()——获取全局变量的字典locals()——获取执行本方法所在命名空间内的局部变量的字

系统 2019-09-27 17:50:51 2098

Python

在Python中利用Pandas库处理大数据的简单介绍

在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据:硬件环境CPU:3.5GHzIntelCorei7内存:32GBHDDR31600MHz硬盘:3TBFusionDrive数据

系统 2019-09-27 17:50:47 2098

Python

几行Python代码快速解析、整理上万份数据文件

在这个世界上,人们每天都在用Python完成着不同的工作。而文件操作,则是大家最常需要解决的任务之一。使用Python,你可以轻松为他人生成精美的报表,也可以用短短几行代码快速解析、整理上万份数据文件。当我们编写与文件相关的代码时,通常会关注这些事情:我的代码是不是足够快?我的代码有没有事半功倍的完成任务?在这篇文章中,我会与你分享与之相关的几个编程建议。我会向你推荐一个被低估的Python标准库模块、演示一个读取大文件的最佳方式、最后再分享我对函数设计的

系统 2019-09-27 17:50:22 2098

Python

Python3 JSON编码解码方法详解

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,它基于ECMAScript的一个子集。JSON采用完全独立于语言的文本格式,这些特性使JSON成为理想的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成,在接口数据开发和传输中非常常用。Python3中我们利用内置模块json解码和编码JSON对象。json模块提供了四个功能:dumps、dump、loads、loaddumps把数据类型转换成字符串dump把数

系统 2019-09-27 17:50:16 2098

Python

python pandas时序处理相关功能详解

创建时间序列函数pd.date_range()根据指定的范围,生成时间序列DatetimeIndex,每隔元素的类型为Timestamp。该函数应用较多。ts=pd.date_range('2017-09-01',periods=10,freq='d',normalize=False)ts输出为:DatetimeIndex(['2017-09-01','2017-09-02','2017-09-03','2017-09-04','2017-09-05','

系统 2019-09-27 17:50:15 2098

Python

在Python中使用itertools模块中的组合函数的教程

理解新概念PythonV2.2中引入了迭代器的思想。唔,这并不十分正确;这种思想的“苗头”早已出现在较老的函数xrange()以及文件方法.xreadlines()中了。通过引入yield关键字,Python2.2在内部实现的许多方面推广了这一概念,并使编程定制迭代器变得更为简单(yield的出现使函数转换成生成器,而生成器反过来又返回迭代器)。迭代器背后的动机有两方面。将数据作为序列处理通常是最简单的方法,而以线性顺序处理的序列通常并不需要都同时实际存在

系统 2019-09-27 17:49:57 2098

Python

Python2.x和3.x下maketrans与translate函数使用

maketrans和translate函数是进行字符串字符编码的常用方法。本文着重点在于演示其基本用法和在不同版本下操作的差异。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。2.X版本把字符串基本分为两种:unicode字符串和8位字符串str,后者包含字节数据和我们常见的ASCII码数据;而3.X版本则重新对字符串进行了划分,分为了字节字符串bytes和文本字符串str,两者都是不可变的,所以添加了一个可变的字节字符串类型byte

系统 2019-09-27 17:49:54 2098

Python

Python第一课

前言一个偶然的机会来到博客园,看到了vamei的博文,瞬间被大神言简意赅,深入浅出的Python快速课程所吸引,开始了一步一步的学习编程之路。同时也惊闻大神因抑郁症去世,真是天妒英才,感慨万千。有兴趣的可以看看大神生前的文章。https://www.cnblogs.com/vamei/archive/2012/09/13/2682778.html第一课Python的优缺点以及干什么用的,想必大家都很了解。主要有:简单易学,功能强大,可移植性强等,是人工智能

系统 2019-09-27 17:49:54 2098

Python

Python 多线程搜索txt文件的内容,并写入搜到的内容(Lock)方法

废话不多说,直接上代码吧!importthreadingimportosclassFind(threading.Thread):#搜索数据的线程类def__init__(self,datalist,startIndex,endIndex,searchstr,savefile):#datalist要搜索的内容列表,startIndex列表搜索范围的开始下标,searchstr要搜索的内容threading.Thread.__init__(self)self.

系统 2019-09-27 17:49:21 2098

Python

selenium+python环境配置教程详解

一、安装Python1)官网下载安装2)配置环境变量(未勾选自动配置需要手动配置)3)检查是否安装成功(交互窗口中输入Python-v)二、Selenium3.X+FireFox驱动+geckodriver1、安装selenium:1)W+r输入cmd,然后输入pipinstallselenium2)安装FireFox,添加附加组件seleniumIDE、FireBUG3)https://github.com/mozilla/geckodriver/rel

系统 2019-09-27 17:48:46 2098

Python

python虚拟环境的安装和配置(virtualenv

一、为什么要安装虚拟环境情景一、项目A需要某个库的1.0版本,项目B需要这个库的2.0版本。如果没有安装虚拟环境,那么当你使用这两个项目时,你就需要来回的卸载安装了。情景二,项目A需要python2.7环境下运行,项目B需要在python3.6环境运行,如果使用虚拟环境可以分别为这两个项目配置不同的运行环境总的来说:virtualenv是一个创建隔绝的Python环境的工具,能为每一个python项目创建独立的,定制的环境二、安装步骤1、现在电脑上安装你需

系统 2019-09-27 17:47:45 2098