Python - 军军小站|张军博客
Python

python爬取京东商品评论--jsonpath方法

直接送上代码importurllib.requestimportjsonimportjsonpathimporttimeend_page=int(input('请输入爬取的结束页码:'))foriinrange(0,end_page+1):print('第%s页开始爬取------'%(i+1))url='https://sclub.jd.com/comment/productPageComments.action?callback=fetchJSON_c

系统 2019-09-27 17:54:07 2025

Python

Python面向对象编程——属性查找与绑定方法

Python面向对象编程——属性查找与绑定方法一、属性查找类有两种属性:数据属性和函数属性。1、类的数据属性是所有对象共享的#类的数据属性是所有对象共享的,id都一样print(id(OldboyStudent.school))print(id(s1.school))#4377347328print(id(s2.school))#4377347328print(id(s3.school))#43773473282、类的函数属性是绑定给对象用的,称为绑定到对

系统 2019-09-27 17:53:57 2025

Python

Python3网络爬虫实战-10、爬虫框架的安装:PySpider

我们直接用Requests、Selenium等库写爬虫,如果爬取量不是太大,速度要求不高,是完全可以满足需求的。但是写多了会发现其内部许多代码和组件是可以复用的,如果我们把这些组件抽离出来,将各个功能模块化,就慢慢会形成一个框架雏形,久而久之,爬虫框架就诞生了。利用框架我们可以不用再去关心某些功能的具体实现,只需要去关心爬取逻辑即可。有了它们,可以大大简化代码量,而且架构也会变得清晰,爬取效率也会高许多。所以如果对爬虫有一定基础,上手框架是一种好的选择。本

系统 2019-09-27 17:53:32 2025

Python

python生成hbase测试数据说明

版本:Python:3.6.4与2.7.3均适配一、hbase表介绍表名:people列族:basic_info、other_inforowkey:随机的两位数+当前时间戳,并要确保该rowkey在表数据中唯一。列定义:name、age、sex、edu、tel、email、country。二、实现rowkey:随机的两位数:使用random.randint(00,99),然后使用zfill(2)补位,比如数字“1”补位为”01”。生成当前时间的13位时间戳

系统 2019-09-27 17:53:18 2025

Python

解决安装python3.7.4报错Can''t connect

简述从官网下载了Python3.7.4,直接编译安装后,使用pip3出现了报错信息:Can'tconnecttoHTTPSURLbecausetheSSLmoduleisnotavailable错误原因在Python3.7之后的版本,依赖的openssl,必须要是1.1或者1.0.2之后的版本,或者安装了2.6.4之后的libressl。image.png而本地的openssl依然是1.0.1e的。[root@localhost~]#opensslvers

系统 2019-09-27 17:52:58 2025

Python

Python基础---运算符

什么是运算符?本章节主要说明Python的运算符。举个简单的例子4+5=9。例子中,4和5被称为操作数,"+"称为运算符。Python语言支持以下类型的运算符:算术运算符比较(关系)运算符赋值运算符逻辑运算符位运算符成员运算符身份运算符运算符优先级接下来让我们一个个来学习Python的运算符。一.Python算术运算符以下假设变量:a=10,b=20:注意:Python3.x里,整数除整数,得到的是浮点数。>>>1/30.3333333333333333>

系统 2019-09-27 17:52:37 2025

Python

Python网络爬虫——http和https协议

一.HTTP协议1.官方概念:HTTP协议是HyperTextTransferProtocol(超文本传输协议)的缩写,是用于从万维网(WWW:WorldWideWeb)服务器传输超文本到本地浏览器的传送协议。(虽然童鞋们将这条概念都看烂了,但是也没办法,毕竟这就是HTTP的权威官方的概念解释,要想彻底理解,请客观目移下侧......)2.白话概念:HTTP协议就是服务器(Server)和客户端(Client)之间进行数据交互(相互传输数据)的一种形式。我

系统 2019-09-27 17:52:22 2025

Python

Python脚本实现网卡流量监控

#/usr/bin/env/python#coding=utf-8importsys,re,time,osmaxdata=50000#单位KBmemfilename='/tmp/newnetcardtransdata.txt'netcard='/proc/net/dev'defcheckfile(filename):ifos.path.isfile(filename):passelse:f=open(filename,'w')f.write('0')f.c

系统 2019-09-27 17:52:13 2025

Python

第十五章、Python多线程之信号量和GIL

目录第十五章、Python多线程之信号量和GIL1.信号量(Semaphore)2.GIL说明:第十五章、Python多线程之信号量和GIL1.信号量(Semaphore)信号量用来控制线程并发数的,Semaphore管理一个内置的计数器,每当调用acquire()时-1,调用release()时+1。计数器不能小于0,当计数器为0时,acquire()将阻塞线程至同步锁定状态,直到其他线程调用release()。其实就是控制最多几个线程可以操作同享资源。

系统 2019-09-27 17:51:26 2025

Python

在Python的Flask框架下收发电子邮件的教程

简述在大多数此类教程中都会不遗余力的介绍如何使用数据库。今天我们对数据库暂且不表,而是来关注另一个在web应用中很重要的特性:如何推送邮件给用户。在某个轻量级应用中我们可能会添加一个如下的邮件服务功能:当用户有了新的粉丝后,我们发送一封邮件通知用户。有很多方法可以实现这个特性,而我们希望提供出一种可复用的通用框架来处理。Flask-Mail介绍对于我们来说是幸运的,现在已经有很多外部插件来处理邮件,虽说不能百分百按照我们的想法去处理,但已经相当接近了。在虚

系统 2019-09-27 17:48:57 2025

Python

在Python中操作文件之seek()方法的使用教程

seek()方法在偏移设定该文件的当前位置。参数是可选的,默认为0,这意味着绝对的文件定位,它的值如果是1,这意味着寻求相对于当前位置,2表示相对于文件的末尾。没有返回值。需要注意的是,如果该文件被打开或者使用'a'或'A+'追加,任何seek()操作将在下次写撤消。如果该文件只打开使用“a”的追加模式写,这种方法本质上是一个空操作,但读使能(模式'a+'),它仍然在追加模式打开的文件非常有用。如果该文件在文本模式下使用“t”,只有tell()返回的偏移开

系统 2019-09-27 17:46:25 2025

Python

python笔记(lsit和tuple)

一:list和tuple的区别:list是可以增加,改变,删除元素的,是动态的,其存储的开销会比tuple较大一些,性能也会比tuple较差;tuple一旦被创建,就无法改变,无法增加,删除元素,如果使用某些方法打算改变tuple,其实是返回了一个新的tuple,tuple是静态的,其存储的开销比list小,比list更加轻量级。应用场景总结:如果元素是静态的,不变的话用tuple;如果需要频繁增加,删除,更改元素,使用list。二:一些常用代码:1:验证

系统 2019-09-27 17:45:34 2025

Python

Python中Collection的使用小技巧

本文所述实例来自独立软件开发者AlexMarandon,在他的博客中曾介绍了数个关于PythonCollection的实用小技巧,在此与大家分享。供大家学习借鉴之用。具体如下:1.判断一个list是否为空传统的方式:iflen(mylist):#Dosomethingwithmylistelse:#Thelistisempty由于一个空list本身等同于False,所以可以直接:ifmylist:#Dosomethingwithmylistelse:#Th

系统 2019-09-27 17:38:30 2025

Python

打包发布Python模块的方法详解

前言昨天把自己的VASP文件处理库进行了打包并上传到PyPI,现在可以直接通过pip和easy_install来安装VASPy啦(同时欢迎使用VASP做计算化学的童鞋们加星和参与进来),VASPy的GotHub地址:https://github.com/PytLab/VASPyVASPy的PyPI地址:https://pypi.python.org/pypi/vaspy/由于自己的记性真是不咋地,怕时间久了就忘了,于是在这里趁热打铁以自己的VASPy程序为

系统 2019-09-27 17:38:04 2025

Python

详解10个可以快速用Python进行数据分析的小技巧

一些小提示和小技巧可能是非常有用的,特别是在编程领域。有时候使用一点点黑客技术,既可以节省时间,还可能挽救“生命”。一个小小的快捷方式或附加组件有时真是天赐之物,并且可以成为真正的生产力助推器。所以,这里有一些小提示和小技巧,有些可能是新的,但我相信在下一个数据分析项目中会让你非常方便。Pandas中数据框数据的Profiling过程Profiling(分析器)是一个帮助我们理解数据的过程,而PandasProfiling是一个Python包,它可以简单快

系统 2019-09-27 17:57:26 2024