- 军军小站|张军博客
拥有Python标签的文章
Python

python使用Scrapy框架编写一个抓取书籍信息的爬虫服务

Scrapy是一个开源的Python数据抓取框架,速度快,强大,而且使用简单。来看一个官网主页上的简单并完整的爬虫:虽然只有10行左右的代码,但是它的确是一个完整的爬虫服务:当执行scrapyrunspiderxxx.py命令的时候,Scrapy在项目里查找Spider(蜘蛛️)并通过爬虫引擎来执行它。首先从定义在start_urls里的URL开始发起请求,然后通过parse()方法处理响应。response参数就是返回的响应对象。在parse()方法中,

系统 2019-09-27 17:53:38 1811

Python

python爬取欧美美女图片---xpath方法

这里爬取的是http://sc.chinaz.com/tag_tupian/OuMeiMeiNv.html网站献上欧美美女!!!!fromlxmlimportetreeimporturllib.request,os,timeclassOuMeiSpider(object):def__init__(self,start_page,end_page):self.start_page=start_pageself.end_page=end_pageself.fi

系统 2019-09-27 17:53:14 1811

Python

python列表操作实例

本文实例讲述了python列表操作的方法。分享给大家供大家参考。具体实现方法如下:复制代码代码如下:classNode:"""Singlenodeinadatastructure"""def__init__(self,data):"""Nodeconstructor"""self._data=dataself._nextNode=Nonedef__str__(self):"""Nodedatarepresentation"""returnstr(self.

系统 2019-09-27 17:53:05 1811

Python

Ucloud api signature 生成 (python3)

importhashlibdef_verfy_ac(private_key,params):items=sorted(params.items(),key=lambdax:x[0])params_data=""foriinitems:params_data=params_data+i[0]+i[1]params_data=params_data+private_keysign=hashlib.sha1()sign.update(params_data.en

系统 2019-09-27 17:52:26 1811

Python

Python网络爬虫——requests模块(1)

-基于如下5点展开requests模块的学习什么是requests模块requests模块是python中原生的基于网络请求的模块,其主要作用是用来模拟浏览器发起请求。功能强大,用法简洁高效。在爬虫领域中占据着半壁江山的地位。为什么要使用requests模块因为在使用urllib模块的时候,会有诸多不便之处,总结如下:手动处理url编码手动处理post请求参数处理cookie和代理操作繁琐......使用requests模块:自动处理url编码自动处理po

系统 2019-09-27 17:52:20 1811

Python

1 Python命令行参数(脚本神器)

1#!/usr/bin/envpython3.72#-*-coding:utf-8-*-3#Author:Lancer2019-09-0210:07:2145importsys,getopt67defusage():8print("usagecall")910defmain():11try:12opts,args=getopt.getopt(sys.argv[1:],"ho:v",["help","output="])13print(sys.argv[1:

系统 2019-09-27 17:52:18 1811

Python

排序算法总结(Python实现)——(一)

整个排序算法分两部分来总结,这篇总结第一部分一些相对简单和常用的排序算法,包括冒泡排序、选择排序、插入排序和希尔排序。冒泡排序冒泡排序应该是大家接触的最早的排序方法了,理解起来也十分简单。冒泡排序是一种简单的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。算法描述比较相邻的

系统 2019-09-27 17:52:14 1811

Python

Python对接六大主流数据库,只需三步

作为近两年来最火的编程语言的python,受到广大程序员的追捧必然是有其原因的,如果要挑出几点来讲的话,第一条那就python语法简洁,易上手,第二条呢?便是python有着极其丰富的第三方的库。所以不管你使用的关系型数据库是oracle,mysql,sqlserver,还是关系型数据库redis,mongoDB。python都有有与之对应的第三方库。下面就来为大家一一介绍一下!Mysql我们先来看看如何对接mysql数据库,python2和python3

系统 2019-09-27 17:50:46 1811

Python

python之psutil模块

#/usr/bin/envpython#coding:utf-8#进程检测程序importosimportpsutilimportdatetime#获取用户输入的PID#获取pid对应的应用名p=psutil.Process(os.getpid())print('Processname:%s'%p.name())#获取进程bin路径print('Processbinpath:%s'%p.exe())#获取pid对应的路径print('Processpath

系统 2019-09-27 17:50:43 1811

Python

Python2.x和3.x下maketrans与translate函数使用

maketrans和translate函数是进行字符串字符编码的常用方法。本文着重点在于演示其基本用法和在不同版本下操作的差异。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。2.X版本把字符串基本分为两种:unicode字符串和8位字符串str,后者包含字节数据和我们常见的ASCII码数据;而3.X版本则重新对字符串进行了划分,分为了字节字符串bytes和文本字符串str,两者都是不可变的,所以添加了一个可变的字节字符串类型byte

系统 2019-09-27 17:49:54 1811

Python

Python爬虫:现学现用xpath爬取豆瓣音乐

爬虫的抓取方式有好几种,正则表达式,Lxml(xpath)与BeautifulSoup,我在网上查了一下资料,了解到三者之间的使用难度与性能三种爬虫方式的对比。抓取方式性能使用难度正则表达式快困难Lxml快简单BeautifulSoup慢简单这样一比较我我选择了Lxml(xpath)的方式了,虽然有三种方式,但肯定是要选择最好的方式来爬虫,这个道理大家都懂,另外有兴趣的朋友也可以去了解另外两种爬虫方式!好了现在来讲讲xpath由于Xpath属于lxml模块

系统 2019-09-27 17:49:52 1811

Python

python之模块和包

一Python模块简介1模块化一般来说,编程语言中,库,包,模块是同一种概念,是代码组织方式python中只有一种模块对象类型,但是为了模块化组织的便利,提供了一个概念:包模块(module):指的是python的源代码文件包(package):指的是模块组织在一起放入和包名同名的目录及相关文件可以将代码量较大的程序分割成多个有组织,彼此间独立但又能互相交互的代码片段,这些自我包含的有组织的代码段就是模块模块在物理形式上表现为以.py结尾的代码文件一个文件

系统 2019-09-27 17:49:43 1811

Python

【python】Leetcode(Data Structure

文章目录160.相交链表(链表)232.用栈实现队列69.x的平方根(二分法)215.数组中的第K个最大元素(快排)347.前K个高频元素(桶排序)378.有序矩阵中第K小的元素(排序)1051.高度检查器(排序)17.电话号码的字母组合(递归)241.为运算表达式设计优先级(分治)455.分发饼干(贪心)160.相交链表(链表)把两个链表连起来,不断遍历,相等停下!classSolution(object):defgetIntersectionNode(

系统 2019-09-27 17:49:15 1811

Python

python计算器系统项目展示

我用了简单工厂和建造者模式,与python的GUI配合实现了一个简单的计算器系统,下面是运行结果,之后会向大家讲解。类图如下:部分代码如下:builderModel.py建造者模式代码classProduct():"""复杂产品类该类用于存放并返回两个操作数Attributes:self.NumOne:第一个操作数self.NumTwo:第二个操作数"""def__init__(self,NumOne,NumTwo):self.__NumOne=NumOn

系统 2019-09-27 17:49:07 1811

Python

Python数据类型 — 集合

集合是一个无序的,不重复的数据组合,它的主要作用如下:去重,把一个列表变成集合,就自动去重了关系测试,测试两组数据之前的交集、差集、并集等关系s=set([3,5,9,10])#创建一个数值集合t=set("Hello")#创建一个唯一字符的集合a=t|s#t和s的并集b=t&s#t和s的交集c=t-s#求差集(项在t中,但不在s中)d=t^s#对称差集(项在t或s中,但不会同时出现在二者中)基础功能List=[1,2,5,6,8]List=set(lis

系统 2019-09-27 17:48:36 1811