Python - 军军小站|张军博客
Python

05 Python爬虫之信息标记与提取方法

目录一、信息标记的三种形式XML格式数据JSON格式数据YAML格式数据二、信息标记形式的比较XMLJSONYAML三、信息提取的一般方法方法一:方法二:融合方法:四、基于bs4库的HTML内容查找方法扩展方法总结:一、信息标记的三种形式XML格式数据JSON格式数据YAML格式数据二、信息标记形式的比较XML最早的通用信息标记语言,可扩展性好,但繁琐。Internet上的信息交互与传递JSON信息有类型,适合程序处理(js),较XML简洁移动应用云端和节

系统 2019-09-27 17:45:34 1934

Python

Python Django 前后端分离 API的方法

步骤根据之前的文章已经搭建好Django的目录开始流程运行manage.py文件#创建一个appstartappulb_managersettings.py文件中设置INSTALLED_APPS=[#加入这句话'apps.ulb_manager',]MIDDLEWARE_CLASSES=[#关闭掉跨域的一些验证,注释掉下面这句话#'django.middleware.csrf.CsrfViewMiddleware',]urls.py文件中注册接口fromd

系统 2019-09-27 17:45:32 1934

Python

python实现在cmd窗口显示彩色文字

新手小白,一直在为cmd窗口的暗白色文字感到苦恼,在网上找了许多方法(也就那两种吐舌头),现在稍微整理了一下,便于使用。效果图:importctypesSTD_INPUT_HANDLE=-10STD_OUTPUT_HANDLE=-11STD_ERROR_HANDLE=-12FOREGROUND_DARKBLUE=0x01#暗蓝色FOREGROUND_DARKGREEN=0x02#暗绿色FOREGROUND_DARKSKYBLUE=0x03#暗天蓝色FORE

系统 2019-09-27 17:57:30 1933

Python

Windows 中 Python 多版本共存问题

Windows中Python多版本共存问题(Windows10)很多时候,一个版本的python无法满足需求,就需要在一台机器上面安装多个版本的python在Linux系统中安装多版本很容易,今天在此记录一下在Windows中进行多版本Python安装首先需要去到Python官网下载两个版本的Python由于我经常使用的是Python3版本,所以我先安装的是Python3版本,正常安装过后,将Python3安装路径加入到PATH环境变量中分别为:(每个人的

系统 2019-09-27 17:56:31 1933

Python

对python 中class与变量的使用方法详解

python中的变量定义是很灵活的,很容易搞混淆,特别是对于class的变量的定义,如何定义使用类里的变量是我们维护代码和保证代码稳定性的关键。#!/usr/bin/python#encoding:utf-8global_variable_1='global_variable'classMyClass():class_var_1='class_val_1'#defineclassvariableheredef__init__(self,param):sel

系统 2019-09-27 17:55:50 1933

Python

python爬取京东商品评论--jsonpath方法

直接送上代码importurllib.requestimportjsonimportjsonpathimporttimeend_page=int(input('请输入爬取的结束页码:'))foriinrange(0,end_page+1):print('第%s页开始爬取------'%(i+1))url='https://sclub.jd.com/comment/productPageComments.action?callback=fetchJSON_c

系统 2019-09-27 17:54:07 1933

Python

详解pyppeteer(python版puppeteer)基本使用

一、前言以前使用selenium的无头浏览器,自从phantomjs2016后慢慢不更新了之后,selenium也开始找下家,这时候谷歌的chrome率先搞出来无头浏览器并开放了各种api,随后firefox也开始做。现在selenium的测试也都支持这两个浏览器的无头模式了,只需要在引入的时候配置一下就可以了。之所以要采用谷歌chrome官方无头框架puppeteer的python版本pyppeteer,是因为有些网页是可以检测到是否是使用了seleni

系统 2019-09-27 17:52:58 1933

Python

Python分布式爬虫必学框架Scrapy打造搜索引擎

Python分布式爬虫必学框架Scrapy打造搜索引擎部分课程截图:点击链接或搜索QQ号直接加群获取其它资料:链接:https://pan.baidu.com/s/1-wHr4dTAxfd51Mj9DxiJ4Q提取码:ik1n免费分享,如若链接失效请加群其它资源在群里,私聊管理员即可免费领取;群——517432778,点击加群,或扫描二维码免费课程资料领取目录:PythonFlask构建微信小程序订餐系统Python3实战Spark大数据分析及调度(网盘分

系统 2019-09-27 17:52:27 1933

Python

python使用tkinter库实现五子棋游戏

本文实例为大家分享了python实现五子棋游戏的具体代码,供大家参考,具体内容如下一、运行截图:二、代码#用数组定义一个棋盘,棋盘大小为15×15#数组索引代表位置,#元素值代表该位置的状态:0代表没有棋子,1代表有黑棋,-1代表有白棋。fromtkinterimport*fromtkinter.messageboximport*classChess(object):def__init__(self):##############param########

系统 2019-09-27 17:48:52 1933

Python

Python 安装第三方库 pip install 安装慢安装不上的解决办法

今天来说一下,有些刚刚接触python的朋友,在使用pipinstall安装python第三方库的过程中会出现网速很慢,或者是安装下载到中途,停止,卡主,或者是下载报错等问题。如下图:还有一些,等等之类的问题,比如我这图中,下载速度只有4.7kb/s慢的比龟速还慢。怎么样解决这种问题呢?就是更换python源临时的使用方法是,在安装pipinstall-i+源地址+安装库名,这样可以临时解决安装问题例如:pipinstall-ihttps://pypi.t

系统 2019-09-27 17:48:41 1933

Python

python matplotlib库绘制条形图练习题

练习一:假设你获取到了2017年内地电影票房前20的电影(列表a)和电影票房数据(列表b),那么如何更加直观的展示该数据?a=["战狼2","速度与激情8","功夫瑜伽","西游伏妖篇","变形金刚5:最后的骑士","摔跤吧!爸爸","加勒比海盗5:死无对证","金刚:骷髅岛","极限特工:终极回归","生化危机6:终章","乘风破浪","神偷奶爸3","智取威虎山","大闹天竺","金刚狼3:殊死一战","蜘蛛侠:英雄归来","悟空传","银河护卫队2"

系统 2019-09-27 17:47:08 1933

Python

Python threading的使用方法解析

一、例子:我们对传参是有要求的必须传入一个元组,否则报错import_threadasthreadimporttimedefloop1(in1):print("Startloop1at:",time.ctime())print("我是参数",in1)time.sleep(4)print("Endloop1at:",time.ctime())defloop2(in1,in2):print("Startloop2at:",time.ctime())print(

系统 2019-09-27 17:45:45 1933

Python

Python操作Word批量生成文章的方法

下面通过COM让Python与Word建立连接实现Python操作Word批量生成文章,具体介绍请看下文:需要做一些会议记录。总共有多少呢?五个地点x7个月份x每月4篇=140篇。虽然不很重要,但是140篇记录完全雷同也不好。大体看了一下,此类的记录大致分为四段。于是决定每段提供四种选项,每段从四选项里随机选一项,拼凑成四段文字,存成一个文件。而且要打印出来,所以准备生成一个140页的Word文档,每页一篇。需要用到win32com模块(下载链接:http

系统 2019-09-27 17:38:38 1933

Python

python getopt详解及简单实例

pythongetopt详解函数原型:getopt.getopt(args,shortopts,longopts=[])参数解释:args:args为需要解析的参数列表。一般使用sys.argv[1:],这样可以过滤掉第一个参数(ps:第一个参数是脚本的名称,它不应该作为参数进行解析)shortopts:简写参数列表longopts:长参数列表返回值:opts:分析出的(option,value)列表对。args:不属于格式信息的剩余命令行参数列表。源码分

系统 2019-09-27 17:38:35 1933

Python

CentOS安装Python3

简要说明本文使用的系统为CentOS7以安装Python3.7为例,其他的3.x的话把文章中的和Python版本有关的部分稍微修改一下就好。yum源准备更新yum:sudoyum-yupdate(参数-y用于提醒系统我们知道我们正在进行更改,免去终端提示我们要确认再继续)安装yum-utils(一组扩展和补充yum的实用程序和插件):sudoyum-yinstallyum-utils安装CentOS开发工具(用于允许从源代码构建和编译软件):sudoyum

系统 2019-09-27 17:57:32 1932