Python

Python爬虫之xlml解析库(全面了解)

1.XpathXpath是一门在XML中查找信息的语言,可用来在XML文档中对元素和属性进行遍历。XQuery和xpoint都是构建于xpath表达之上2.节点父(parent),子(children),兄弟(sibling),先辈(ancetstor),后代(Decendant)3.选取节点路径表达式表达式描述路径表达式结果nodename选取此节点上的所有的子节点bookstore选取bookstore元素的所有子节点/从根节点上选取/bookstor

系统 2019-09-27 17:54:09 2198

Python

Python实现打砖块小游戏代码实例

这次用Python实现的是一个接球打砖块的小游戏,需要导入pygame模块,有以下两条经验总结:1.多父类的继承2.碰撞检测的数学模型知识点稍后再说,我们先看看游戏的效果和实现:一、游戏效果二、游戏代码#导入模块importpygamefrompygame.localsimport*importsys,random,time,mathclassGameWindow(object):'''创建游戏窗口类'''def__init__(self,*args,**

系统 2019-09-27 17:54:09 2198

Python

Python socket C/S结构的聊天室应用实现

PythonsocketC/S结构的聊天室应用服务端:#!/usr/bin/envpython#coding:utf8importsocket,selectdefbroadcast_data(sock,message):forsocketinconn_list:ifsocket!=server_socketandsocket!=sock:try:socket.send(message)except:socket.close()conn_list.remov

系统 2019-09-27 17:53:37 2198

Python

python网络爬虫原理

爬虫即网络爬虫,英文是WebSpider。翻译过来就是网络上爬行的蜘蛛,如果把互联网看作一张大网,那么爬虫就是在大网上爬来爬去的蜘蛛,碰到想要的食物,就把他抓取出来。我们在浏览器中输入一个网址,敲击回车,看到网站的页面信息。这就是浏览器请求了网站的服务器,获取到网络资源。那么,爬虫也相当于模拟浏览器发送请求,获得到HTML代码。HTML代码里通常包含了标签和文字信息,我们就从中提取到我们想要的信息。通常爬虫是从某个网站的某个页面开始,爬取这个页面的内容,找

系统 2019-09-27 17:51:06 2198

Python

python3 中的字符串(单引号、双引号、三引号)以及字符串与数字的运算

python3中的字符串是一种常见的数据类型。字符串有多种表现形式:单引号、双引号和三引号,且这些字符串的表现形式(单、双、三)都必须是成对出现的。单、双引号是英文的:‘'和"",三引号则是三个单引号或者三个双引号都可以:""""""或者'''''',在python中打出来时没有顺序之分(其实也看不出来顺序...),在一对引号的中间打上东西就是字符串,例如:#单引号#'123''小明''xyz'#双引号#"123""小明""xyz"关于单引号:单引号比较特

系统 2019-09-27 17:49:33 2198

Python

python爬虫小案例_从豆瓣爬取《哪吒之魔童降世》的剧照

一、在豆瓣电影网爬取以下剧照保存到本地:本次案例只爬取前5页的剧照,先获取前五页的链接:foriinrange(5):url='https://movie.douban.com/subject/26794435/photos?type=S&start='+str(i*30)+'&sortby=like&size=a&subtype=a'print(url)由下图可知这些剧照是在ul标签下二、爬取和保存到本地的参考代码如下:#导入相应的模块importosi

系统 2019-09-27 17:49:06 2198

Python

Python爬虫 urllib2的使用方法详解

所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。在Python中有很多库可以用来抓取网页,我们先学习urllib2。urllib2是Python2.x自带的模块(不需要下载,导入即可使用)urllib2官网文档:https://docs.python.org/2/library/urllib2.htmlurllib2源码urllib2在python3.x中被改为urllib.requesturlopen我们先来段代码:#-*-

系统 2019-09-27 17:48:38 2198

Python

python:在django中用celery实现异步

celery英文官方网站:www.celeryproject.org中文网站:http://docs.jinkan.org/docs/celery/celeryCelery是一个简单、灵活且可靠的,处理大量消息的分布式系统,并且提供维护这样一个系统的必需工具。专注于实时处理的任务队列,同时也支持任务调度。作用:解决耗时操作:开一个新的进程,去操作耗时操作,不影响原有进程定时操作,使Listitem用celery定时执行操作:定义一个任务task,也就是一个

系统 2019-09-27 17:48:28 2198

Python

【Python】自定义分页

Django内置了分页设置,但不够灵活,需要我们自定义分页。下面代码考虑了利用bootstrap分页组件来实现页面美化,如果不想使用,可以不调用url_format_by_bootstrap函数,即可实现普通分页。具体的参数和代码均有注释#!python3#@Project:mysite2-pager.py#@Info:自定义分页操作importreclassPageInfo:""":paramcurrent_page当前页码:paramdata要分页的数

系统 2019-09-27 17:47:37 2198

Python

Python - Python解释器和第一个程序

Python解释器安装好Python3.x之后,我们可以使用文本文件去编写Python代码,编写完成后将扩展名改成.py结尾的文本文件。想要执行编写好的.py文件就需要用到Python解释器。解释器分为:CPython、Ipython、PyPy、Jython、IronPython等。目前我们常用的是CPython解释器,该解释器是用C语言开发的,所以叫CPython。在命令行下运行python其实就是启动CPython解释器。第一个程序HelloPytho

系统 2019-09-27 17:47:36 2198

Python

Python多层嵌套list的递归处理方法(推荐)

问题:用Python处理一个多层嵌套list['and','B',['not','A'],[1,2,1,[2,1],[1,1,[2,2,1]]],['not','A','A'],['or','A','B','A'],'B']需求1)如何展开成一层?需求2)如何删除重复的元素?包括重复的list,要考虑子list的重复元素删除后造成的子list重复#!/usr/bin/envpython#-*-coding:utf-8-*-defunilist(ll):""

系统 2019-09-27 17:38:25 2198

Python

Python import用法以及与from...import的区别

在python用import或者from...import来导入相应的模块。模块其实就是一些函数和类的集合文件,它能实现一些相应的功能,当我们需要使用这些功能的时候,直接把相应的模块导入到我们的程序中,我们就可以使用了。这类似于C语言中的include头文件,Python中我们用import导入我们需要的模块。eg:复制代码代码如下:importsysprint('================Pythonimportmode==============

系统 2019-09-27 17:37:55 2198

编程技术

需求分析阶段的工作(二):用例描述和逻辑模型

前文介绍了系统用例,在这一节中,我们将讨论的是用例描述和逻辑模型的工作。从任何一个环节我们都会看到用例,但是仅仅依靠用例本身的图来描述用例是不够的,为什么呢?因为用例它所要描述的是一个场景,换句话说,就是用例是描述了某件详细的事情。如果作为一个场景的话必然要考虑这么几个问题:l谁在这个场景中做事?l什么时候进入这个场景?l这个场景在做什么?l这个场景有没有特殊规则?l这个场景结束后会有什么情况?l这个场景和别的场景会有什么联系?考虑这几个问题的话,那我们就

系统 2019-08-29 23:24:58 2198

编程技术

素数环问题

DFS,好像主要是对dfs的递归调用吧,自己也不太懂,总之,它很神奇,多看看代码吧#include#include#include#includeintn;intisp[100];intvis[100];intA[100];intis_prime(intx)//判断一个数是否为素数(该数比较小,不会引起超时){inti=1,k

系统 2019-08-29 22:28:11 2198

编程技术

一个简单的Cairngorm框架例子_原理

我们新建工程,有一个Cairngrom的swc包一定要引进去才行(一般放在libs文件夹里面),不然是不能成功的,所以大家可以Cairngrom的官方网站上去下载,我在这里提供地址:http://opensource.adobe.com/wiki/display/cairngorm/Cairngorm有关这个框架,在网络上有很多图表用来讨论。下面是框架图表:使用Cairngorm的第一步是建立框架结构的骨架,包括了三个对象:ModelLocater;Ser

系统 2019-08-29 22:28:01 2198