搜索到与相关的文章
Python

python爬虫---实现项目(四) 用BeautifulSoup分析新浪新闻

这次只演示了,如何在真实项目内用到BeautifulSoup库来解析网页,而新浪的新闻是ajax加载过来的数据,在这里我们只演示解析部分数据(具体反扒机制没做分析)。代码地址:https://gitee.com/dwyui/BeautifulSoup_xinlang.git。关于的爬虫的博客已经越来越多,使用到的技术也越来越多,后期我还会持续写下去,大概从几个角度去写,多线程爬取(提高效率),如何更好的做到爬取数据(破解反扒)。用redis管理多线程和代理

系统 2019-09-27 17:45:54 1931

Python

python购物车

python文件部分:user={'username':None}shopping_trolley={}shopping_num=[0]money=[0]my_money=[0]#获取商品列表defget_goods_list():withopen('shopping.txt',encoding='utf-8')asfr:shopping_dic=eval(fr.read())returnshopping_dicshopping_dic=get_goods

系统 2019-09-27 17:45:36 1931

Python

Python环境下安装使用异步任务队列包Celery的基础教程

1.简介celery(芹菜)是一个异步任务队列/基于分布式消息传递的作业队列。它侧重于实时操作,但对调度支持也很好。celery用于生产系统每天处理数以百万计的任务。celery是用Python编写的,但该协议可以在任何语言实现。它也可以与其他语言通过webhooks实现。建议的消息代理RabbitMQ的,但提供有限支持Redis,Beanstalk,MongoDB,CouchDB,,和数据库(使用SQLAlchemy的或Django的ORM)。celer

系统 2019-09-27 17:38:47 1931

Python

Python实现的批量下载RFC文档

RFC文档有很多,有时候在没有联网的情况下也想翻阅,只能下载一份留存本地了。看了看地址列表,大概是这个范围:http://www.networksorcery.com/enp/rfc/rfc1000.txt...http://www.networksorcery.com/enp/rfc/rfc6409.txt哈哈,很适合批量下载,第一个想到的就是迅雷……可用的时候发现它只支持三位数的扩展(用的是迅雷7),我想要下的刚好是四位数……郁闷之下萌生自己做一个的想

系统 2019-09-27 17:37:38 1931

编程技术

bottle json issure

iwantusemyjsonlibinbottle,butencoutersomeerrorasfollows:functionnothaswriteattribute,ithinktheproblemisbottlealsocontainaclassnamedjson,soiusefromlibimportjsonasjsonpyreplace,itfixapart,anotherproblemissomeoperateneedwritepermissi

系统 2019-08-29 23:04:07 1931

编程技术

新家不错

今天是第一次来JavaEye,浏览了一下网站感觉不错,就注册了帐号建个新家。因为是第一次在这写blog,所以先整一些废话填充一下门面。其实真正的原因是本人才疏学浅写不出什么有深度的文章,况且是个java初学者--半年多的学习经历。以前就听说过JavaEye,真的是很有名很出色的java交流平台。今天真是高兴能来到这个java的大家庭,看见有和自己一样的菜鸟还有大票的。感觉真是热闹啊~人是群居动物就是喜欢凑热闹,呵呵!看见这么多志同道合的兄弟姐妹真的很亲切。

系统 2019-08-29 22:42:53 1931

编程技术

Web service client

Thisarticleistalkingaboutthewebserviceclient.FirstlytheSOAPmessagemodel:then,themessagesample, 系统 2019-08-29 22:00:10 1931

编程技术

【文本分类】 概述

部分转载:http://www.blogjava.net/zhenandaci/archive/2008/05/31/204646.html作者:Jasper文本分类(textcategorization)问题就是将一篇文档归入预先定义的几个类别中的一个或几个,而文本的自动分类则是使用计算机程序来实现这样的分类。通俗点说,就好比你拿一篇文章,问计算机这文章要说的究竟是体育,经济还是教育,计算机答不上就打它的屁屁(……)。注意这个定义当中着重强调的两个事实。

系统 2019-08-29 21:59:32 1931

编程技术

团购《管理软件企业》(企业管理著名咨询师、畅

团购价:15元,原价:36元,可节省21元超级低价,此价格已包含运费!!!内容简介本书用“一幅图、一句话”来阐述系统性的软件企业管理方法。主要内容包括:企业管理的思想理念,主要论述“企业根本目标、企业道德、管理基本手段、如何使企业持续进步”等,使企业全员对“是非对错、轻重缓急”有共同的认识。企业战略管理,主要论述“设计盈利模式、提升核心竞争力、优化组织结构和人力资源、优化流程制度、消费者研究”等,指导企业领导开展最重要的工作。集成化流程,即把“营销客服过程

系统 2019-08-12 09:29:50 1931

Python

python实现多线程端口扫描

一个简易的TCP端口扫描器,使用python3实现。需求:扫描目标网站开放哪些端口号,将所有开放的端口号输出。分析:使用socket连接,如果连接成功,认为端口开放,如果连接失败,认为端口关闭(有可能端口开放但连接失败,这里简单认为端口不开放)使用到的库:socket,threading过程:先定义一个函数,对给定的(ip,port)进行扫描,看其是否能连接成功。deftcpPortScan(ip,port,openPort):sock=socket.so

系统 2019-09-27 17:55:41 1930