用PYTHON爬虫简单爬取网络小说。这里是17K小说网上,随便找了一本小说,名字是《千万大奖》。里面主要是三个函数:1、get_download_url()用于获取该小说的所有章节的URL。分析了该小说的目录页http://www.17k.com/list/2819620.html的HTML源码,发现其目录是包含在Volume里的A标签合集。所以就提取出了URLS列表。2、get_contents(target)用于获取小说指定章节的正文内容分析了小说中第
系统 2019-09-27 17:48:50 2357
这篇文章主要介绍了python智联招聘爬虫并导入到excel代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下写了一个智联招聘的爬虫,只要输入职位关键字,就能快速导出智联招聘上的数据,存在excel表里~importrequests,openpyxl#建立excel表joblist=[]wb=openpyxl.Workbook()sheet=wb.activesheet.title='智联招聘数据's
系统 2019-09-27 17:48:41 2357
TF(TermFrequency)词频,在文章中出现次数最多的词,然而文章中出现次数较多的词并不一定就是关键词,比如常见的对文章本身并没有多大意义的停用词。所以我们需要一个重要性调整系数来衡量一个词是不是常见词。该权重为IDF(InverseDocumentFrequency)逆文档频率,它的大小与一个词的常见程度成反比。在我们得到词频(TF)和逆文档频率(IDF)以后,将两个值相乘,即可得到一个词的TF-IDF值,某个词对文章的重要性越高,其TF-IDF
系统 2019-09-27 17:48:00 2357
socket函数简述socket又称套间字或者插口,是网络通信中必不可少的工具。有道是:“无socket,不网络”。由于socket最早在BSDUnix上使用,而Unix/Linux所奉为经典的至高哲学是“一切皆是文件”。因此socket在使用时也是完全符合这个哲学的,它涉及到listen()、bind()、accept()、write()/read()、close()等基本的类似于文件操作的功能函数。socket用法importsocketsocket.
系统 2019-09-27 17:47:20 2357
一直以来被Linux的hostname和fqdn(FullyQualifiedDomainName)困惑了好久,今天专门抽时间把它们的使用细节弄清了。一、设置hostname/fqdn在Linux系统内设置hostname很简单,如:$hostnameflorian如果要设置fqdn的话,需要对/etc/hosts进行配置。$cat/etc/hosts127.0.0.1localhost192.168.1.1florian.test.comflorian/
系统 2019-09-27 17:38:33 2357
转自傅佩荣先生的Blog(http://blog.sina.com.cn/fupeirong)缘起:5.12地震不仅牵动大陆13亿同胞的心,也牵动了全球华人的心。我经历过台湾9.21地震,并做过系列灾后心灵抚慰的公益演讲。我深知重大灾难会给人们带来持久的心理创伤,他们不仅需要医疗和物质上的救援,同时也需要有心灵抚慰的援助。在北京大学曾经听过我演讲的学生,即此次公益演讲的主要发起人和组织者,与我在北京的助理联系后,得知我的愿望,不畏艰辛,与各级政府部门进行沟
系统 2019-08-29 23:41:09 2357
iSqlPlus是Oracle9i提供的新功能,是Sqlplus的Web形式发布。是基于三层结构涉及的。其client、middle、server可以位于同一台机器上也可以位于不同的机器。iSqlPlus不需要单独安装,访问iSqlPlus你只需要知道中间层服务器的地址和端口,可以以标准用户或者sysdba、sysoper的身份登陆。iSQL*Plus提供快速的、基于浏览器的界面,它通过一个三层模型来使用SQL*Plus处理引擎,这个模型包括:客户机层(i
系统 2019-08-29 23:17:06 2357
1、代码packageliusextract;importjava.io.File;importjava.io.FileInputStream;importjava.io.FileNotFoundException;importjava.io.UnsupportedEncodingException;importlius.index.pdf.PdfIndexer;importlius.index.powerpoint.PPTIndexer;importli
系统 2019-08-29 23:16:18 2357
¯理解封装封装(Encapsulation)是面向对象三大特征之一(封装、继承、多态),它指的是将对象的状态信息隐藏在内部,不允许外部程序直接访问对象内部信息,而是通过该类所提供的方法来实现对内部信息的操作和访问。对一个类或对象实现良好的封装,可以实现以下目的:µ隐藏类的实现细节。µ让使用者只能通过事先预定的方法访问数据,从而可以在该方法里加入控制逻辑,限制对属性不合理访问。µ可进行数据检查,从而有利于保证对象信息的完整性。µ便于修改,提高代码的可维护性。
系统 2019-08-29 22:55:54 2357
本文主要参考http://tech.ccidnet.com/art/1081/20050413/237901_1.html上的文章。C++调用JAVA主要用到了SUN公司的JNI技术,JNI是JavaNativeInterface的缩写。从Java1.1开始,JavaNativeInterface(JNI)标准成为java平台的一部分,它允许Java代码和其他语言写的代码进行交互。相关资料见http://java.sun.com/j2se/1.5.0/do
系统 2019-08-29 22:22:24 2357