- 军军小站|张军博客
搜索到与相关的文章
Python

Python学习笔记之爬虫 汇总篇(更新中)

[TOC]Python网络爬虫之规则01Python爬虫之Requests库入门02Python爬虫之盗亦有道03Python爬虫之Requests网络爬取实战Python网络爬虫之提取04Python爬虫之BeautifulSoup库05Python爬虫之信息标记与提取方法06Python爬虫之Re(正则表达式)库

系统 2019-09-27 17:46:30 1940

Python

用python读取excel文件

常用的简单的用法:fromxlrdimportopen_workbookbook=open_workbook(r'C:\Users\admin\Desktop\q.xlsx')sheet=book.sheets_names()[0]#第一个工作表名称sheet=data.sheet_by_name('Sheet1')#获得第一个工作表sheet=book.sheets()[0]#获得第一个工作表#获取总行数nrows=table.nrows#获取总列数nc

系统 2019-09-27 17:45:47 1940

Python

Python中type的构造函数参数含义说明

测试代码如下:复制代码代码如下:classModelMetaClass(type):def__new__(cls,name,base,attrs):logging.info("clsis:"+str(cls))logging.info("nameis:"+str(name))logging.info("baseis:"+str(base))logging.info("attrsis:"+str(attrs))returntype.__new__(cls,n

系统 2019-09-27 17:45:40 1940

Python

python动态网页批量爬取

四六级成绩查询网站我所知道的有两个:学信网(http://www.chsi.com.cn/cet/)和99宿舍(http://cet.99sushe.com/),这两个网站采用的都是动态网页。我使用的是学信网,好了,网站截图如下:网站的代码如下:准考证号:请输入15位准考证号姓名:姓名超过3个字,可只输入前3个由图中可以看出表单提交的链接为/cet/query,即:http://www.chsi.com.cn/cet/query,好了,填写表单和结果如下:

系统 2019-09-27 17:38:16 1940

Python

用python简单实现mysql数据同步到ElasticSearch的教程

之前博客有用logstash-input-jdbc同步mysql数据到ElasticSearch,但是由于同步时间最少是一分钟一次,无法满足线上业务,所以只能自己实现一个,但是时间比较紧,所以简单实现一个思路:网上有很多思路用什么mysql的binlog功能什么的,但是我对mysql了解实在有限,所以用一个很呆板的办法查询mysql得到数据,再插入es,因为数据量不大,而且10秒间隔同步一次,效率还可以,为了避免服务器之间的时间差和mysql更新和查询产生

系统 2019-09-27 17:37:40 1940

编程技术

lucene-索引的优化和索引过程查看

代码:(索引建立)packagebindex;importjava.io.IOException;importjava.io.PrintStream;importjava.net.URL;importjava.util.ArrayList;importjava.util.List;importjeasy.analysis.MMAnalyzer;importorg.apache.lucene.analysis.PerFieldAnalyzerWrapper;

系统 2019-08-29 23:50:30 1940

编程技术

flash中用BitmapData类制作图片“环绕”效果

这种效果做法很多,网上到处可以搜出一大堆!本例主要是应用了BitmapData类,仿制很容易。做法:处理一张首尾相接的环绕图片,导入Flash库中,打开库,右击图片,选“链接”,“为ActionScript导出“,标识ID名为:pic场景上什么也不放。最好将场景高度设为与图片一样高。宽度随意,但要小于图片宽度。在第一帧粘帖如下代码,即可测试:importflash.display.BitmapData;importflash.geom.*;//从库里取图v

系统 2019-08-29 23:29:17 1940

编程技术

Lucene.NET 使用

本文仅记录一些简单的使用方法,供初学者参考。以下例子采用Lucene.NET1.9版本,可取去Lucene.Net下载。1.基本应用usingSystem;usingSystem.Collections.Generic;usingSystem.Text;usingLucene.Net;usingLucene.Net.Analysis;usingLucene.Net.Analysis.Standard;usingLucene.Net.Documents;us

系统 2019-08-29 23:21:30 1940

编程技术

用One-JAR简化应用程序交付

如果您曾经试图把Java应用程序交付为单一的Java档案文件(JAR文件),那么您很有可能遇到过这样的需求:在构建最终档案文件之前,要展开支持JAR文件(supportingJARfile)。这不但是一个开发的难点,还有可能让您违反许可协议。在本文中,Tuffs向您介绍了One-JAR这个工具,它使用定制的类装入器,动态地从可执行JAR文件内部的JAR文件中装入类。

系统 2019-08-29 23:18:26 1940

编程技术

第一章:第二节(一个简单的点击事件)

一个简单的点击事件package第一章;importcom.trolltech.qt.gui.QApplication;importcom.trolltech.qt.gui.QPushButton;publicclass第二节{/***@paramargs*/publicstaticvoidmain(String[]args){//TODOAuto-generatedmethodstubQApplication.initialize(args);QPush

系统 2019-08-29 23:15:23 1940