搜索到与相关的文章
Python

python58同城爬虫

importrequests,time,csvfrombs4importBeautifulSouphref_list=[]url='https://hz.58.com/lvguanbinguan'headers={'user-agent':}params={'PGTID':'0d306b32-0004-f711-87c6-3e3cb7371c0d','ClickID':'2'}res=requests.get(url,headers=headers,par

系统 2019-09-27 17:49:24 2125

Python

Python -- 每日一练

文章目录一、随机数生成并保存到本地一、随机数生成并保存到本地20190621–对用户系统随机优惠码(数字+小写字符)进行爆破指定的随机数生成脚本。#-*-coding:utf-8-*-#导入random,string模块importrandom,string#控制循环遍历次数(生成1000次)forninrange(1000):#join将随机字符的列表转换为字符串格式ran_str2=''.join(random.sample('abcdefghijkl

系统 2019-09-27 17:46:26 2125

Python

: Python

本文将从以下几点来介绍protobuf:1.安装2.定义protobuf消息格式3.编译protobuf4.读写protobuf1.安装下载protobuf。下载地址添加环境变量。将proto.exe所在的路径名放在path下。如图:2.定义protobuf消息格式我们将要使用的示例是一个非常简单的“地址簿”应用程序,可以在文件中读取和写入人员的联系人详细信息。地址簿中的每个人都有姓名,ID,电子邮件地址和联系电话号码。要创建地址簿应用程序,需要从.pro

系统 2019-09-27 17:46:17 2125

Python

python h5py库的使用

文章目录H5数据集的使用使用h5py的group分割GB级数据H5数据集的使用#创建withh5py.File("data_train.h5",'w')ashf:hf.create_dataset('train_input',data=shuffled_input)hf.create_dataset('train_label',data=shuffled_label)#打开withh5py.File("data_train.h5",'r')ashf:tra

系统 2019-09-27 17:46:09 2125

Python

Kmeans分类python实现

Kmean分类项目链接:https://github.com/Wchenguang/gglearn/blob/master/KmeansClassifier/讲解/KmeansClassifier.ipynb首先,随机确定K个初始点作为质心(不必是数据中的点)。然后将数据集中的每个点分配到一个簇中,具体来讲,就是为每个点找到距其最近的质心,并将其分配该质心所对应的簇.这一步完成之后,每个簇的质心更新为该簇所有点的平均值.重复上述过程直到数据集中的所有点都距

系统 2019-09-27 17:45:38 2125

Python

基于Python的身份证号码自动生成程序

需求细化:1.身份证必须能够通过身份证校验程序。2.通过查询,发现身份证号码是有国家标准的,标准号为GB11643-1999可以从百度下载到这个文档下载:GB11643-1999sfz(jb51.net).rar现行身份证号为18位,分别为6位地址码,8位生日,3位顺序码,一位校验码。具体例子可见下图。前六位也是国家标准,GB2260-2007。吐槽一下,国标竟然没有一个网站供全面检索和免费下载。。。还好国家统计局有这些公开数据。可以从统计数据-》统计标准

系统 2019-09-27 17:38:32 2125

Python

零基础写python爬虫之爬虫的定义及URL构成

一、网络爬虫的定义网络爬虫,即WebSpider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页的。从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。这样看来,网络爬虫

系统 2019-09-27 17:38:09 2125

Python

python中常用的九种预处理方法分享

本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1.标准化(StandardizationorMeanRemovalandVarianceScaling)变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。sklearn.preprocessing.scale(X)一般会把train和test集放在一起做标准化,或者在tr

系统 2019-09-27 17:38:06 2125

编程技术

瀑布流布局浅析

简介如果你经常网上冲浪,这样参差不齐的多栏布局,是不是很眼熟啊?类似的布局,似乎一夜之间出现在国内外大大小小的网站上,比如Pinterest(貌似是最早使用这种布局的网站了),Mark之,蘑菇街,点点网,以及淘宝最新上线的“哇哦”等等,倒是很流行哈~在淘宝即将上线的众多产品中,你还会大量看到这样的形式呢。这种布局适合于小数据块,每个数据块内容相近且没有侧重。通常,随着页面滚动条向下滚动,这种布局还会不断加载数据块并附加至当前尾部。所以,我们给这样的布局起了

系统 2019-08-29 23:45:43 2125

编程技术

堆栈与函数调用

作者xgywinner日期2009-3-1811:44:001)在栈上创建。在执行函数时,函数内局部变量的存储单元都在栈上创建,函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器的指令集中,一般使用寄存器来存取,效率很高,但是分配的内存容量有限。2)从堆上分配,亦称动态内存分配。程序在运行的时候用malloc或new申请任意多少的内存,程序员自己负责在何时用free或delete来释放内存。动态内存的生存期由程序员自己决定,使用非常灵活。3)

系统 2019-08-29 23:33:28 2125