- 军军小站|张军博客
搜索到与相关的文章
Python

Python爬虫入门【9】:图虫网多线程爬取

图虫网-写在前面经历了一顿噼里啪啦的操作之后,终于我把博客写到了第10篇,后面,慢慢的会涉及到更多的爬虫模块,有人问scrapy啥时候开始用,这个我预计要在30篇以后了吧,后面的套路依旧慢节奏的,所以莫着急了,100篇呢,预计4~5个月写完,常见的反反爬后面也会写的,还有fucklogin类的内容。图虫网-爬取图虫网为什么要爬取这个网站,不知道哎~莫名奇妙的收到了,感觉图片质量不错,不是那些妖艳贱货可以比的,所以就开始爬了,搜了一下网上有人也在爬,但是基本

系统 2019-09-27 17:56:55 1891

Python

Python爬虫入门【10】:电子书多线程爬取

最近想找几本电子书看看,就翻啊翻,然后呢,找到了一个叫做周读的网站,网站特别好,简单清爽,书籍很多,而且打开都是百度网盘可以直接下载,更新速度也还可以,于是乎,我给爬了。本篇文章学习即可,这么好的分享网站,尽量不要去爬,影响人家访问速度就不好了http://www.ireadweek.com/,想要数据的,可以在我博客下面评论,我发给你,QQ,邮箱,啥的都可以。这个网站页面逻辑特别简单,我翻了翻书籍详情页面,就是下面这个样子的,我们只需要循环生成这些页面的

系统 2019-09-27 17:56:54 1891

Python

python基础语法

第一个Python程序交互式编程交互式编程不需要创建脚本文件,是通过Python解释器的交互模式进来编写代码。linux上你只需要在命令行中输入Python命令即可启动交互式编程,提示窗口如下:$pythonPython2.7.6(default,Sep92014,15:04:36)[GCC4.2.1CompatibleAppleLLVM6.0(clang-600.0.39)]ondarwinType“help”,“copyright”,“credits”

系统 2019-09-27 17:56:51 1891

Python

深入了解Python枚举类型的相关知识

枚举类型可以看作是一种标签或是一系列常量的集合,通常用于表示某些特定的有限集合,例如星期、月份、状态等。Python的原生类型(Built-intypes)里并没有专门的枚举类型,但是我们可以通过很多方法来实现它,例如字典、类等:MiracleLove={'MON':'林志玲','TUS':'陈意涵','WEN':'张柏芝','THU':'辛芷蕾','FRI':'周冬雨'}classMiracleLove:MON='林志玲'TUS='陈意涵'WEN='张柏

系统 2019-09-27 17:56:49 1891

Python

python 解析html

获取制定标签内容,以及HTML全部文本代码#-*-coding:utf-8-*-importrehtml="岗位职责:完成推荐算法、数据统计、接口、后台等服务器端相关工作必备要求:良好的自我驱动力和职业素养,工作积极主动、结果导向"#获得全部文本dr=re.compile(r'<[^>]+>',re.S)dd=dr.sub('',html)print(dd)print("*"*20)#取出p标签中的文本html_regex=r".*?(.*?)"resul

系统 2019-09-27 17:56:47 1891

Python

小白学Python

本人财务狗一枚,编程基础为0。因为提升工作效率的主观愿望(备注:懒),准备开始学点python。因为平时比较忙(事多),可能更新的非常慢,估计2019年11月开始正式学习更新。给自己立个flag,主要学习内容两个:(1)提升办公效率(2)pandas库学习day1基础软件安装安装anaconda\pycharm\cmder软件介绍:Pycharm是集成开发环境(操作平台),Anaconda是集成环境管理器(库包),cmder好用的程序操作命令参考文档:Py

系统 2019-09-27 17:56:37 1891

Python

python django 原生sql 获取数据的例子

如下所示:node2:/django/mysite/blog#catviews.py1,#-*-coding:utf-8-*-from__future__importunicode_literals#fromdjango.shortcutsimportrender,render_to_responsefrom.modelsimport*#Createyourviewshere.fromdjango.httpimportHttpResponsefromdja

系统 2019-09-27 17:56:26 1891

Python

利用Python判定IP地址合法性的三种方法

在帮朋友解决这个问题后,随便记录一下这三种方法:第一种方法:使用正则表达式:因为当时的要求是判定10.0.0.1到10.255.255.255,原理其实是一样。这里简单回顾一下正则表达式模式的内容:常见的如:\d可以表示0~9的任意一个数字字符而\D是匹配一个非数字字符等价于^^是匹配字符串的开头,但放在[]中表示匹配不在[]中的字符$是匹配字符串的末尾.是匹配除了换行符任意字符{}表示重复几次,例如:^a{2,4}$aa,aaa或aaaa|的是或的意思[

系统 2019-09-27 17:55:59 1891

Python

[python学习笔记]loc与iloc函数的用法及区别

loc(location)为SelectionbyLabel函数,即通过标签(行列索引的具体值)来索引数据,由于loc函数中索引的标签是str类型,所以标签的开头和结尾都要写。importpandasaspdimportnumpyasnpdf=pd.DataFrame(np.arange(0,60,2).reshape(10,3),columns=list('abc'))df.loc[0:2,['b','c']]#默认行索引情况下,选取df前三行的b,c两

系统 2019-09-27 17:55:53 1891

Python

python测试驱动开发实例

本文实例讲述了python测试驱动开发的方法,分享给大家供大家参考。具体方法如下:importunittestfrommainimportSampleclassSampleTest(unittest.TestCase):defsetUp(self):print"createanewSample"self._sample=Sample("b64e5843ca7db8199c405be565fa7f57")deftearDown(self):print"Des

系统 2019-09-27 17:55:39 1891