- 军军小站|张军博客
搜索到与相关的文章
Python

python利用re,bs4,requests模块获取股票数据

今天闲来无聊无意间看到了百度股票,就想着用python爬一下数据,于是就找到了东方财经网,结合这两个网站,写了一个小爬虫,数据保存在文件中,比较简单的示例,就当做用来练习正则表达式和BeautifulSoupl了。首先页面分析,打开东方财经网股票列表页,和百度股票详情页,右键查看网页源代码,网址后面的代码就是股票代码,所以打算先获取股票代码,然后获取详情,废话少说,直接上代码吧:importreimportrequestsfrombs4importBeau

系统 2019-09-27 17:54:39 1858

Python

裸辞面11家python公司,拿到4个offer!网友:买了简历置顶会员吗?

原文链接:https://edu.csdn.net/topic/python115?utm_source=yjs我一直认为,敢裸辞的只有2种人:1、能力足够强,即使裸辞也不会被财务问题所困,更不愁找工作。2、年轻气盛,遇到傻X领导和傻X同事,绝对0容忍!但是最近我在刷某乎的时候,发现了第三种人。为了方便面试而裸辞。裸辞面试11家python公司一口气拿到4个offer这无疑是一种高效的方式,但是如果底气不够,还是很容易陷入焦虑的。还好的是,这位up主后续更

系统 2019-09-27 17:54:31 1858

Python

谁说学Python不实用,看我如何用数据分析来反击给我丢锅的同事!

运营:“活动参与人数那么少,肯定是推广渠道不行”市场:“PV和UV都很高,最后转化这么低,运营是不是有环节没做好?”产品:“我觉得这个功能这样改绝对能提升用户留存!所以这个需求必须要实现”程序员:“怎么证明这是有效需求,我不要你觉得...”如果各位在职场中有和同事argue的经历,凭猜想定位问题,彼此谁都说服不了谁,这个时候就要丢出杀手锏——数据。不仅要拿数据,还要用数据,用数据分析每个环节,定位具体问题,用异常数据证明问题所在,用合理数据推测活动效果。拥

系统 2019-09-27 17:53:44 1858

Python

24式加速你的Python

这是小编推荐的第25篇好文来源:Python与算法之美作者:梁云1991一,分析代码运行时间第1式,测算代码运行时间平凡方法快捷方法(jupyter环境)第2式,测算代码多次运行平均时间平凡方法快捷方法(jupyter环境)第3式,按调用函数分析代码运行时间平凡方法快捷方法(jupyter环境)第4式,按行分析代码运行时间平凡方法快捷方法(jupyter环境)二,加速你的查找第5式,用set而非list进行查找低速方法高速方法第6式,用dict而非两个li

系统 2019-09-27 17:53:41 1858

Python

《Python数据科学入门》之阅读笔记(第3章)

Python数据科学入门DmitryZinoviev著熊子源译第三章使用文本数据第13单元处理HTML文件Beautifulsoup通过Python字典接口实现对HTML标签属性的访问。如果标签对象t表示超链接,则超链接目标的字符串值为t[“herf”].string。HTML标签是不区分大小写的。Soup最有用的函数:soup.find()找到目标的一个实例soup.find_all()找到目标的所有实例HTML\XML之所以强大,是因为有多样化的功能,

系统 2019-09-27 17:53:41 1858

Python

Python中optparse模块使用浅析

最近遇到一个问题,是指定参数来运行某个特定的进程,这很类似Linux中一些命令的参数了,比如ls-a,为什么加上-a选项会响应。optparse模块实现的也是类似的功能,它是为脚本传递命令参数。使用此模块前,首先需要导入模块中的类OptionParser,然后创建它的一个实例(对象):复制代码代码如下:fromoptparseimportOptionParserparser=OptionParser()#这里也可以定义类的参数,后续有接着就可以添加选项了,

系统 2019-09-27 17:53:20 1858

Python

python 基于TCP协议的套接字编程详解

基于TCP协议的套接字编程实现电话沟通为例,这里传递的是字符,可以自己尝试去发送一个文件#服务端importsocket#1.符合TCP协议的手机server=socket.socket(socket.AF_INET,socket.SOCK_STREAM)#TCP#2.绑定手机号一个服务器,我们自己的电脑作为服务器的话,用自己的IP地址server.bind(('127.0.0.1',8000))#127.0.0.1代表本地#server.bind(('1

系统 2019-09-27 17:53:04 1858

Python

python下wordpdf转换总结

近期涉及到了关于doc文档读取的处理,也查了很久,为了便于大家使用,故集大成一下。Doc文档读取有如下几种:1、从doc读取文本目前没有找到直接的方式,一般是先转为docx文件在处理。所使用工具为doc2doc(批量时可用),或人工另存处理。2、从docx读取文本一般使用python-docx库的方法,但只支持创建新文档和读取一些基本的文件数据,如文件大小和文件标题,不支持正文读取。或直接从docx中读取xml的方法。3、从pdf读取文本一般使用pdf

系统 2019-09-27 17:53:01 1858

Python

八大排序算法使用python实现

一、冒泡排序冒泡排序算法的运作如下:比较相邻的元素。如果第一个比第二个大,就交换他们两个。对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。针对所有的元素重复以上的步骤,除了最后一个。持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。以上节选自维基百科代码实现:defbubble_sort(numberlist):length=len(numberlist)foriinrange(lengt

系统 2019-09-27 17:52:52 1858

Python

2019最新Python爬虫面试高频率面试题总结(二)

今天接着跟大家总结Python爬虫面试中常见的高频面试题。有需要的伙伴用心看啦!1.Request中包含什么呢?1、请求方式:主要有GET和POST两种方式,POST请求的参数不会包含在url里面2、请求URLURL:统一资源定位符,如一个网页文档、一张图片、一个视频等都可以用URL来唯一确定3、请求头信息,包含了User-Agent(浏览器请求头)、Host、Cookies信息4、请求体,GET请求时,一般不会有,POST请求时,请求体一般包含form-

系统 2019-09-27 17:52:44 1858