搜索到与相关的文章
Python

【Python】爬取天眼查公司电话以及地址信息

码字不易,喜欢请点赞!!!背景:其实两年前就爬了天眼查的很多信息,包括电话、地址等基本信息之外,还有公司的股东、专利以及对外投资等信息,但是当时的电脑没备份,代码都没了。这次山东的某个教育机构有偿找我帮爬天眼查公司电话以及地址信息,所以就重新爬了一下天眼查。准备:selenium+PhatomJS或者selenium+Firefox我这里直接用的后者selenium+Firefox思路爬取这部分信息的话,代码其实不难,主要包括模拟登陆、获得页面网址以及抓取

系统 2019-09-27 17:56:18 2486

Python

用Python爬取中国校花网后,我发现她们都有个共同点

我们都知道,爬虫获取页面的响应之后,最关键的就是如何从繁杂的网页中把我们需要的数据提取出来,python从网页中提取数据的包很多,常用的解析模块有下面的几个:BeautifulSoupAPI简单但解析速度慢,不推荐使用lxml由C语言编写的xml解析库(libxm2),解析速度快但是API复杂Scrapy综合以上两者优势实现了自己的数据提取机制,被称为Selector选择器。它是由lxml库构建的,并简化了API,先通过XPath或者CSS选择器选中要提取

系统 2019-09-27 17:54:28 2486

Python

Python程序打包工具py2exe和PyInstaller详解

前言通常执行python程序要有相应的Python环境,但某些特定场景下,我们可能并不愿意这么麻烦的去配置这些环境(比如将写好的脚本发给客户进行操作),如果可以提前将程序打包成Windows平台的.exe文件或者是Linux下的.sh脚本,那么使用起来就会方便很多,py2exe和PyInstaller这两款工具都是干这么个事的,下面以hello.py脚本(代码内容如下)为例进行介绍。age=input("Howoldareyou?\n")print("A:

系统 2019-09-27 17:53:51 2486

Python

python之列表的输出

以下代码对于元组,字典和列表都是可以用的A=[1,2,3]print(A)#输出整个列表,包括逗号和括号等A=[1,2,3]forainA:print(a)#输出所有元素A=[1,2,3]N=0whileN列表的排序https://blog.csdn.net/GrofChen/article/details/91466264列表的所有内置函数https://blog.csdn.net/GrofChen/article/details/91371937

系统 2019-09-27 17:53:29 2486

Python

Python定向爬虫,模拟新浪微博登录!

当我们试图从新浪微博抓取数据时,我们会发现网页上提示未登录,无法查看其他用户的信息。模拟登录是定向爬虫制作中一个必须克服的问题,只有这样才能爬取到更多的内容。实现微博登录的方法有很多,一般我们在模拟登录时首选WAP版。因为PC版网页源码中包括很多的js代码,提交的内容也更多,不适合机器模拟登录。我们实现微博登录的大体思路是这样的:用抓包工具把正常登录时要提交的字段都记录下来;模拟提交这些字段;判断是否登录成功;原理很简单,让我们一步一步来实现吧。一.抓包利

系统 2019-09-27 17:53:11 2486

Python

Python网络爬虫——bs4基本用法

使用流程:-导包:frombs4importBeautifulSoup-使用方式:可以将一个html文档,转化为BeautifulSoup对象,然后通过对象的方法或属性去查找指定的节点内容。(1)转化本地文件:-soup=BeautifulSoup(open(‘本地文件’),‘lxml’)(2)转化网络文件(与requests配合):-page_text=requests.get(url=url,headers=headers).text-soup=Bea

系统 2019-09-27 17:52:15 2486

Python

python挖矿算力测试程序详解

谈到比特币,我们都知道挖矿,有些人并不太明白挖矿的含义。这里的挖矿其实就是哈希的碰撞,举个简单例子:importhashlibx=11y=1#这里可以调节挖矿难度,也就是哈希的长度whilehashlib.sha256(f'{x*y}'.encode("utf-8")).hexdigest()[5:7]!="00":print(x*y)y+=1print("找到了:",(x*y))结果如下:当然比特币的挖矿要比这个复杂太多,但是原理差不多,有个大概的认知。

系统 2019-09-27 17:49:39 2486

Python

Python使用到第三方库PyMuPDF图片与pdf相互转换

使用Python进行图片和pdf之间的相互转换使用到第三方库PyMuPDF在python环境下对PDF文件的操作。PDF转为图片需新建文件夹pdf2pngimportfitzimportglobdefrightinput(desc):flag=Truewhile(flag):instr=input(desc)try:intnum=eval(instr)iftype(intnum)==int:flag=Falseexcept:print('请输入正整数!')

系统 2019-09-27 17:49:31 2486

Android

Android 中的 adapter

Adapter介绍Adapter是将数据绑定到UI界面上的桥接类。Adapter负责创建显示每个项目的子View和提供对下层数据的访问。支持Adapter绑定的UI控件必须扩展AdapterView抽象类。创建自己的继承自AdapterView的控件和创建新的Adapter类来绑定它们是可能的。一些Android提供的Adapter介绍在多数情况下,你不需要白手创建自己的Adapter。Android提供了一系列Adapter来将数据绑定到UIWidget

系统 2019-08-29 23:48:27 2486

编程技术

浦东建设中标重大工程 中标价共5.7亿

http://www.sina.com.cn2007年10月08日19:49全景网全景网10月8日讯浦东建设(26.22,-1.93,-6.86%)(600284)公布重大工程中标公告,公告显示,上海浦东路桥建设(18.11,0.04,0.22%)股份有限公司于近日中标中环线浦东段(上中路越江隧道-申江路)新建工程6标和中环线浦东段新建工程14标,中标价分别为41388.8378万元、16438.0241万元,工期分别为795天、825天。上述工程计划开工

系统 2019-08-29 23:45:09 2486