Python

python爬取全国2000多个城市的经纬度及geohash编码

如何爬取全国两千多个城市的经纬度?其实找对了数据源就一点也不难。哪些网站可能会有全国所有城市的经纬度呢?高德地图?百度地图?统计局?淘宝?……这次我们来试试通过饿了么爬取:importrequests,csv,Geohashurl='https://www.ele.me/restapi/shopping/v1/cities'headers={'referer':'https://www.ele.me/home/','user-agent':'user-ag

系统 2019-09-27 17:48:42 2468

Python

使用Python实现BT种子和磁力链接的相互转换

bt种子文件转换为磁力链接BT种子文件相对磁力链来说存储不方便,而且在网站上存放BT文件容易引起版权纠纷,而磁力链相对来说则风险小一些。而且很多论坛或者网站限制了文件上传的类型,分享一个BT种子还需要改文件后缀或者压缩一次,其他人需要下载时候还要额外多一步下载种子的操作。所以将BT种子转换为占用空间更小,分享更方便的磁力链还是有挺大好处的。首先一个方案是使用bencode这个插件,通过pip方式安装或者自行下载源文件https://pypi.python.

系统 2019-09-27 17:37:55 2468

Python

基于python实现的抓取腾讯视频所有电影的爬虫

我搜集了国内10几个电影网站的数据,里面近几十W条记录,用文本没法存,mongodb学习成本非常低,安装、下载、运行起来不会花你5分钟时间。#-*-coding:utf-8-*-#byawakenjoys.mysite:www.dianying.atimportreimporturllib2frombs4importBeautifulSoupimportstring,timeimportpymongoNUM=0#全局变量,电影数量m_type=u''#全局

系统 2019-09-27 17:37:39 2468

Python

[Python3爬虫]爬取新浪微博用户信息及微博内容

[Python3爬虫]爬取新浪微博用户信息及微博内容大数据时代,对于研究领域来说,数据已经成为必不可少的一部分。新浪微博作为新时代火爆的新媒体社交平台,拥有许多用户行为及商户数据,因此需要研究人员都想要得到新浪微博数据,But新浪微博数据量极大,获取的最好方法无疑就是使用Python爬虫来得到。网上有一些关于使用Python爬虫来爬取新浪微博数据的教程,但是完整的介绍以及爬取用户所有数据信息比较少,因此这里分享一篇主要通过selenium包来爬取新浪微博用

系统 2019-09-27 17:56:33 2466

Python

Python实现平行坐标图的两种方法小结

平行坐标图,一种数据可视化的方式。以多个垂直平行的坐标轴表示多个维度,以维度上的刻度表示在该属性上对应值,相连而得的一个折线表示一个样本,以不同颜色区分类别。但是很可惜,才疏学浅,没办法在Python里实现不同颜色来区分不同的类别。如果对此比较在意的大神可以不要往下看了。。。。。。。。。上图是一个基于iris数据集所画的一个平行坐标图。隔开隔开.......................................隔开隔开不多扯了,下面正式上代码方法

系统 2019-09-27 17:48:19 2465

Python

Python比较配置文件

工作中最常见的配置文件有四种:普通key=value的配置文件、Json格式的配置文件、HTML格式的配置文件以及YAML配置文件。这其中以第一种居多,后三种在成熟的开源产品中较为常见,本文只针对第一种配置文件。一般来说Linuxshell下提供了diff命令来比较普通文本类的配置文件,Python的difflib也提供了str和HTML的比较接口,但是实际项目中这些工具其实并不好用,主要是因为我们的配置文件并不是标准化统一化的。为了解决此类问题,最好针对

系统 2019-09-27 17:56:01 2464

Python

【Python爬虫】MongoDB爬虫实践:爬取虎扑论坛

MongoDB爬虫实践:爬取虎扑论坛网站地址为:https://bbs.hupu.com/bxj1.网站分析首先,定位网页上帖子名称、帖子链接、作者、作者链接、创建时间、回复数目、浏览数目、最后回复用户、最后回复时间等信息的位置,之后,我们使用BeautifulSoup在网页中定位这些。数据所在的位置数据位置某帖子所有数据‘li’帖子名称divclass="titlelinkbox">a帖子链接divclass="titlelinkbox">a['href

系统 2019-09-27 17:55:14 2464

Python

基于python的socket实现单机五子棋到双人对战

基于python的socket实现单机五子棋到双人对战,供大家参考,具体内容如下本次实验使用python语言。通过socket进行不同机器见的通信,具体可以分为以下四步:1.创建ServerSocket和Socket;2.打开链接到Socket的输入/输出流;3.按照协议对Socket进行读/写操作;4.关闭输入输出流、关闭Socket。由于是双人对战,服务器必须应对多人及以上的客户端的连接,因此本实验还引入了python的threading多线程模块,通

系统 2019-09-27 17:48:47 2464

Python

Python实现扫描局域网活动ip(扫描在线电脑)

内网的主机都是自动分配ip地址,有时候需要查看下有那些ip在使用,就写了个简单的脚本。linux和windows下都可以用,用多线程来ping1-255所有的地址,效率不高,2分钟左右。先凑合和用吧。#-*-coding:utf-8-*-#author:orangleliudate:2014-11-12#python2.7.xip_scaner.py'''''不同平台,实现对所在内网端的ip扫描有时候需要知道所在局域网的有效ip,但是又不想找特定的工具来扫

系统 2019-09-27 17:48:35 2464

Python

Python流行ORM框架sqlalchemy安装与使用教程

本文实例讲述了Python流行ORM框架sqlalchemy安装与使用。分享给大家供大家参考,具体如下:安装http://docs.sqlalchemy.org1、安装#进入虚拟环境#执行./python3-mpipinstallimportsqlalchemyprint(sqlalchemy.__version__)#1.1.15我这里使用的版本是1.1.15创建连接对象http://docs.sqlalchemy.org/en/latest/orm/t

系统 2019-09-27 17:57:32 2463

Python

49个Python学习资源:从初学者到高级玩家都有了

导读:本文为不同阶段的Python学习者从不同角度量身定制了49个学习资源。来源:专知(ID:Quan_Zhuanzhi)01初学者1.WelcometoPython.orghttps://www.python.org/官方Python站点提供了一个开始使用Python生态系统和学习Python的好方法,包括官方文档。2.LearningPythonTheHardWayhttps://learnpythonthehardway.org/book/一本在线书

系统 2019-09-27 17:56:46 2463

Python

python图像分割

1、图像分割原理图像分割(imagesegmentation)技术是计算机视觉领域的一个重要的研究方向,是图像语义理解的重要一环。图像分割是指将图像分成若干具有相似性质的区域的过程,从数学角度来看,图像分割是将图像划分成互不相交的区域的过程。近些年来随着深度学习技术的逐步深入,图像分割技术有了突飞猛进的发展,该技术相关的场景物体分割、人体前背景分割、人脸人体Parsing、三维重建等技术已经在无人驾驶、增强现实、安防监控等行业都得到广泛的应用。GraphC

系统 2019-09-27 17:53:33 2463

Python

简单的Python的curses库使用教程

curses库(ncurses)提供了控制字符屏幕的独立于终端的方法。curses是大多数类似于UNIX的系统(包括Linux)的标准部分,而且它已经移植到Windows和其它系统。curses程序将在纯文本系统上、xterm和其它窗口化控制台会话中运行,这使这些应用程序具有良好的可移植性。介绍cursesPython的标准curses提供了“玻璃电传”(glassteletype)(在20世纪70年代,原始curses库刚创建时,它叫做CRT)的公共特性

系统 2019-09-27 17:50:15 2463

Python

用Python徒手撸一个股票回测框架

代码架构以自己的回测框架为例。主要包含下面两个文件backtest/backtest.pybroker.pybacktest.py主要提供BackTest这个类用于提供回测框架,暴露以下钩子函数.definitialize(self):"""在回测开始前的初始化"""passdefbefore_on_tick(self,tick):passdefafter_on_tick(self,tick):passdefbefore_trade(self,order)

系统 2019-09-27 17:49:55 2463