Python

基于python实现的百度音乐下载器python pyqt改进版(附代码)

前言之前写过一个用python实现的百度新歌榜、热歌榜下载器的文章,实现了百度新歌、热门歌曲的爬取与下载。但那个采用的是单线程,网络状况一般的情况下,扫描前100首歌的时间大概得到40来秒。而且用Pyqt做的界面,在下载的过程中进行窗口操作,会出现UI阻塞的现象。前两天有时间调整了一下,做了几方面的改进:1.修改了UI界面阻塞的问题,下载的过程中可以进行其它的UI操作;2.爬虫程序采用一个主线程,8个子线程的方式快速爬取,网络状况一致的情况下,将扫描100

系统 2019-09-27 17:50:49 2705

Python

Python调用阿里云的智能语音交互接口实现录音转文字

质量声明:原创文章,内容质量问题请评论吐槽。如对您产生干扰,可私信删除。主要参考:阿里云官方接口文档摘要:Python调用阿里云的智能语音交互接口,依靠对象存储服务(OSS)上传音频,实现录音文件识别,输出为txt文本。支持单轨/双轨的wav、mp3格式,最大支持文件512MB,最大录音时长2个小时。文章目录处理音频安装pydub安装ffmpeg音频处理程序上传至OSS录音识别程序识别结果处理音频由于阿里、百度、腾讯、讯飞等语音处理平台都对语音参数有特定要

系统 2019-09-27 17:50:23 2705

Python

python实现图像检索的三种(直方图/OpenCV/哈希法)

简介:本文介绍了图像检索的三种实现方式,均用python完成,其中前两种基于直方图比较,哈希法基于像素分布。检索方式是:提前导入图片库作为检索范围,给出待检索的图片,将其与图片库中的图片进行比较,得出所有相似度后进行排序,从而检索结果为相似度由高到低的图片。由于工程中还包含Qt界面类、触发函数等其他部分,在该文档中只给出关键函数的代码。开发系统:MacOS实现方式:Qt+Python方法一:自定义的直方图比较算法a)基本思路遍历图片像素点,提取R\G\B值

系统 2019-09-27 17:48:19 2705

Python

基于python实现的抓取腾讯视频所有电影的爬虫

我搜集了国内10几个电影网站的数据,里面近几十W条记录,用文本没法存,mongodb学习成本非常低,安装、下载、运行起来不会花你5分钟时间。#-*-coding:utf-8-*-#byawakenjoys.mysite:www.dianying.atimportreimporturllib2frombs4importBeautifulSoupimportstring,timeimportpymongoNUM=0#全局变量,电影数量m_type=u''#全局

系统 2019-09-27 17:37:39 2705

Python

Python机器学习笔记:不得不了解的机器学习知识点(2)

之前一篇笔记:Python机器学习笔记:不得不了解的机器学习知识点(1)1,什么样的资料集不适合用深度学习?数据集太小,数据样本不足时,深度学习相对其它机器学习算法,没有明显优势。数据集没有局部相关特性,目前深度学习表现比较好的领域主要是图像/语音/自然语言处理等领域,这些领域的一个共性是局部相关性。图像中像素组成物体,语音信号中音位组合成单词,文本数据中单词组合成句子,这些特征元素的组合一旦被打乱,表示的含义同时也被改变。对于没有这样的局部相关性的数据集

系统 2019-09-27 17:55:45 2704

Python

【Python爬虫】MongoDB爬虫实践:爬取虎扑论坛

MongoDB爬虫实践:爬取虎扑论坛网站地址为:https://bbs.hupu.com/bxj1.网站分析首先,定位网页上帖子名称、帖子链接、作者、作者链接、创建时间、回复数目、浏览数目、最后回复用户、最后回复时间等信息的位置,之后,我们使用BeautifulSoup在网页中定位这些。数据所在的位置数据位置某帖子所有数据‘li’帖子名称divclass="titlelinkbox">a帖子链接divclass="titlelinkbox">a['href

系统 2019-09-27 17:55:14 2704

Python

Python 条形图与直方图有非常大的区别

区别:首先,条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数据型数据,我们初中学的就是条形统计图,很显然有没有当初那种感觉?(身高-年龄条形统计图)在坐标上画出每个年龄对应的频数。

系统 2019-09-27 17:54:48 2704

Python

为什么Python 3.6以后字典有序并且效率更高?

在Python3.5(含)以前,字典是不能保证顺序的,键值对A先插入字典,键值对B后插入字典,但是当你打印字典的Keys列表时,你会发现B可能在A的前面。但是从Python3.6开始,字典是变成有顺序的了。你先插入键值对A,后插入键值对B,那么当你打印Keys列表的时候,你就会发现B在A的后面。不仅如此,从Python3.6开始,下面的三种遍历操作,效率要高于Python3.5之前:forkeyin字典forvaluein字典.values()forkey

系统 2019-09-27 17:51:02 2704

Python

windows下安装python

安装python1、官网百度Python官网,点击进入或者直接点击链接2、在官网中,点击【download】→选择【Windows】点击3、选择想要安装的版本针对对应的版本【Windowsx86-64executableinstaller】下载(Download)4、双击下载下来的安装包【python-3.7.0-amd64.exe】,然后勾选【AddPython3.7toPATH】(注释:若勾选,则安装时会自动添加环境变量;若未勾选,则需要安装成功之后,

系统 2019-09-27 17:52:25 2703

Python

Python实现扫描局域网活动ip(扫描在线电脑)

内网的主机都是自动分配ip地址,有时候需要查看下有那些ip在使用,就写了个简单的脚本。linux和windows下都可以用,用多线程来ping1-255所有的地址,效率不高,2分钟左右。先凑合和用吧。#-*-coding:utf-8-*-#author:orangleliudate:2014-11-12#python2.7.xip_scaner.py'''''不同平台,实现对所在内网端的ip扫描有时候需要知道所在局域网的有效ip,但是又不想找特定的工具来扫

系统 2019-09-27 17:48:35 2703

Python

49个Python学习资源:从初学者到高级玩家都有了

导读:本文为不同阶段的Python学习者从不同角度量身定制了49个学习资源。来源:专知(ID:Quan_Zhuanzhi)01初学者1.WelcometoPython.orghttps://www.python.org/官方Python站点提供了一个开始使用Python生态系统和学习Python的好方法,包括官方文档。2.LearningPythonTheHardWayhttps://learnpythonthehardway.org/book/一本在线书

系统 2019-09-27 17:56:46 2702

Python

Python中Threading用法详解

Python的threading模块松散地基于Java的threading模块。但现在线程没有优先级,没有线程组,不能被销毁、停止、暂停、开始和打断。JavaThread类的静态方法,被移植成了模块方法。mainthread:运行python程序的线程daemonthread守护线程,如果守护线程之外的线程都结束了。守护线程也会结束,并强行终止整个程序。不要在守护进程中进行资源相关操作。会导致资源不能正确的释放。在非守护进程中使用Event。Thread类

系统 2019-09-27 17:52:49 2702

Python

基于python自动化框架的报告格式分析

测试APP框架一:python+appium+unittestappium是对selenuim的封装,其中使用的是get_screenshot_as_base64方法获取页面截图的base64编码,故而框架使用时,生成的报告可进行自动捕捉异常,并进行截图放在报告里,具体可参考:https://github.com/GoverSky/HTMLTestRunner_cn文档进行报告完善,引用的报告是HTMLTestRunner,报告样式较为传统大概为:框架二:

系统 2019-09-27 17:50:54 2702

Python

使用Python操作Redis5.0新特性Stream实现订阅发布功能

本文完整代码下载:github链接目前在做的工作有一部门是搭建一个可供公司内部使用的推送平台,用的中间件是redis,于是就自然的想用redis5.0版本的新特性来实现这个功能,网上的demo比较少,且大多是终端操作的命令行,写了一个Python的类和大家分享。在介绍具体实现之前,先大致介绍一下背景。在Redis5.0版本发布之前,redis也有一个发布、订阅功能,但功能非常简单,只能单纯的发布和订阅,适合在即时通信里使用。缺点非常多:消息没有持久化的机制

系统 2019-09-27 17:56:13 2701

Python

简单了解python gevent 协程使用及作用

简介没有切换开销。因为子程序切换不是线程切换,而是由程序自身控制,没有线程切换的开销,因此执行效率高,不需要锁机制。因为只有一个线程,也不存在同时写变量冲突,在协程中控制共享资源不加锁,只需要判断状态就好了,所以执行效率比多线程高很多Python对协程的支持还非常有限,用在generator中的yield可以一定程度上实现协程。yield传统的生产者-消费者模型是一个线程写消息,一个线程取消息,通过锁机制控制队列和等待,但一不小心就可能死锁。如果改用协程,

系统 2019-09-27 17:47:08 2701