Python

Python实现FM算法解析

1.什么是FM?FM即FactorMachine,因子分解机。2.为什么需要FM?1、特征组合是许多机器学习建模过程中遇到的问题,如果对特征直接建模,很有可能会忽略掉特征与特征之间的关联信息,因此,可以通过构建新的交叉特征这一特征组合方式提高模型的效果。2、高维的稀疏矩阵是实际工程中常见的问题,并直接会导致计算量过大,特征权值更新缓慢。试想一个10000*100的表,每一列都有8种元素,经过one-hot独热编码之后,会产生一个10000*800的表。因此

系统 2019-09-27 17:48:36 2140

Python

几个方法帮你加快Python运行速度

Python运行的慢是历来被诟病的,一方面和语言有关,另一方面可能就是你代码的问题。语言方面的问题我们解决不了,所以只能在编程技巧上来提高程序的运行效率。下面就给大家分享几个提高运行效率的编程方法。首先,我们需要来衡量代码的时间和空间的复杂性,不然仅仅用我们的肉眼很难感受代码时间长短的变化。python中的profiler可以帮助我们测量程序的时间和空间复杂度。使用时通过-o参数传入可选输出文件以保留性能日志。具体使用方法如下:python-mcProfi

系统 2019-09-27 17:48:32 2140

Python

想要爬虫工程师,Python需要学到什么程度?

做爬虫工程师的的薪资为20K起,当然,因为大数据,薪资也将一路上扬。那么,Python需要学到什么程度呢?今天我们来看看3位前辈的回答。前段时间快要毕业,而我又不想找自己的老本行Java开发了,所以面了很多Python爬虫岗位。因为我在南京上学,所以我一开始只是在南京投了简历,我一共面试了十几家企业,其中只有一家没有给我发offer,其他企业都愿意给到10K的薪资,不要拿南京的薪资水平和北上深的薪资水平比较,结合面试常问的问题类型说一说我的心得体会。第一点

系统 2019-09-27 17:46:26 2140

Python

利用python的request库与tkinter库制作简单vip视频解析工具

本次编写程序目的在于学习python爬虫技术入门,注意到有vip视频解析网站,于是进行编写,该程序可以跳过vip广告,或者vip5分钟时间限制。还可以保存浏览记录,十分方便。__author__='PythonStriker'importrequestsimportwebbrowserimportreimporttkinterastkfromtkinterimportttkimportosdata=["播放接口1","播放接口2",\"播放接口3","播放

系统 2019-09-27 17:46:03 2140

Python

Win10下Python3.7.3安装教程图解

到2019年初,Python3已经更新到了Python3.7.3,Python有两个大版本Python2和Python3,Python3是现在和未来的主流。本文介绍Python3.7.3的安装步骤.一、下载Python3.7.31.百度搜索Python,找到Python官网,点击进入https://www.python.org/2.点击Python官网的Downloads,然后在下拉菜单中点Windows,进入版本选择页面3.进入版本选择页面,可以在最上面

系统 2019-09-27 17:45:35 2140

Python

全面解析Python的While循环语句的使用方法

Python编程中while语句用于循环执行程序,即在某条件下,循环执行某段程序,以处理需要重复处理的相同任务。其基本形式为:while判断条件:执行语句……执行语句可以是单个语句或语句块。判断条件可以是任何表达式,任何非零、或非空(null)的值均为true。当判断条件假false时,循环结束。执行流程图如下:实例:#!/usr/bin/pythoncount=0while(count<9):print'Thecountis:',countcount=c

系统 2019-09-27 17:38:17 2140

Python

Python之流程控制——while循环

Python之流程控制——while循环一、语法while条件:执行代码while就是当的意思,它指当其后面的条件成立,就执行while下面的代码。例:写一个从0打印到10的程序count=0whilecount<=10:print('第%s次'%count)count+=1如果要打印1~10之间的偶数怎么办呢?那就得先搞清楚,怎么判断一个数字是偶数?能被2整除的就是偶数,但如何判断这个数是否能被2整除呢?简单,直接判断这个数除以2之后的余数是否为0就行了

系统 2019-09-27 17:55:03 2139

Python

Python 正则表达式(转义问题)

先说一个比较�宓氖虑椋涸谛聪好滓衾质蕴�下载器的时候遇到一个问题,因为保存的文件都是用音乐的标题命名的,所以碰到一些诸如「��峙/outborder」等含有非法字符(哼哼,说的就是你→_→Windows)的标题的时候,就会保存失败。于是我想起了迅雷的解决方法:把所有的非法字符替换成下划线。于是就引入了正则表达式的使用。一番搜索囫囵吞枣后,我写下了这样的函数:复制代码代码如下:defsanitize_filename(filename):returnre.s

系统 2019-09-27 17:53:30 2139

Python

python爬虫爬取全站url,完美小demo(可防止链接到外网等各种强大筛选)

上次完成的url爬取项目并不能满足需求,在此完成了一个更为强大的爬取代码,有需要的可以直接运行,根据自己爬取的网站更改部分正则和形参即可。前排提示:运行需要耐心,因为几千个url爬完的话,还是建议花生瓜子可乐电影准备好。下面是代码,代码有注释,很容易理解。注意:爬虫代码每过一段时间就需要更新,因为爬的东西在变,所以可能过一段时间就要更新爬虫。#-*-coding:utf-8-*-"""CreatedonWedSep2914:01:282018@author

系统 2019-09-27 17:52:48 2139

Python

python+matplotlib绘制旋转椭圆实例代码

旋转椭圆实例代码:importmatplotlib.pyplotaspltimportnumpyasnpfrommatplotlib.patchesimportEllipsedelta=45.0#degreesangles=np.arange(0,360+delta,delta)ells=[Ellipse((1,1),4,2,a)forainangles]a=plt.subplot(111,aspect='equal')foreinells:e.set_c

系统 2019-09-27 17:52:38 2139

Python

python编写的最短路径算法

一心想学习算法,很少去真正静下心来去研究,前几天趁着周末去了解了最短路径的资料,用python写了一个最短路径算法。算法是基于带权无向图去寻找两个点之间的最短路径,数据存储用邻接矩阵记录。首先画出一幅无向图如下,标出各个节点之间的权值。其中对应索引:A――>0B――>1C――>2D――>3E――>4F――>5G――>6邻接矩阵表示无向图:算法思想是通过Dijkstra算法结合自身想法实现的。大致思路是:从起始点开始,搜索周围的路径,记录每个点到起始点的权值

系统 2019-09-27 17:51:19 2139

Python

python opencv 简单阈值算法的实现

本文先了解一个简单阈值函数,以了解一个阈值算法的具体参数。然后比较不同阈值函数的区别。同样的,先用一副图说明本文重要大纲:#!usr/bin/envpython#coding:utf-8importcv2img=cv2.imread('cat.jpg')img=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#先将图像矩阵进行二值化#img=cv2.imread('cat.jpg',0)#也可以直接将图像用灰度值读入,其中0就表示用

系统 2019-09-27 17:51:14 2139

Python

实例分析python3实现并发访问水平切分表

场景说明假设有一个mysql表被水平切分,分散到多个host中,每个host拥有n个切分表。如果需要并发去访问这些表,快速得到查询结果,应该怎么做呢?这里提供一种方案,利用python3的asyncio异步io库及aiomysql异步库去实现这个需求。代码演示importloggingimportrandomimportasynciofromaiomysqlimportcreate_pool#假设mysql表分散在8个host,每个host有16张子表TB

系统 2019-09-27 17:50:32 2139

Python

利用python将图片版PDF转文字版PDF

图片版PDF无法复制,转化成文字版的PDF后使用更方便.我们需要用到python3.6,pypdf2,ghostscript,PythonMagick,百度文字识别服务和pdfkit.安装安装python3.6略安装ghostscripthttps://ghostscript.com/download/gsdnld.html安装wkhtmltopdfhttps://wkhtmltopdf.org/downloads.htmlpip安装PyPDF2,ghos

系统 2019-09-27 17:49:31 2139

Python

python中的列表、元组、字典

列表和元组可以将列表和元组当成普通的“数组”,它能保存任意数量任意类型的Python对象。和数组一样,通过从0开始的数字索引访问元素,但是列表和元组可以存储不同类型的对象。列表和元组有几处重要的区别。列表元素用中括号([])包裹,元素的个数及元素的值可以改变。元组元素用小括号(())包裹,不可以更改(尽管他们的内容可以)。元组可以看成是只读的列表。通过切片运算([]和[:])可以得到子集,这一点与字符串的使用方法一样。>>>aList=[1,2,3,4]>

系统 2019-09-27 17:48:08 2139