点击上方“码农突围”,马上关注,每天早上8:50准时推送真爱,请置顶或星标摘要:分享个Python神工具。长时间使用浏览器会积累大量浏览器历史记录,这些是很隐私的数据,里面甚至可能有一些不可描述的网站或者搜索记录不想让别人知道。不过,我们自己可能会感兴趣,天天都在上网,想知道长期下来是都在摸鱼还是有认真工作。其次,了解下自己每天打开多少次网页、哪些网站上的最多、常搜哪些关键词,这些也很有趣。下面就来给大家介绍一款Python编写的神工具,可以一键分析你的上
系统 2019-09-27 17:51:41 1880
一、缺失值的处理方法由于各种各样的原因,真实世界中的许多数据集都包含缺失数据,这些数据经常被编码成空格、nans或者是其他的占位符。但是这样的数据集并不能被scikit-learn算法兼容,因为大多数的学习算法都会默认数组中的元素都是数值,因此素偶有的元素都有自己的代表意义。使用不完整的数据集的一个基本策略就是舍弃掉整行或者整列包含缺失值的数值,但是这样处理会浪费大量有价值的数据。下面是处理缺失值的常用方法:1.忽略元组当缺少类别标签时通常这样做(假定挖掘
系统 2019-09-27 17:50:59 1880
time库是Python中处理时间的标准库计算机时间的表达提供获取系统时间并格式化输出功能提供系统级精确计时功能,用于程序性能分析time库包括三类函数时间获取:time()ctime()gmtime()时间格式化:strftime(0strptime()程序计时:sleep(),perf_counter()时间获取time()获取当前时间戳,即计算机内部时间值,浮点数importtimetime.time();#运行结果#1568855802.08770
系统 2019-09-27 17:50:57 1880
考虑这种情况:如果一个线程遇到锁嵌套的情况该怎么办,这个嵌套是指当我一个线程在获取临界资源时,又需要再次获取。根据这种情况,代码如下:复制代码代码如下:'''Createdon2012-9-8@author:walfred@module:thread.ThreadTest6'''importthreadingimporttimecounter=0mutex=threading.Lock()classMyThread(threading.Thread):de
系统 2019-09-27 17:50:55 1880
函数:split()Python中有split()和os.path.split()两个函数,具体作用如下:split():拆分字符串。通过指定分隔符对字符串进行切片,并返回分割后的字符串列表(list)os.path.split():按照路径将文件名和路径分割开一、函数说明1、split()函数语法:str.split(str="",num=string.count(str))[n]参数说明:str:表示为分隔符,默认为空格,但是不能为空('')。若字符串
系统 2019-09-27 17:50:49 1880
最近在处理语音检索相关的事。其中用到语音识别,调用的是讯飞与百度的api,前者使用js是实现,后者用python3实现(因为自己使用python)环境:python3.5centos7流程整个百度语音识别restapi使用分为三部分:1(申请操作)创建应用,获取应用的APIKey以及SecretKey。2(程序实现)通过已知的应用的APIKey以及SecretKey,发送post请求到https://openapi.baidu.com/oauth/2.0/
系统 2019-09-27 17:50:48 1880
废话不多说,直接上代码...#用递归实现2分查找的算法,#以从列表a=[1,3,4,6,7,8,9,11,15,17,19,21,22,25,29,33,38,69,107]#查找指定的值defcal(li,item):#传入列表和需要查询的值print(li,item)ifnotli:#每次传入都要为一个新生成的列表returnFalsemixid=len(li)//2#获取列表长度每次对半分后进行判断大小ifitem==li[mixid]:#如果传入的
系统 2019-09-27 17:50:18 1880
JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,它基于ECMAScript的一个子集。JSON采用完全独立于语言的文本格式,这些特性使JSON成为理想的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成,在接口数据开发和传输中非常常用。Python3中我们利用内置模块json解码和编码JSON对象。json模块提供了四个功能:dumps、dump、loads、loaddumps把数据类型转换成字符串dump把数
系统 2019-09-27 17:50:16 1880
模块概述如果说模块是按照逻辑来组织Python代码的方法,那么文件便是物理层上组织模块的方法。因此,**一个文件被看作是一个独立模块,一个模块也可以被看作是一个文件。模块的文件名就是模块的名字加上扩展名.py。与其它可以导入类(class)的语言不同,在Python中你导入的是模块或模块属性**。模块名称空间一个名称空间就是一个名称到对象的关系映射.导入模块导入模块整体(import)方式一复制代码代码如下:importmodule1importmodul
系统 2019-09-27 17:50:10 1880
SeriesSeries类似一维数组,由一组数据及一组相关数据标签组成。使用pandas的Series类即可创建。importpandasaspds1=pd.Series(['a','b','c,','d'])print(s1)#输出:0a#1b#2c#3d#dtype:object上面是传入一个列表实现,上面的0,1,2,3就是数据的默认标签。另外可以通过index属性自定义标签。s2=pd.Series(['1','2','3,','4'],index
系统 2019-09-27 17:50:09 1880