搜索到与相关的文章
Python

Python提取文本tf、idf

"""python提取文本的tfidf特征"""importmathfromcollectionsimportCounter#1.语料库corpus=['thisisthefirstdocument','thisisthesecondseconddocument','andthethirdone','isthisthefirstdocument']#2.对语料进行分词word_list=[]foriinrange(len(corpus)):word_lis

系统 2019-09-27 17:57:10 2154

Python

python 计算文件的md5值实例

较小文件处理方法:importhashlibimportosdefget_md5_01(file_path):md5=Noneifos.path.isfile(file_path):f=open(file_path,'rb')md5_obj=hashlib.md5()md5_obj.update(f.read())hash_code=md5_obj.hexdigest()f.close()md5=str(hash_code).lower()returnmd

系统 2019-09-27 17:57:00 2154

Python

python获取当前文件路径以及父文件路径的方法

#当前文件的路径pwd=os.getcwd()#当前文件的父路径father_path=os.path.abspath(os.path.dirname(pwd)+os.path.sep+".")#当前文件的前两级目录grader_father=os.path.abspath(os.path.dirname(pwd)+os.path.sep+"..")追加部分代码实例defTestPrtPwd(self):print("获取当前文件路径――"+os.path

系统 2019-09-27 17:55:58 2154

Python

Python 内存分配时的小秘密

Python中的sys模块极为基础而重要,它主要提供了一些给解释器使用(或由它维护)的变量,以及一些与解释器强交互的函数。本文将会频繁地使用该模块的getsizeof()方法,因此,我先简要介绍一下:该方法用于获取一个对象的字节大小(bytes)它只计算直接占用的内存,而不计算对象内所引用对象的内存这里有个直观的例子:importsysa=[1,2]b=[a,a]#即[[1,2],[1,2]]#a、b都只有两个元素,所以直接占用的大小相等sys.getsi

系统 2019-09-27 17:55:55 2154

Python

python实现kNN算法识别手写体数字的示例代码

1。总体概要kNN算法已经在上一篇博客中说明。对于要处理手写体数字,需要处理的点主要包括:(1)图片的预处理:将png,jpg等格式的图片转换成文本数据,本博客的思想是,利用图片的rgb16进制编码(255,255,255)为白色,(0,0,0)为黑色,获取图片大小后,逐个像素进行判断分析,当此像素为空白时,在文本数据中使用0来替换,反之使用1来替换。fromPILimportImage'''将图片转换成文档,使用0,1分别替代空白和数字'''pic=Im

系统 2019-09-27 17:54:43 2154

Python

python Django 创建应用过程图示详解

如图输入如下命令pythonmanage.pystartappapitest添加应用到autotest项目项目下在settings.pyo中加入“apitest”,如下图创建视图在apitest/views中添加test函数fromdjango.shortcutsimportrenderfromdjango.httpimportHttpResponse#Createyourviewshere.deftest(request):returnHttpRespo

系统 2019-09-27 17:54:35 2154

Python

python爬虫第6关csv&excel

前面讲到json是特殊的字符串。其实,csv也是一种字符串文件的格式,它组织数据的语法就是在字符串之间加分隔符——行与行之间是加换行符,同列之间是加逗号分隔。它可以用任意的文本编辑器打开(如记事本),也可以用Excel打开,还可以通过Excel把文件另存为csv格式(因为Excel支持csv格式文件)。将我们刚刚写入的csv文件下载到本地电脑,再用记事本打开,你会看到:用Excel打开,则是这样的:发现了吗?csv文件里的逗号可以充当分隔同列字符串的作用。

系统 2019-09-27 17:53:37 2154

Python

排序算法总结(Python实现)——(一)

整个排序算法分两部分来总结,这篇总结第一部分一些相对简单和常用的排序算法,包括冒泡排序、选择排序、插入排序和希尔排序。冒泡排序冒泡排序应该是大家接触的最早的排序方法了,理解起来也十分简单。冒泡排序是一种简单的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。算法描述比较相邻的

系统 2019-09-27 17:52:14 2154

Python

python os模块简单应用示例

本文实例讲述了pythonos模块简单应用。分享给大家供大家参考,具体如下:举例中的目录形式如下所示:In[36]:pwdOut[36]:'/home/python/Desktop/code'In[37]:lshello.pyhello.txttest.py文件夹01/文件夹02/文件夹03/1.当前路径及路径下的文件os.getcwd():查看当前所在路径。os.listdir(path):列举目录下的所有文件。返回的是列表类型。In[1]:import

系统 2019-09-27 17:51:54 2154

Python

Python 内存分配时的小秘密

原文链接:https://jinshuju.net/f/kb1Bcq♚豌豆花下猫,某985高校毕业生,兼具极客思维与人文情怀。专注python技术、数据科学和深度学习,力图创造一个有趣又有用的学习分享平台。Python中的sys模块极为基础而重要,它主要提供了一些给解释器使用(或由它维护)的变量,以及一些与解释器强交互的函数。本文将会频繁地使用该模块的getsizeof()方法,因此,我先简要介绍一下:该方法用于获取一个对象的字节大小(bytes)它只计算

系统 2019-09-27 17:51:49 2154