"""python提取文本的tfidf特征"""importmathfromcollectionsimportCounter#1.语料库corpus=['thisisthefirstdocument','thisisthesecondseconddocument','andthethirdone','isthisthefirstdocument']#2.对语料进行分词word_list=[]foriinrange(len(corpus)):word_lis
系统 2019-09-27 17:57:10 1731
第一篇markdown编辑器001Markdown基本语法第二篇Python集成环境和解释器002Python解释器安装003Python解释器源修改004pip的使用005Python的IDE之Pycharm的使用006Python的IDE之Jupyter的使用第三篇Python基础007常量008变量009Python变量内存管理010各类赋值方式011注释012数据类型基础013数据类型:数字类型014数据类型:字符串类型015数据类型:列表类型01
系统 2019-09-27 17:56:43 1731
原文链接:https://blog.csdn.net/index20001/article/details/74294945概述Python程序有两种退出方式:os._exit()和sys.exit()。我查了一下这两种方式的区别。os._exit()会直接将python程序终止,之后的所有代码都不会执行。sys.exit()会抛出一个异常:SystemExit,如果这个异常没有被捕获,那么python解释器将会退出。如果有捕获该异常的代码,那么这些代码还
系统 2019-09-27 17:56:40 1731
前言单例模式(SingletonPattern),是一种软件设计模式,是类只能实例化一个对象,目的是便于外界的访问,节约系统资源,如果希望系统中只有一个对象可以访问,就用单例模式,显然单例模式的要点有三个;一是某个类只能有一个实例;二是它必须自行创建这个实例;三是它必须自行向整个系统提供这个实例。在Python中,我们可以用多种方法来实现单例模式:使用模块使用__new__使用装饰器(decorator)使用元类(metaclass)概念简单说,单例模式(
系统 2019-09-27 17:56:26 1731
有关python的版本和安装以及概念特点可以参考上篇博文,python语言基础此博文主要讨论问题如下:一、python的变量二、python常用的数据类型一、什么是python的变量?变量是计算机内存的一块区域,变量可以存储任何值,而且值可以改变。变量名由字母、数字和下划线组成。需要注意的是,不能使用python的关键字,英文大小写字母敏感,第1个字符必须是字母或下划线,不能是数字,示例代码如下:>>>x=1>>>_x=2>>>print(x)1>>>pr
系统 2019-09-27 17:56:12 1731
一个简单的实现classNaiveFilter():'''FilterMessagesfromkeywordsverysimplefilterimplementation>>>f=NaiveFilter()>>>f.add("sexy")>>>f.filter("hellosexybaby")hello****baby'''def__init__(self):self.keywords=set([])defparse(self,path):forkeywo
系统 2019-09-27 17:56:10 1731
loc(location)为SelectionbyLabel函数,即通过标签(行列索引的具体值)来索引数据,由于loc函数中索引的标签是str类型,所以标签的开头和结尾都要写。importpandasaspdimportnumpyasnpdf=pd.DataFrame(np.arange(0,60,2).reshape(10,3),columns=list('abc'))df.loc[0:2,['b','c']]#默认行索引情况下,选取df前三行的b,c两
系统 2019-09-27 17:55:53 1731
写在前面最近每日一更,我这菜鸡都有点儿不好意思了简单介绍简单用法是:assertexpression让我们用程序来测试这个expression,如果expression相当于False,那么raise一个AssertionError出来。即逻辑上等同于:ifnotexpression:raiseAssertionError简单看看这些例子:>>>assertTrue>>>assertFalseTraceback(mostrecentcalllast):Fi
系统 2019-09-27 17:55:25 1731
1:假设你已经安装了anaconda3然后安装了vscode,怎么配置才可以在写代码时候可以自动补齐方法如下:1:ctrl+p会弹搜索框,输入json找到launch.json打开,修改成{//UseIntelliSensetolearnaboutpossibleattributes.//Hovertoviewdescriptionsofexistingattributes.//Formoreinformation,visit:https://go.mic
系统 2019-09-27 17:55:06 1731
优化算法时间复杂度算法的时间复杂度对程序的执行效率影响最大,在Python中可以通过选择合适的数据结构来优化时间复杂度,如list和set查找某一个元素的时间复杂度分别是O(n)和O(1)。不同的场景有不同的优化方式,总得来说,一般有分治,分支界限,贪心,动态规划等思想。减少冗余数据如用上三角或下三角的方式去保存一个大的对称矩阵。在0元素占大多数的矩阵里使用稀疏矩阵表示。合理使用copy与deepcopy对于dict和list等数据结构的对象,直接赋值使用
系统 2019-09-27 17:54:58 1731