- 军军小站|张军博客
搜索到与相关的文章
编程技术

【文本分类】文本表示 --- VSM

要使得计算机能高效的处理真实文本,就必须找到一种理想的形式化表示方法,这种表示一方面能真实的反映文档内容(主题、领域或结构等),另一方面也要有对不同文档的区分能力。目前文本表示通常采用向量空间模型(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。下面首先给出VSM设计的基本概念:(1)文档(document):通常是文章中具有一定规模的字符串。文档通常我们也叫文本。(

系统 2019-08-29 21:59:30 1795

编程技术

算法分析之分治法学习总结(一)

算法分析之分治法学习总结(一)一)解决问题的类型:当我们要解决一个输入规模(n)很大的问题时,直接处理往往比较困难或者根本无法求解,我们希望把输入规模缩小,即分成很多份,分别解决了,并且这些小问题容易合起来从而解决整个问题。二)解题关键:1)如何分:我们往往先把输入分成两个与原来相同的子问题,如果规模还太大,我们对这些子问题再做上述处理,直到这些子问题容易解决为止.2)合并子问题:往往分治法的难点在于分完之后怎么合并.合并策略决定了算法的优劣,合并问题根据

系统 2019-08-12 09:30:06 1795

编程技术

TAB式导航栏的快捷实现(IE & FF)

应同事要求做了一个,效果如下:当鼠标移上时变色。没有使用脚本,纯粹通过css实现。同时通过调整背景图片位置的方式解决图片的闪动,主要代码如下:TRS--导航

系统 2019-08-12 09:29:55 1795

Python

Python 2.x 与 Python 3.x 除法运算的区别

Python2.x与Python3.x除法运算的区别strong@foreverstrong:~$pythonPython2.7.12(default,Dec42017,14:50:18)[GCC5.4.020160609]onlinux2Type"help","copyright","credits"or"license"formoreinformation.>>>fps=15.6>>>fps15.6>>>>>>int(fps+1)/35>>>>>>(f

系统 2019-09-27 17:57:27 1794

Python

python中property属性的介绍及其应用详解

Python的property属性的功能是:property属性内部进行一系列的逻辑计算,最终将计算结果返回。使用property修饰的实例方法被调用时,可以把它当做实例属性一样property的用法1――装饰器方式在类的实例方法上应用@property装饰器classTest:def__init__(self):self.__num=100@propertydefnum(self):print("--get--")returnself.__num@num

系统 2019-09-27 17:57:10 1794

Python

8.李航机器学习-AdaBoost梯度提升算法python实现

AdaBoost梯度提升算法项目链接:https://github.com/Wchenguang/gglearn/blob/master/AdaBoost/李航机器学习讲解/AdaBoost.ipynb算法步骤与原理训练mmm个弱学习分类器,分类器有相同的接口Gm(x):X→{x1,x2…}G_{m}(x):\mathcal{X}\rightarrow\{x_{1},x_{2}\dots\}Gm​(x):X→{x1​,x2​…}假设数据有均匀的权值分布,即

系统 2019-09-27 17:56:59 1794

Python

Python爬虫入门【9】:图虫网多线程爬取

图虫网-写在前面经历了一顿噼里啪啦的操作之后,终于我把博客写到了第10篇,后面,慢慢的会涉及到更多的爬虫模块,有人问scrapy啥时候开始用,这个我预计要在30篇以后了吧,后面的套路依旧慢节奏的,所以莫着急了,100篇呢,预计4~5个月写完,常见的反反爬后面也会写的,还有fucklogin类的内容。图虫网-爬取图虫网为什么要爬取这个网站,不知道哎~莫名奇妙的收到了,感觉图片质量不错,不是那些妖艳贱货可以比的,所以就开始爬了,搜了一下网上有人也在爬,但是基本

系统 2019-09-27 17:56:55 1794

Python

Python 从subprocess运行的子进程中实时获取输出的例子

有些时候,我们需要将某些程序放到子进程中去运行,以达到整合系统的目的。在Python中,一个非常好的选择就是使用subprocess模块,本模块为开辟子进程去执行子程序提供了统一的接口,更加便于学习和使用。同时,对于在子进程里的程序,我们希望能够实时获取其输出,以在主进程中打印相关信息,使我们能够了解当前子程序的执行进度。对此,subprocess模块也提供了相应的参数,能够将子程序的标准输出和标准错误输出返回给主程序。下面,我们就通过一个例子来说明这个功

系统 2019-09-27 17:56:49 1794

Python

用 Python 批量把文件复制到另一个文件夹

0前言大概是三个月前,有个人找我说要我帮忙写几行代码,功能是把一个文件夹里面的所有文件拆分成200个文件一个文件夹,很简单的。我理解了之后,觉得还是挺简单的,花了半个小时写出来了,代码也不多,代码和思路都可以分享一下。1环境说明Win10系统下Python3,编译器是Pycharm。需要安装shutil这个第三方库,直接pipinstallshutil就可以了。2代码先导入需要用到的库,os是用来切换路径和创建文件夹的。shutil是用来复制黏贴文件的im

系统 2019-09-27 17:56:16 1794

Python

Python 生成器 generator初步认识

生成器在Python中,使用了yield的函数被称为生成器(generator)。生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。在调用生成器运行的过程中,每次遇到yield时函数会暂停并保存当前所有的运行信息,返回yield的值,并在下一次执行next()方法时从当前位置继续运行。调用一个生成器函数,返回的是一个迭代器对象。列表推导式空间开销大占用内存耗时大,.生成器保存的是算法,而列表保存的计算后的内容,所以同样内容的

系统 2019-09-27 17:56:10 1794