搜索到与相关的文章
各行各业

中文分词(统计语言模型)

一般来讲,根据不同应用,汉语分词的颗粒度大小应该不同。比如,在机器翻译中,颗粒度应该大一些,“北京大学”就不能被分成两个词。而在语音识别中,“北京大学”一般是被分成两个词。因此,不同的应用,应该有不同的分词系统。利用统计语言模型分词的方法,可以用几个数学公式简单概括如下:我们假定一个句子S可以有几种分词方法,为了简单起见我们假定有以下三种:A1,A2,A3,...,Ak,B1,B2,B3,...,BmC1,C2,C3,...,Cn其中,A1,A2,B1,B

系统 2019-08-12 09:27:02 2463

数据库相关

boost 的函数式编程库 Phoenix入门学习

这篇文章是我学习boostphoenix的总结。序言Phoenix是一个C++的函数式编程(functionprogramming)库。Phoenix的函数式编程是构建在函数对象上的。因此,了解Phoenix,必须先从它的基础函数对象上做起。Phoenix能够提供令人惊艳的编码效果。我先撂一个出来,看看用Phoenix能写出什么样的代码:std::for_each(vec.begin(),vec.end(),if_(arg1>5)[std::cout<

系统 2019-08-12 01:54:47 2463

Oracle

Oracle cloud control 12c 的启动与关闭

Oraclecloudcontrol12c整个安装比較复杂,光是安装路径的选择,登录password,端口号等众多个配置不免让人眼花缭乱,目不暇接。本文描写叙述的是安装完成后怎样获取安装时设定的各类端口号,URL以及怎样启动、关闭cloudcontrol等等,供大家參考。有关cloudcontrol的安装配置能够參考:OracleEnterpriseManagerCloudControl12cRelease3Installation1、当前的环境配置[or

系统 2019-08-12 01:54:27 2463

Oracle

Oracle 数据库学习一

1.Oracle的开始1977年创立,2002年4月6日在国注册为“甲骨文”2.oracle的版本8i,9i,10g,11g其中i为internet学习用oracle10g3.关系数据库oracle的特点a.支持多用户、大事务量的事务处理b.在保持数据安全性和完整性方面性能优越c.支持分布式数据处理d.可移植性4.oracle的基本概念a.数据库oracle的专业名称,它是磁盘上存储数据的集合,在物理上表现为数据文件,日志文件和控制文件等,在逻辑上以表空间

系统 2019-08-12 01:53:18 2463

Tomcat

[转]更改Tomcat默认目录+端口+设置缺省网页

我在$tomcat/webapps/下建了个myjsp目录作为我网站的默认目录,在myjsp中有一个a.jsp文件,该文件要作为我网站的默认主页。修改配置文件:首先,修改$tomcat/conf/server.xml文件。在server.xml文件中,有一段如下:……

系统 2019-08-12 01:33:26 2463

Python

我的Python学习之路(一)

我的Python学习之路(一)跟着廖雪峰的Python教程学习Task1:输入和输出Task2:打印变量Task3:格式化输出Task4:按要求打印tuple元素Task5:if分支练习Task6:循环练习Task7:调用函数Task8:定义函数Task9:可变参数Task10:递归函数实现Task11:切片练习Task12:迭代练习Task13:列表生成式练习Task14:生成器练习Task15:map/reduceTask16:Filter练习Task

系统 2019-09-27 17:57:00 2462

Python

python 工厂设计模式

一、对工厂设计模式的理解在现实生活中,工厂是用于生产产品的,我们告诉工厂,我们需要什么样的产品,工厂就会生产出该产品,我们无需知道该产品到底是怎么生产的。在python中也是一样的,我们只需要调用工厂类的方法,传入参数后,就能得到我们想要的对象,此时我们并不关心该对象的内部实现。二、工厂设计模式的优点1、工厂模式巨有非常好的封装性,代码结构清晰;2、屏蔽产品类,使产品的被使用业务场景和产品的功能细节可以分而开发进行,是比较典型的解耦框架。三、工厂模式的简单

系统 2019-09-27 17:54:49 2462

Python

python Pandas如何对数据集随机抽样

摘要:有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。应用场景:我有10W行数据,每一行都11列的属性。现在,我们只需要随机抽取其中的2W行。实现方法很简单:利用Pandas库中的sample。DataFrame.sample(n=None,frac=None,replace=False,weights=None,random_state=None,axis=None)n是要抽取

系统 2019-09-27 17:54:34 2462

Python

Python脚本实现代码行数统计代码分享

之前用bash实现过(//www.jb51.net/article/61943.htm),不过那个不能在windows下使用,所以就写了个python版,也方便我以后使用……这里就不多介绍了,不懂的google下。实现代码复制代码代码如下:#!/usr/bin/python'''File:count.pyAuthor:MikeE-Mail:Mike_Zhang@live.com'''importsys,osextens=[".c",".cpp",".hpp

系统 2019-09-27 17:51:47 2462

Python

Python --深入浅出Apriori关联分析算法(二) Apriori关联

上一篇我们讲了关联分析的几个概念,支持度,置信度,提升度。以及如何利用Apriori算法高效地根据物品的支持度找出所有物品的频繁项集。Python--深入浅出Apriori关联分析算法(一)这次呢,我们会在上次的基础上,讲讲如何分析物品的关联规则得出关联结果,以及给出用apyori这个库运行得出关联结果的代码。一.基础知识上次我们介绍了几个关联分析的概念,支持度,置信度,提升度。这次我们重点回顾一下置信度和提升度:置信度(Confidence):置信度是指

系统 2019-09-27 17:50:15 2462