- 军军小站|张军博客
搜索到与相关的文章
各行各业

大地__分词中歧义的多样性

实际搜索通过程序模型分析文档,而是试图切出和人的思维习惯相近的结果是非常的艰难的,清华大学在日本的交流“自然语言和计算机语言的转换课题”中说到,目前的索引程序尤其大型的搜索引擎只有56%的准确率。­­所以搜索在大力开发歧义字段自动识别技术,以此拉近和人思维和阅览习惯的距离。­­切词的歧义:­­交集性歧义篇:­­“乒乓球拍卖完了”­­出现两种切分结果>>>­­乒乓球拍/卖/完了­­乒乓球/拍卖/完了­­这是两种不同的结果,同时直接影响到该句的主题关键词的提取

系统 2019-08-12 09:27:30 1974

各行各业

语义分析和搜索引擎优化

搜索引擎排名的基础之一,就是关键词与网页的相关性。机器算法和人不一样的地方是人可以直接理解词的意思,文章的意思,机器和算法不能理解。人看到苹果这两个字就知道指的是那个圆圆的,有水的挺好吃的东西,搜索引擎却不能从感性上理解。但搜索引擎可以掌握词之间的关系,这就牵扯到语义分析。两年前搜索引擎优化业界很热烈的谈论过一阵潜在语义索引(LatentSemanticIndexing)。因为时间比较久,记得也不是很清楚,大概介绍一下。所谓潜在语义索引指的是,怎样通过海量

系统 2019-08-12 09:27:29 1974

各行各业

学习github心得

Git是Linux的创始人LinusTorvalds开发的开源和免费的版本管理系统,利用底层文件系统原理进行版本控制的工具。Git是目前为止最著名运用最好最受欢迎的分布式的配置管理工具。重点:1、Git托管网站:GitHub、CodePlex、Gitorious、Unfuddle逐渐流行起来的开源项目托管网站,提供丰富的功能,包括团队管理服务器或敏捷项目源控制、项目共享协作、项目发布下载、论坛和邮件、维基和文档页、BUG和跟踪请求的功能、项目使用统计,这些

系统 2019-08-12 09:27:22 1974

各行各业

Web Client Software Factory v2.0发布

概述Web客户端软件工厂为尝试管理使用ASP.NET构建的大型网站的开发人员提供了引人注目的解决方案。此软件工厂支持创建与站点中的各个子目录相关联的模块,并为模式(如View-Presenter和ApplicationController)提供了一个可支持以模块化方式启用网站的独立开发、测试和部署的框架,值得我们认真去研究。现在微软模式与实践团队又发布了WebClientSoftwareFactoryv2.0版本,除了支持.NETFramework3.5和

系统 2019-08-12 09:26:58 1974

各行各业

修改价格为原来的0.6154倍!!

修改价格为原来的0.6154倍!!执行的语句updatecatalog_product_index_pricesetprice=round(price*0.6154),final_price=round(final_price*0.6154),min_price=round(min_price*0.6154),max_price=round(max_price*0.6154)UPDATEcatalog_product_entity_decimalvalSE

系统 2019-08-12 09:26:53 1974

各行各业

Lexer and parser generators (ocamllex, ocaml

Chapter12Lexerandparsergenerators(ocamllex,ocamlyacc)Thischapterdescribestwoprogramgenerators:ocamllex,thatproducesalexicalanalyzerfromasetofregularexpressionswithassociatedsemanticactions,andocamlyacc,thatproducesaparserfromagram

系统 2019-08-12 09:26:46 1974

各行各业

LPC2000 UART串口使用心得

针对zgpswh在串口使用上的一些难题,总结个人在前一阶段的理解,比较片面,不对的地方请高手指正。1、LPC2000系列芯片的串口的接收模块包括接收缓冲寄存器和移位寄存器。接收的数据进入移位寄存器后经移位处理并行传入缓冲寄存器,事实上,UART的FIFO是一个硬件环形的缓冲队列,物理上不可寻址,不可见,仅U0RBR这个FIFO出口可见。U0RBR就是接收FIFO的第一位。FIFO的长度是可设的,也叫触发点,低于这个长度的字符串不会引起中断,但在实际应用中,

系统 2019-08-12 09:26:40 1974

数据库相关

普通视图和物化视图的区别

物化视图是一种特殊的物理表,“物化”(Materialized)视图是相对普通视图而言的。普通视图是虚拟表,应用的局限性大,任何对视图的查询,Oracle都实际上转换为视图SQL语句的查询。这样对整体查询性能的提高,并没有实质上的好处。1、物化视图的类型:ONDEMAND、ONCOMMIT二者的区别在于刷新方法的不同,ONDEMAND顾名思义,仅在该物化视图“需要”被刷新了,才进行刷新(REFRESH),即更新物化视图,以保证和基表数据的一致性;而ONCO

系统 2019-08-12 01:52:45 1974

数据库相关

toj2867 Picking Problem

题目链接:http://acm.tju.edu.cn/toj/showp.php?pid=2867题目大意:给定一系列活动的开始时间和结束时间,问最多能参加的活动数目思路://本题属于最大区间调度问题,即数轴上有n个区间,选出最多的区间,使这些区间互相不重叠。算法:按右端点坐标排序,然后依次按后者的开始时间是否大于前者的结束时间(注意更新前者的下标)选择所有能选的区间。代码://本题属于最大区间调度问题,即数轴上有n个区间,选出最多的区间,使这些区间互相不

系统 2019-08-12 01:51:56 1974

编程技术

代码比较-----优化之一

http://www.cnblogs.com/oomusou/archive/2010/09/05/verilog_mux2.html=和>=的比较----------------------------------------------------------------------------------if...else和case的比较代码比较-----优化之一

系统 2019-08-12 01:33:01 1974