(1)网页去噪网页去噪需要去掉与网页内表达内容不相关的文字,如广告,评论等等。现在对于博客、新闻类的网页去噪已经有很多的应用,比如常用的印象笔记、有道笔记就用到了相关的技术。因为项目的需要,也需要对网页进行去噪,留下有用的内容。所以在网上找了相关的网页去噪的开源项目。(2)参考链接主要参考的链接是这篇“网页正文抽取工具”,应该是抓取的新浪weibo上的相关的微博内容。里面介绍了给出了项目的地址,有Java、C++、C#、Perl、Python的。因为项目是
系统 2019-08-12 01:33:19 2914
自己实现文本相似度算法(余弦定理)-呼吸的Java-开源中国社区自己实现文本相似度算法(余弦定理)52人收藏此文章,我要收藏发表于9个月前(2012-03-0416:59),已有5592次阅读,共6个评论最近由于工作项目,需要判断两个txt文本是否相似,于是开始在网上找资料研究,因为在程序中会把文本转换成String再做比较,所以最开始找到了这篇关于距离编辑算法Blog写的非常好,受益匪浅。于是我决定把它用到项目中,来判断两个文本的相似度。但后来实际操作发
系统 2019-08-12 01:32:18 2914
在用Matplotlib库绘制折线图的时候遇到一个问题,当定义一个x轴数组时,plot绘制折线图时,x轴并不会按照我们定义的数组的顺序去排列显示,例如:importmatplotlib.pyplotaspltcolums_x=['aa','bc','ad','bd']colums_y=[12,14,10,15]plt.plot(colums_x,colums_y)plt.show()我期望的是X轴能够按照:aa,bc,ad,bd,从左到右显示,但plt.s
系统 2019-09-27 17:50:30 2913
蚂蚁作为一个混码农届的新人来说,看到什么东西都觉得高大上的感觉。最近接触到了git,有种蠢蠢欲动的感觉,想试一把。因此开启了我的Git之旅。废话不多说,开始我的git之旅。1.git服务器的选择github和bitbucket.github上的开源项目非常多,大神也很多,可以实时跟踪大神的项目进度,学习大神的编码。bitbucket的最大优势就是可以建立5人以下小团队的私人仓库。给小型团队的私人项目提供了便利。但是由于蚂蚁是一个菜鸟,使用git主要是为了激
系统 2019-08-12 09:27:22 2913
中国历史年表约170万年前元谋人生活在云南元谋一带约80万年前蓝田人生活在陕西蓝田一带约20枣70万年前北京人生活在北京周口店一带约18000年前山顶洞人开始氏族公社的生活约5000枣7000年前河姆渡半坡母系氏族公社约4000枣5000年前大汶口文化中晚期父系氏族公社约4000多年前传说中的黄帝尧舜禹时期黄帝轩辕氏前2697~前2599少昊金天氏前2598~前2515颛顼高阳氏前2514~前2437帝喾高辛氏前2436~前2367帝挚高辛氏前2366~前
系统 2019-08-12 01:52:36 2913
孙中山诗【2副】:万象阴霾打不开,红羊劫运自相摧。顶天立地奇男子,要把乾坤转过来。项羽诗:力拔山兮气盖世对联【2副】;鹤归辽海逾千岁,枫落吴江又一秋斗方:华夏有天皆丽日,神州无处不春风。杨森翔书法:(孙中山诗.万象阴霾打不开...及其它)
系统 2019-08-12 01:32:51 2913
好久没写blog了,最近在考虑openjweb迁移到jboss的问题,经过试验,发现tomcat与jboss结合是挺简单的,tomcat中如何连接jboss,其实只需要把jboss的client目录的jar包复制到tomcat的common/lib中即可,我是复制的jboss开头的jar包,开发的EJB除了在jboss中部署外,ejb的home和接口类还要放到tomcat的web应用的WEB-INF/classes对应路径下,下面是tomcatweb应用中
系统 2019-08-12 01:32:22 2913
TopologyandGeometryinOpenCascade-Faceeryar@163.com摘要Abstract:本文简要介绍了几何造型中的边界表示法(BRep),并结合程序说明OpenCascade中的边界表示的具体实现,即拓朴与几何的联系。对具有几何信息的拓朴结构顶点(vertex)、边(edge)、面(face)进行了详细说明。本文仅对面(Face)进行说明。关键字KeyWords:OpenCascade、BRep、Topology、Geom
系统 2019-08-12 01:31:55 2913
islower()方法判断检查字符串的所有的字符(字母)是否为小写。语法以下是islower()方法的语法:str.islower()参数NA返回值如果字符串中的所有字符是小写且有至少有一个字符此方法返回true,否则返回false。例子下面的例子显示islower()方法的使用。#!/usr/bin/pythonstr="THISisstringexample....wow!!!";printstr.islower();str="thisisstring
系统 2019-09-27 17:47:17 2912
URL中的hash,也就是网址井号后面的部分,其实是一块宝地,它能创建浏览历史,也能存储一些简单数据。从Twitter开始Hash被用来定义Ajax内容,虽然如今已被HTML5的pushState所替代。这里介绍jQueryHash插件,可以帮助你完成简单数据的存储。Hash存储数据有什么用首先传统URL传递数据的弊端是,对搜索引擎不友好,搜索引擎会认为/example和/example?key=val是不同的网址,然而hash则不同,搜索引擎认为/exa
系统 2019-08-29 22:22:26 2912