编程技术 lucene-使用htmlparser提取网页普通链接 1、提取普通链接以http://www.qunar.com/site/zh/Cooperate_4.shtml为例,只能提取普通链接,如EMAIL链接就无法提取代码:packageextract;importjava.net.URL;importorg.htmlparser.beans.LinkBean;publicclassextracthtmllinksimp{/***@paramargs*/publicstaticStringgetText(Stri 系统 2019-08-29 22:44:11 2472