本系列文章主要结合Python语言实现知识图谱构建相关工程,具有一定创新性和实用性,非常希望各位博友交流讨论,相互促进成长。前面两篇文章详细讲解了哈工大Pyltp工具,包括中文分词、词性标注、实体识别、依存句法分析和语义角色标注等。但是其中文分词效果不是很理想,如“贵州财经大学”总是切分成“贵州”、“财经”和“大学”,这是因为词典中这些词的权重较高。这篇文章主要介绍最经典的自然语言处理工具之一——Jieba,包括中文分词、添加自定义词典及词性标注等内容。知
系统 2019-09-27 17:55:18 2649
#-*-Encoding:UTF-8-*-'''@author:Jason.F@data:2019.07.18@function:ImplementingPMFDataset:MovielenDataset(ml-1m)Evaluating:hitradio,ndcghttps://papers.nips.cc/paper/3208-probabilistic-matrix-factorization.pdfMatlab:http://www.utstat
系统 2019-09-27 17:47:29 2649
一、项目背景:为了回顾关于django的文件上传和分页功能,打算写一个微型的小说网站练练手。花了一个下午的时间,写了个小项目,发现其中其实遇到了许多问题,不过大部分通过debug之后就解决了,其他部分通过阅读了Pagination插件以及Bootstrap-FileInput插件的官方文档。二、详细设计:省去小说网站的用户模块的功能,小说网站主要的功能就是上传文件,在线阅读小说。针对这两个功能,主要用到dajngo内置的Pagination模块,以及选择一
系统 2019-09-27 17:57:30 2648
题目:罗马数字包含以下七种字符:I,V,X,L,C,D和M。字符数值I1V5X10L50C100D500M1000例如,罗马数字2写做II,即为两个并列的1。12写做XII,即为X+II。27写做XXVII,即为XX+V+II。通常情况下,罗马数字中小的数字在大的数字的右边。但也存在特例,例如4不写做IIII,而是IV。数字1在数字5的左边,所表示的数等于大数5减小数1得到的数值4。同样地,数字9表示为IX。这个特殊的规则只适用于以下六种情况:I可以放在V
系统 2019-09-27 17:47:11 2647
词云是一种非常漂亮的可视化展示方式,正所谓一图胜过千言万语,词云在之前的项目中我也有过很多的使用,可能对于我来说,一种很好的自我介绍方式就是词云吧,就像下面这样的:个人觉还是会比枯燥的文字语言描述性的介绍会更吸引人一点吧。今天不是说要怎么用词云来做个人介绍,而是对工作中使用到比较多的词云计较做了一下总结,主要是包括三个方面:1、诸如上面的简单形式矩形词云2、基于背景图片数据来构建词云数据3、某些场景下不想使用类似上面的默认的字体颜色,这里可以自定义词云的字
系统 2019-09-27 17:49:02 2642
Python计算机视觉编程图像聚类(一)K-means聚类1.1SciPy聚类包1.2图像聚类1.1在主成分上可视化图像1.1像素聚类(二)层次聚类(三)谱聚类图像聚类聚类概念无监督学习:没有标签。(对于监督学习问题中,我们会被告知什么是正确答案,在无监督学习中,没有任何标签,或者都具有相同的标签,得到的数据如下图,图上有一系列点,但是它们没有标签,因此训练集可以写成{x(1),x(1),x(1),...,x(m)}\left\{x^{(1)},x^{(1
系统 2019-09-27 17:56:55 2640
直接上代码,根据需求注释选择相应修改fromPILimportImageimportosimportos.pathrootdir=r'G:\jianfeng\project\rubblish_det\faster_rcnn\rubbish_voc_xml\rubbish_pic_forTest\4396'#指明被遍历的文件夹forparent,dirnames,filenamesinos.walk(rootdir):forfilenameinfilenam
系统 2019-09-27 17:57:38 2639
#编写一个程序,打印一个乘法表#开始要询问用户显示那个数的乘法表我的代码x=int(input("请输入你要乘法表"))print('%s'%x,"的乘法表如下")foriinrange(1,10):n=x*iprint('%s'%x,'*','%s'%i,'=','%s'%n)打印九九乘法表:我的代码:foriinrange(1,10):forjinrange(1,i+1):n=i*jprint('%d*%d=%d'%(i,j,n),'.',end=""
系统 2019-09-27 17:50:58 2638
说起来不怕人笑话,我今天才发现,python中的字符串替换操作,也就是string.replace()是可以用正则表达式的。之前,我的代码写法如下,粗笨:自从发现了正则表达式也生效后,代码变得优雅简洁:备注:上图中的base_info是pandas里的dataframe数据结构,可以用上述方法使用string的replace方法。
系统 2019-09-27 17:45:25 2628
Python==3.7.x有两种方式实现计划任务:scheduleAPscheduler打包python程序定时器:scheduleimportscheduleimporttime,datetimedeftask(name):print("{0}".format(name))#每隔2秒执行一次任务schedule.every(2).seconds.do(task,name)#每隔一小时执行一次任务schedule.every().hour.do(task,
系统 2019-09-27 17:57:38 2625
1.获取并修改像素值首先我们需要读入一幅图像,可以根据像素的行和列的坐标获取他的像素值。对BGR图像而言,返回值为B,G,R的值。对灰度图像而言,会返回他的灰度值(亮度intensity):importcv2importnumpyasnpimg=cv2.imread('D:/opencv/images/roi.jpg')#获取像素值px=img[100,100]print(px)blue=img[100,100,0]print(blue)#打印结果##[5
系统 2019-09-27 17:53:26 2625
今天花了将近一天的时间安装caffe环境,无数个错误真的很崩溃。参考了N多个博客,现在记录一下,希望能对别人有些帮助。看到网上很多博客都说需要python3..5,vs2013之类的环境,我实在是不想改,就在已有的环境上尝试安装了。试了很多次终于成功了。我的安装环境如下:1.Windows10的系统2.已经安装了vs20153.python3.7其他步骤我就不赘述了,网上许多教程就有。我只阐述几个主要步骤和遇到的问题:1.安装CMake,直接百度下载最新版
系统 2019-09-27 17:49:16 2624
百度百科:Cygwin是一个在windows平台上运行的类UNIX模拟环境,是cygnussolutions公司开发的自由软件(该公司开发的著名工具还有eCos,不过现已被Redhat收购)。它对于学习UNIX/Linux操作环境,或者从UNIX到Windows的应用程序移植,或者进行某些特殊的开发工作,尤其是使用GNU工具集在Windows上进行嵌入式系统开发,非常有用。随着嵌入式系统开发在国内日渐流行,越来越多的开发者对Cygwin产生了兴趣。Cygw
系统 2019-09-27 17:54:06 2618
命令行输入pipinstallcv2时报错ERROR:Couldnotfindaversionthatsatisfiestherequirementcv2(fromversions:none)ERROR:Nomatchingdistributionfoundforcv2原因是CV2在的软件包不叫cv2而是叫opencv-python命令换成pipinstallopencv-python就可以了
系统 2019-09-27 17:46:15 2615
本系列文章主要结合Python语言实现知识图谱构建相关工程,具有一定创新性和实用性,非常希望各位博友交流讨论,相互促进成长。前面两篇文章详细讲解了哈工大Pyltp工具,包括中文分词、词性标注、实体识别、依存句法分析和语义角色标注等。但是其中文分词效果不是很理想,如“贵州财经大学”总是切分成“贵州”、“财经”和“大学”,这是因为词典中这些词的权重较高。这篇文章主要介绍最经典的自然语言处理工具之一——Jieba,包括中文分词、添加自定义词典及词性标注等内容。知
系统 2019-09-27 17:55:18 2598