本系列文章主要结合Python语言实现知识图谱构建相关工程,具有一定创新性和实用性,非常希望各位博友交流讨论,相互促进成长。前面两篇文章详细讲解了哈工大Pyltp工具,包括中文分词、词性标注、实体识别、依存句法分析和语义角色标注等。但是其中文分词效果不是很理想,如“贵州财经大学”总是切分成“贵州”、“财经”和“大学”,这是因为词典中这些词的权重较高。这篇文章主要介绍最经典的自然语言处理工具之一——Jieba,包括中文分词、添加自定义词典及词性标注等内容。知
系统 2019-09-27 17:55:18 2519
Python计算机视觉编程图像聚类(一)K-means聚类1.1SciPy聚类包1.2图像聚类1.1在主成分上可视化图像1.1像素聚类(二)层次聚类(三)谱聚类图像聚类聚类概念无监督学习:没有标签。(对于监督学习问题中,我们会被告知什么是正确答案,在无监督学习中,没有任何标签,或者都具有相同的标签,得到的数据如下图,图上有一系列点,但是它们没有标签,因此训练集可以写成{x(1),x(1),x(1),...,x(m)}\left\{x^{(1)},x^{(1
系统 2019-09-27 17:56:55 2518
今天花了将近一天的时间安装caffe环境,无数个错误真的很崩溃。参考了N多个博客,现在记录一下,希望能对别人有些帮助。看到网上很多博客都说需要python3..5,vs2013之类的环境,我实在是不想改,就在已有的环境上尝试安装了。试了很多次终于成功了。我的安装环境如下:1.Windows10的系统2.已经安装了vs20153.python3.7其他步骤我就不赘述了,网上许多教程就有。我只阐述几个主要步骤和遇到的问题:1.安装CMake,直接百度下载最新版
系统 2019-09-27 17:49:16 2516
之前看网上的打印菱形很多都看不懂,所以自己用最基础的for来写一个打印菱形代码。题目要求为:编写程序,完成以下图形的输出*************************************************************具体思路:将菱形分为上下两部分,上部分为5行,下部分为4行,分别使用for,进行操作具体代码:#打印正三角i=1#i为前半行每行的*的个数,range取1-11,从1开始可取的数字均为奇数foriinrange(1,1
系统 2019-09-27 17:57:05 2515
1.获取并修改像素值首先我们需要读入一幅图像,可以根据像素的行和列的坐标获取他的像素值。对BGR图像而言,返回值为B,G,R的值。对灰度图像而言,会返回他的灰度值(亮度intensity):importcv2importnumpyasnpimg=cv2.imread('D:/opencv/images/roi.jpg')#获取像素值px=img[100,100]print(px)blue=img[100,100,0]print(blue)#打印结果##[5
系统 2019-09-27 17:53:26 2511
说起来不怕人笑话,我今天才发现,python中的字符串替换操作,也就是string.replace()是可以用正则表达式的。之前,我的代码写法如下,粗笨:自从发现了正则表达式也生效后,代码变得优雅简洁:备注:上图中的base_info是pandas里的dataframe数据结构,可以用上述方法使用string的replace方法。
系统 2019-09-27 17:45:25 2505
\033[1;31;40m#1是显示方式(可选),31是字体颜色,40m是字体背景颜色;\033[0m#恢复终端默认颜色,即取消颜色设置;#!/usr/bin/envpython#-*-coding:utf-8-*-#字体颜色print"=====字体颜色======"foriinrange(31,38):print"\033[%s;40mHelloworld!\033[0m"%i#背景颜色print"=====背景颜色======"foriinrange
系统 2019-09-27 17:57:09 2501
#图像像素到字符的转换importnumpyasnpfromPILimportImageifname==‘main’:image_file=“girl.jpg”height=116img=Image.open(image_file)print("img=",img)img_width,img_height=img.sizewidth=int(1.5*height*img_width//img_height)img=img.resize((width,hei
系统 2019-09-27 17:57:42 2496
Python==3.7.x有两种方式实现计划任务:scheduleAPscheduler打包python程序定时器:scheduleimportscheduleimporttime,datetimedeftask(name):print("{0}".format(name))#每隔2秒执行一次任务schedule.every(2).seconds.do(task,name)#每隔一小时执行一次任务schedule.every().hour.do(task,
系统 2019-09-27 17:57:38 2488
重装Python、Anaconda、Pycharm、Pytorch1.0.0Tensorflow系统:在安装PyQt库的时候Python2.7与3.6版本不兼容,导致Python运行程序报错:processfinishedwithexitcode-1073741819(0xC0000005),重新配置python版本也没作用,只好重装系统。1,Anaconda下载安装(https://www.anaconda.com/download/),Anaconda
系统 2019-09-27 17:52:57 2487
1.参数传递参数传递的意思就是将C的值传递给py的函数,然后进行计算输出。将数据值从C转换为Python,使用转换后的值对Python接口例程执行函数调用将数据值从Python调用转换为C。2.例子第二个程序的目标是在Python脚本中执行一个函数,现在这里需要传递参数。与关于非常高级接口的部分一样,Python解释器并不直接与应用程序交互(但这将在下一节中进行更改)。运行Python脚本中定义的函数的代码是:#definePY_SSIZE_T_CLEAN
系统 2019-09-27 17:56:32 2477
一、项目背景:为了回顾关于django的文件上传和分页功能,打算写一个微型的小说网站练练手。花了一个下午的时间,写了个小项目,发现其中其实遇到了许多问题,不过大部分通过debug之后就解决了,其他部分通过阅读了Pagination插件以及Bootstrap-FileInput插件的官方文档。二、详细设计:省去小说网站的用户模块的功能,小说网站主要的功能就是上传文件,在线阅读小说。针对这两个功能,主要用到dajngo内置的Pagination模块,以及选择一
系统 2019-09-27 17:57:30 2473
总的思路:先将项目部署到我的腾讯云虚拟主机中,然后在该台虚拟主机中设置定时任务。这个定时任务的内容就是去执行一个shell脚本,shell脚本的内容是去执行上一篇写好的爬虫程序来维护数据库并将输出结果利用git相关命令push到仓库中。一、一些基础知识1.1linux的时间表crontab程序是类unix系统中用于周期性执行被指定的命令的程序。命令用法的简单介绍#编辑当前用户的时间表程序crontab-e#查看当前用户的已经制定好的时间表crotab-l#
系统 2019-09-27 17:54:11 2473
当前时间的毫秒时间戳转换为年-月-日时:分:秒importtime#当前时间的13位毫秒时间戳times=int(time.time()*1000)print(times)#1565750406765#输入毫秒级的时间,转出正常格式的时间deftimeStamp(timeNum):timeStamp=float(timeNum/1000)timeArray=time.localtime(timeStamp)otherStyleTime=time.strft
系统 2019-09-27 17:56:59 2466
创建窗口#创建一个海龟myTurtle=turtle.Turtle()#创建一个窗口myWin=turtle.Screen()···#代码最后关闭窗口即结束myWin.exitonclick()常用绘图命令#向当前画笔方向移动d像素长度turtle.forward(d)#向当前画笔相反方向移动d像素长度turtle.backward(d)#顺时针移动degree度turtle.right(degree)#逆时针移动degree度turtle.left(de
系统 2019-09-27 17:56:18 2462