nltk是自然语言处理中常用的包,在使用nltk进行处理的时候,会用到WordNet。
WordNet使用前一般需要先下载nltk的corpus
import nltk
nltk.download()
这样子会弹出如上窗口。,我这里是已经安装好的了,如果第一次运行则是点击左下角的安装。
安装之后可以用以下代码测试wordnet的运行
from nltk.corpus import brown
brown.words()
#['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
对于无法正常使用这种方法的同学,有另外一种手动设置词库的方法,就是把别人下载好的词库加进环境路径里面,nltk就可以直接使用到了。
可以直接下载我的压缩包,里面是词库的全部内容。首先解压到任意一个地方。
链接:https://pan.baidu.com/s/1maoSDw7MTNQy2VR1zHY1Qg
提取码:hqe9
然后设置环境变量。具体方法是我的电脑-> 属性->高级系统设置->系统属性->环境变量->添加一个NLTK_DATA的变量
添加完之后,nltk就可以正常使用wordnet了。