一、《新时代中国特色社会主义》的词云
1、直接上代码:
import jieba, wordcloud
f = open("./data/新时代中国特色社会主义.txt", "r", encoding="utf-8")#打开文件
t = f.read()# 读取文件
f.close()# 关闭文件
ls = jieba.lcut(t) # 分词
txt = " ".join(ls) # 将分好的词用空格串起来
# 配置参数
# width :指定词云对象生成图片的宽度,默认400像素
# height :指定词云对象生成图片的高度,默认200像素
# background_color :指定词云图片的背景颜色,默认为黑色
# font_path :指定字体文件的路径,默认None
# max_words :指定词云显示的最大单词数量,默认200
w = wordcloud.WordCloud(width = 1000, height = 700,background_color = "white",font_path = "msyh.ttc", max_words = 25)
# 向 WordCloud 对象 wordcloud 中加载文本 txt
w.generate(txt)
# 将词云输出为图像文件,.png 或 .jpg
w.to_file("./data/grwordcloud.png")
注: 若还没安装 jieba库 和 wordcloud库 ,可用命令 p ip install jieba 和 pip install wordcloud 分别安装;
2、结果如下:
3、要想改变词云的形状,可参考以下代码
import jieba, wordcloud
from scipy.misc import imread
mask = imread("./data/chinamap.jpg")
f = open("./data/新时代中国特色社会主义.txt", "r", encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t) # 分词
txt = " ".join(ls)
# 指定词云形状,默认为长方形,需要引用imread()函数
w = wordcloud.WordCloud(width = 1000, height = 700,background_color = "white",font_path = "msyh.ttc", mask = mask)
w.generate(txt)
w.to_file("./data/grwordcloudm.png")
4、结果如下:
若想要 《新时代中国特色社会主义》文本和 chinamap.jpg 图片,可点击这里来下载(密码为: a3sf )。