【Python】1行Python代码统计文本中每个英文单词出现次数...（python词频统计）

今天来试一下如何利用 python 来统计文本中每个英文单词出现的次数

列出了两种方法，一种是直接调用 Counter 函数 ，核心代码一行搞定

另一种是手写的利用 python 中的字典来统计

1.首先将文本文件导入

文本是长这样子的

f = open(r"C:\Users\aaa\Desktop\new.txt",encoding="utf-8")
a = f.read().split()

open 文本之后，将文本 read 进来，然后用 split 将单词利用空格切分开

输出的是一个列表，也就是将文本文件变成单词的列表

2. 利用 Counter 函数统计词频

这个方法很简单，只需要用一行代码即可搞定

print(collections.Counter(a))

这样就直接统计好词频，并利用字典的形式排序好了再输出

当然， Counter 函数在 collections 包里，所以使用之前要先导包：import collections

3.手写字典统计词频

如果你觉得直接调用函数没有意思的话，可以自己手写字典来统计：key 是单词，value 是单词出现次数

先创建一个字典，然后遍历刚刚取出的单词列表，接着做一个判断：

如果字典中 key 已经出现了这个单词，那么它对应的 value ，也就是出现次数就 +1

如果这个单词没出现过，就直接插入这个单词及 value 为 1 到字典中

代码如下：

words_dic = {}

for k in a:
if k in words_dic:
words_dic[k] += 1
else:
words_dic[k] = 1

print(words_dic)

统计结果：

4.完整代码

            
              import collections

f = open(r"C:\Users\aaa\Desktop\new.txt",encoding="utf-8")
a = f.read().split()

print(a)
print(collections.Counter(a))


words_dic = {}

for k in a:
    if k in words_dic:
        words_dic[k] += 1
        
    else:
        words_dic[k] = 1
        
print(words_dic)
        
f.close()

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索：z360901061

微信扫一扫加我为好友

QQ号联系： 360901061

您的支持是博主写作最大的动力，如果您喜欢我的文章，感觉我的文章对您有帮助，请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧，狠狠点击下面给点支持吧，站长非常感激您！手机微信长按不能支付解决办法：请将微信支付二维码保存到相册，切换到微信，然后点击微信右上角扫一扫功能，选择支付二维码完成支付。

【本文对您有帮助就好】元

2元

5元

10元

20元

自定义