多语言展示
当前在线:448今日阅读:2今日分享:38

python3如何进行词频统计

在做数据分析的时候需要对某些特定的元素进行统计,或者需要对一篇英文文章中的单词出现频率最高的5个单词进行统计等。
工具/原料

ipython3

步骤一:统计序列中元素的频率
1

1. 以序列中统计元素个数为例新用随机数生成有重复的随机序列

3

2. 方法二新建一个以序列元素为键,值为0的字典   然后循环遍历判断, 再根据字典排序找到频率最高前五个元素

4

4. 方法三使用Collections下的Counter对象Counter对象下的most_common()方法统计出频率最高的元素

步骤2:统计一段文本中单词出现的频率
1

1. 先用正则表达把文本分割成单词列表

2

2. 实例化Counter对象   再用Counter下的most_common方法统计单词在文本中出现的频率

推荐信息