首页> 软件教程> python统计文本字符串里单词出现频率

python统计文本字符串里单词出现频率

来源：网络时间：2018-03-06 16:04:55

　　本文实例讲述了Python统计文本字符串里单词出现频率的方法。

python统计文本字符串里单词出现频率

　　分享给大家供大家参考。具体实现方法如下：　　?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

# word frequency in a text

# tested with Python24 vegaSeat 25aug2005

# Chinese wisdom ...

str1 = """Man who run in front of car, get tired.

Man who run behind car, get exhausted."""

print "Original string:"

print str1

print

# create a list of words separated at whitespaces

wordList1 = str1.split(None)

# strip any punctuation marks and build modified word list

# start with an empty list

wordList2 = []

for word1 in wordList1:

# last character of each word

lastchar = word1[-1:]

# use a list of punctuation marks

if lastchar in [",", ".", "!", "?", ";"]:

word2 = word1.rstrip(lastchar)

else:

word2 = word1

# build a wordList of lower case modified words

wordList2.append(word2.lower())

print "Word list created from modified string:"

print wordList2

print

# create a wordfrequency dictionary

# start with an empty dictionary

freqD2 = {}

for word2 in wordList2:

freqD2[word2] = freqD2.get(word2, 0) + 1

# create a list of keys and sort the list

# all words are lower case already

keyList = freqD2.keys()

keyList.sort()

print "Frequency of each word in the word list (sorted):"

for key2 in keyList:

print "%-10s %d" % (key2, freqD2[key2])

　　希望本文所述对大家的Python程序设计有所帮助。

<上一篇：在Python的Flask框架下收发电子邮件下一篇：python获取指定目录下所有文件名列表的方 >

文章内容来源于网络，不代表本站立场，若侵犯到您的权益，可联系我们删除。（本站为非盈利性质网站）联系邮箱：9145908@qq.com

相关攻略

1python清除字符串里非数字字符 2 Python中操作字符串之replace()方法 3 用Python操作字符串之rindex()方法的使用 4Python中操作字符串之replace()方法，值得学习！ 5Python下载网络文本数据到本地内存的四种实现方法 6考试蚁怎么添加单词,如何在考试蚁APP里添加单词到生词本 72024年广西回南天的出现频率分析 8excel 拼接字符串 excel字符串怎么拼接 9python获取一组数据里最大值max函数 10Excel表格中数字出现次数统计的方法

近期热点

1冯绍峰新女友周麟嘉冯绍峰新恋情曝光 2冯绍峰新女友冯绍峰新女友疑来自名媛培训班 3羊毛月是g吗羊毛月性取向 42012年，“福建木偶戏后继人才培养计划”被联合国教科文组织列入世界非物质文化遗产优秀实践名册。（） 51991年3月27日，戈尔巴乔夫在全苏联进行了一次全民公投，除波罗的海三国外，抵制公投的还有（）。 61997年12月，叶利钦签署《俄罗斯联邦安全构想》，确定了（）的跨世纪战略构想。 72011年，赫哲族的“伊玛堪”被联合国教科文组织列入“急需保护的非物质文化遗产名录”。（） 819世纪法国现实主义画家米勒的代表作品主要有《拾穗者》和《晚钟》等。（） 91989年度，日本政府开发援助金额达到104亿美元，居世界首位。（） 101972年9月，（）访华，中日两国正式建交并签署《中日联合声明》。

最新攻略

1先用后付怎么关_拼多多怎么关闭先用再付设置 2不小心把微信卸载了，是不是再从新下载，以前的所有消息还能恢复吗_微信卸载后重装怎么恢复聊天记录 3微信重新下载后怎么恢复聊天记录_微信卸载后重新安装怎么恢复数据 4微信还原了怎么恢复原来的东西_微信卸载重新安装,之前的聊天记录怎么恢复 5微信资料设置删除了怎么恢复_卓精灵微信恢复大师靠谱吗 6怎么关掉自动续费_银行卡怎么解除自动扣款 7视频扣费怎么退款_酷狗音乐自动续费怎么退款 8app自动扣款，请问取消订阅后，钱会退回吗_苹果已经订阅怎么退款 9如何取消自动续费_酷狗会员怎么取消自动续费 10为什么我的微信支付管理没有自动扣费的选项_微信没有自动扣费功能怎么回事 11华为主题会员如何取消包月_华为手机怎么关闭自动扣费 12微信卸载后，重新下载，如何恢复原来数据_小米手机如何恢复删除的微信内容