import re
with open('a.txt', 'r') as f:
total = f.readlines() # 读取文本文件的每一行代码
s = {} # 用于储存单词以及单词的个数
for line in total: # 对每一行进行单词识别
a = re.findall(r'[^A-Z\'a-z$]+', line) # 具体参考re模块的使用
for i in a:
line = line.replace(i, ' ') # 将其他字符以空格代替,例如标点符号
print(line) # 打印没有标点符号的文本文件的每一行
for word in line.split(): # 将单词存储于dict中
if word not in s:
s[word] = 1
else:
s[word] += 1
for k, v in s.items(): # 打印单词出现的个数
print(k, v)
转载请注明原文地址:https://ipadbbs.8miu.com/read-22205.html