背景
词频统计是指对一段文本中每个单词出现的次数进行计数分析。这种分析有助于了解文本的重点词汇、主题或作者的写作风格。如果你有一个特定的文本或想要分析某些内容的词频,你可以提供文本,我可以为你进行简单的词频统计。
例如,如果你有一段文本,比如一篇文章、一首诗歌或一段对话,你可以将它提供给我,我将尽力帮助你进行词频统计分析。
上效果图
依赖包安装
pip install collections # 词频统计库
pip install numpy # numpy数据处理库
pip install wordcloud # 词云展示库
pip install PIL # 图像处理库
pip install matplotlib # 图像展示库
具体代码
fromcollectionsimportCounter
importcollections#词频统计库
importnumpyasnp#numpy数据处理库
importwordcloud#词云展示库
fromPILimportImage#图像处理库
importmatplotlib.pyplotasplt#图像展示库text="这是一段示例文本,用于词频统计。这个例子可以帮助我们了解单词的出现频率。"
##example_5.txt前台
##example_6.txt中台
##example_7.txt后台fn=open('example_8.txt','r',encoding='utf-8')#打开文件
text=fn.read()#读出整个文件
fn.close()#关闭文件words=text.split()#分割文本为单词
word_freq=Counter(words)#计算单词频率
#print(word_freq)#词频统计
word_counts=collections.Counter(word_freq)#对分词做词频统计
word_counts_top10=word_counts.most_common(100)#获取前10最高频的词
print(word_counts_top10)#输出检查#词频展示
mask=np.array(Image.open('abc.jpg'))#定义词频背景
wc=wordcloud.WordCloud(
font_path='C:/Windows/Fonts/simhei.ttf',#设置字体格式
mask=mask,#设置背景图
max_words=150,#最多显示词数
max_font_size=150,#字体最大值
min_font_size=4,
font_step=1,
background_color='white'#背景色
)wc.generate_from_frequencies(word_counts)#从字典生成词云
image_colors=wordcloud.ImageColorGenerator(mask)#从背景图建立颜色方案
wc.recolor(color_func=image_colors)#将词云颜色设置为背景图方案
fig=plt.figure(figsize=(8,6),dpi=200)#画布大小
plt.rcParams['figure.dpi']=500#清晰的
plt.imshow(wc)#显示词云
plt.axis('off')#关闭坐标轴
plt.show()#显示图像