如何做词频分析和词云图

我们经常会抓取一些互联网用户评论或者一些演讲文本,拿到这些数据后一把先做词频分析来看不同词的大概分布。今天我给大家简单介绍一下如何做词频分析。


1.下面这个是我用BlueMC做的张小龙微信演讲文本(从Tech星球把演讲文本提取出来)的词云,对比了一些在线分析工具,图悦和BlueMC都不错,且这2款在线制作工具都可以导出excel。

这2个工具的不足之处是词云形状相对较少,如果希望做更丰富的形状的或者是定制的,可以搜一下其他的词云工具,百度搜即可找到很多推荐的。


2.但在做词频分析的时候需要注意分析是否有遗漏,比如我用图悦做分析时,发现文本中“用户”这个字段没有被统计,而BlueMC中用户被统计了,但是小程序和微信这2个字段又丢失了。所以大家最好多用几款词云工具测试,交叉验证下少了哪些字段。比如下方我在BlumeMC这添加关键字这把“微信”和“小程序”这2个字段都添加上去了。


3.数据导成excel后,我们可以再做多维度的分析,这里我就简单做了个条形图,也可以做树状图分析。


看完后,大家一起来试一试,赶快制作你的专属词云图片吧!