手把手:R语言文本挖掘和词云可视化实践
rbind(d[nchar(d$word)==1,][1:10,],d[nchar(d$word)==2,][1:20,d[nchar(d$word)>3,])->result_r #提取不同字数的单词中词频最高的TOP50单词,作为词云绘制的素材 write.table(result_r,"result.csv",row.names = FALSE) #保存结果为csv文件 通过一款开源的词云可视化工具tagxedo,将导出的词频矩阵绘制为各种形状的词云图。 图六 团队词云 看看,除了对“数据”、“互联网”的关心是天经地义的,我们说的最多的竟然是“吃”,名副其实的“吃货”团队,民以食为天嘛。“周报”赫然醒目也是醉了,其它的高频词都和工作息息相关,“实验室”、“工程师”,还有“平台”、“服务器”、“数据库”,真心是学习型聊天群啊。最开心的要数“哈哈哈”,证明我们的工作也是欢笑多多,其乐无穷的。 想看到每位童鞋的词云有什么不同么? 图七 个体词云一 爽朗的“哈哈哈”,愤怒的“啊啊啊”,最擅用“[图片]”在群里展现心情。致我们的美女数据分析师,也是团队大象logo的设计者。 下面重磅推出我们的首席数据科学家,瞧瞧科学家的世界与我们是多么的不同。竟然……基本都是英文术语。 图八个体词云二 五、建模流程
下面用一张图简单回顾一下本文实现的建模过程:
图九 整体分析思路
希望上面的案例分析能帮助大家更好的理解文本挖掘和舆情分析可视化的一些分析思路和呈现方式,我们也会尽力挖掘更多的创意,制作更好的产品呈现给大家,谢谢!。 2015年8月干货文件打包下载,请点击大数据文摘底部菜单 大数据文摘精彩文章: 回复【金融】 看【金融与商业】专栏历史期刊文章 可视化】感受技术与艺术的完美结合 (编辑:青岛站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |