大家申请时都在想什么

2019-02-20 作者: ZandY 原文 #Matters 的其它文章

大家申请时都在想什么 ——

在Matters做一些数据方面的工作。今天分析了一下申请者们在自我介绍里用到的关键词,希望能看出些兴趣来。

用的Python Jieba分词,然后wordcloud包。很简单的小任务。

词云如下:

Jieba的英文分词不好,所以最大的词语是Matter而非Matter(也是因为matter比matters有更大概率是一个正确的词语)。然后"https"就是典型的分词错误,“微信”是因为很多申请人会提到自己的微信公众号。其他的,应该就很好懂了。

有其他问题欢迎问啊~

(PS:这个数据分析应该没侵犯隐私的。一是这是数据aggregation不能定位到个人,二是隐私协议里有相关条款)


文章版权归原作者所有。
二维码分享本站