大家申请时都在想什么
大家申请时都在想什么 ——
在Matters做一些数据方面的工作。今天分析了一下申请者们在自我介绍里用到的关键词,希望能看出些兴趣来。
用的Python Jieba分词,然后wordcloud包。很简单的小任务。
词云如下:
Jieba的英文分词不好,所以最大的词语是Matter而非Matter(也是因为matter比matters有更大概率是一个正确的词语)。然后"https"就是典型的分词错误,“微信”是因为很多申请人会提到自己的微信公众号。其他的,应该就很好懂了。
有其他问题欢迎问啊~
(PS:这个数据分析应该没侵犯隐私的。一是这是数据aggregation不能定位到个人,二是隐私协议里有相关条款)
文章版权归原作者所有。