在工作中产品经理为了表达自己的想法会经常使用文字云工具构建各种各样的文字云图。
文字云图的视觉美观取决于工具的自定义功能和制作者的审美,那么文字云图的内涵从哪里来呢?答案很简单来源于——数据!以下以关键词“产品经理”为例让我们快速制作一幅有内涵的文字云图。
产品经理的描述特征的文字从哪里得来?,来源于百科?来源于书本?个人认为都不是。产品经理的特征应该来源于市场,人力市场。对产品经理特征描述最准确的应该是各个公司的招聘信息,因此本次我们选择广西某人才市场网站作为数据来源。通过python简单的简单制作一个小爬虫脚本爬取产品经理相关职位的文本。
数据爬取脚本
2.广西人才网南宁地区招聘产品经理的公司不多,大于200个岗位,处理冗余的HTML标记,仅剩300KB左右的文本数据。
文本内容
3. 这次的目标是分析产品经理的特征,因此为了方便快捷还是使用PYTHON的结巴分词库对文本进行全文分词,之后根据词频排序,词频越高标识在产品经理工作内容和任职资格里面出现的次数最多,也就代表市场越关注这个词汇,由这些文字构成的云图应该有足够“内涵”了吧。
分词脚本
4. 最后将词汇表导入在线文字云图工具生成图片即可获得一份有内涵的产品经理关键词云图。
产品经理关键词云图