
说几个数据分析师一定会经历的事情/现象,也谈一些我的看法。先抛出问题:
======================================
- 为什么很多用户画像中,广东总是排第一?
- 百分比数据在展示时,有什么必须要注意?
- 做年龄分段,30 岁放在前一段还是后一段?
- 做消费者分析时,要注重数据还是注重感觉?
先思考几分钟。然后带着你的答案,听听我的看法。注意,你需要答对 3 个以上问题才能算合格(当然不必跟我一样,也可以留言说说你的看法)。
广东总是排在第一位

在很多数据系统(比如巨量星图、云图、罗盘、千川)中查看用户画像时,总能发现广东省的比例是最高的。不要少见多怪,这不是什么有价值的结论。广东能排第一可能只是因为广东网民多。
如果查常住人口数的话,北京大约 2184 万人,上海大约 2475 万人。不少了吧?而像这样超大规模的城市,广东有 4 个:广州 1873 万、深圳 1766 万,东莞 1044 万,佛山 955 万。而且这几个市都有大量的年轻打工人,互联网/移动互联网渗透率高,所以,无论做什么全国性的 APP,你看画像,几乎都是广东最高。
为了避免因为网民数量优势带来错误结论,建议在讲占比的同时,把 TGI 附上。如果占比高而 TGI 低,那就说明只是人口多。如果 TGI 也相应地高,才能支持你的“占优”、“显著”、“广东人更\_\_\_”之类的结论。下边的例子中,在研究不同地区搜索“小说”的行为时,广东虽然占比高,但是它的 TGI 不到 100,这说明广东省的人不是爱搜小说,反而是不爱搜小说(它有那么多人,搜索量却不够,按人头计算的话没有完成任务)。

source: 巨量算数
人们总想加出 100%
读者总有一个习惯,看见几个百分比数字放在一起,就会忍不住地加一加,看看总和是不是 100%。在我刚入行数据分析的两年里,无数次遇到“加起来超过 100%”、“加起来不到 100%”=> “所以你这数据有问题”这样的质疑。
于是乎,就总结出一个经验,如果加起来是 100% 的的数据,你就要用非常明显的方式体现出来,比如用堆叠百分比图,如果最后几项长尾选项数值小,就合并其他叫作“其他”;如果加起来不是 100% 的数字,就要放大、夸张、渲染,明确指出这些加起来不是 100%。比如,可以有意地把 90%、80%放在一起,这两个一加就超出 100% 了,您也别浪费时间算半天。
总之一句话,Don't make me think. 要让人一眼就看明白要不要去做加法。
多年以后当我看别人报告的时候,其实也一样有这个毛病:把数字口算加一加,看加起来是不是 100%。
年龄段不能 26-30 这样分
“众所周知”,30 岁它不能属于 26-30 这一段,而应该属于 30-34 这一段。
如果要划分五岁年龄段,必须要这么分。因为哪怕 29.999 岁,只要还没过 30 岁生日,人的心态都是二十郎当岁,还年轻,有大把时间可挥霍,而一到 30 就“三十而立”了,就不能躺着而是要立起来了。
像 “20 到 30 岁”这个说法,建议采用的是左闭右开的区间,比如 [20,25) 或者 [20, 30) 翻译成大俗话也很直接,就是“二十来岁”。
一个比较有力的证据是,国家人口普查的数据就是按这个标准统计的。(15 岁属于后一段,60 岁也属于后一段)

source: 中国政府网
而下边这个某平台的年龄段划分,就不好。属于典型的理工科做分析,懂技术而不懂业务/不懂人。

source: 不提也罢
要分析的不是数据而是业务
有个行业笑话,说某大数据平台做基于电影院小票的购物车分析。发现看《流浪地球》的观众在买电影票的同时喜欢买热饮,而看《战狼 2》的观众喜欢买冷饮,于是基于此做了一堆电影内容、风格、消费者心理相关的分析,用了很多模型,分析头头是道。
最后还是不做数据分析的“正常人”道破了原因:两部电影一个在冬天上映,一个在夏天上映。自然是有的集中买热饮,有的集中买冷饮。
所以,如果分析师在做数据的时候只关注数据,而忘记了业务本身,忽略了人之常情,忽略了常识,就会闹出笑话。
所以一个好的分析师(特别地,营销策略分析师),不仅要懂数据,更要懂人。
你说巧不巧?我们现在就在招聘这种既懂数据又懂人懂业务的数据分析师。
首先介绍一下我们。
头条易是新媒体变革浪潮中走在前列的新 4A 机构,我们把刷抖音、小红书、视频号作为日常工作(没错,你可以带薪刷抖音,而且除了看热闹还要看门道),并为品牌客户在各平台上生产优质内容、管理人群资产并经营电商生意。
相比于传统 4A 公司大预算、长周期、慢反馈的项目,我们面临的是跨平台、多模态、快速响应、归因清晰的系统工程,因此,在数据分析和策略上也更具挑战性,需要掌握的营销科学技能也更多。
这项工作的主要输出是数据策略报告,主要输入是巨量云图和人货场相关的海量数据。它对分析师有几个要求,首先是聪明,其次是爱折腾会折腾,最后是细致。
岗位职责
- 服务公司 KA 客户,开展市场分析、消费者洞察、营销趋势研究、人群相似度指标分析等工作,并针对数据分析结果输出策略方案
- 通过数据分析为品牌客户提供品牌营销策略、媒介策略、消费者诉求及痛点、市场机会点等分析报告
- 结合行业及竞品对比分析,输出消费者运营建议,并追踪运营效果及优化策略
岗位要求
- 熟悉抖音生态,深度使用抖音 App
- 通过巨量引擎“营销科学”认证,熟练使用巨量云图人群、内容、商品等模块功能
- 了解巨量云图标签工厂、建模、自定义报表等工具
- 按月度对阶段性工作进行复盘报告建设,通过现场或线上的形式进行解读,结合热点进行品牌传播策略等营销活动策划、案例包装等
在专业背景方面,更倾向于广告学、社会学、经济学背景。如果你是理工科,最好读过一些人文社科方面的书。注意,这个工作的重点是要研究市场中的消费者,而不是单纯拉数据和做表格,不是数据工程师。
对应地,也欢迎实习生。你将获得:
- 系统的数据培训与实践,接触消费者数据分析的前沿应用
- 考取巨量引擎“营销科学”证书,学习在抖音生态里的消费者研究
- 了解机器学习的基础知识, 学会巨量云图标签工厂、建模、自定义报表等工具
投递简历请附数据分析作品,可以是报告、文章、数据分析工程等。我们非常乐于看到你在简历中展示自己的微信公众号、小红书账号、B 站账号等能体现你独立思考和动手实践的成就,哪怕它只是一个很小的课题。
如果准备好了,请联系微信 yesandx
暂无评论