蔡徐坤用户画像

[复制链接]
a22481234 发表于 2019-5-11 20:07:48 | 显示全部楼层 |阅读模式
来源:https://www.jianshu.com/p/c80b11801b06
若内容不全,可点击上述链接查看来源网页,在网页中点击红色双层向下的箭头阅读全文


欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定!

对商业智能BI、大数据分析挖掘、机器学习,python,R等数据领域感兴趣的同学加微信:tstoutiao,邀请你进入数据爱好者交流群,数据爱好者们都在这儿

来源:挖数作者:挖数

互联网行业经常会做用户调研,通过线下访谈和线上埋点等方式收集用户数据后,最终形成产品主流用户的性别、年龄、职业、喜好、城市等标签数据,这个过程称为“用户画像”。

如果蔡徐坤是一款互联网产品,他无疑十分的成功!

他的用户数达到2355万

这个用户数已经远远超过一些二线互联网app,比如世纪佳缘、珍爱网等。

他的日活跃用户数也很猛,平均每条微博有接近100万的点赞和评论,用户粘度极高。

商业价值也很高,虽然没有确切数据,但之前网上流传一份2017年明星收入排行榜,鹿晗位居第二位,年收入1亿8千万。

而目前蔡徐坤的百度指数已经远超鹿晗,按这个流量,他的收入很可能接近甚至已经超越当时的鹿晗。

为了对蔡徐坤进行用户画像,我爬取了他微博下边一万个用户的评论数据,经过统计分析,有以下的结论:

从性别上看,女粉占比拥有压倒性优势

另外1%的用户没有填写性别。

从年龄上看,粉丝占比最大的是1996-2002年出生的人,占整体人数54%。

而其中又以1998-2000年出生的最多,占整体人数32%。

蔡徐坤本人是1998年出生的,跟主流粉丝年龄相符。

从粉丝的地域分布上看,人数Top10省份如下:

蔡本人出生于浙江,籍贯是湖南,他的粉丝没有呈现这两个地方特别多的现象,记得之前分析过王俊凯和王源,他们的粉丝就以他们的出生地重庆居多。

粉丝人数Top10的大学是:

其中清北占到这部分填写大学的粉丝人数的3.6%。

不过这并不能得出蔡的粉都是高学历粉的结论,因为填写了大学的用户仅占总用户的1/10,而大学越牛逼填写的意愿越高,因此这里才会呈现出各种清北的假象,实际是幸存者偏差。

粉丝的职业一栏,有接近5%填写了蔡徐坤工作室或者蔡徐坤旗下这样的标签。

有23%的粉丝昵称里边包含有坤、葵或者kun,死忠粉的比例非常高。

(注:粉丝经常称呼蔡徐坤为蔡小葵)

在来源那里可以抓取到粉丝的手机型号,各大手机品牌的占比分别是

看来vivo找蔡徐坤代言还是有效果的,2018年中国手机市场份额上vivo在oppo和华为之后,而这里跑到了前面。

同时也看出华为和小米还是抓不住年轻人的心。

将粉丝的评论进行分词,词频最高的是以下几个词

把名词取出来,可以看到平常粉丝怎么称呼蔡徐坤,频次Top10的词是:

1蔡徐坤;2哥哥;3宝贝;4坤哥;5宝宝;6ikun;7cxk;8小猫咪;9崽;10帅哥

蔡徐坤最近真的很火,不仅在百度指数上碾压吴亦凡、朱一龙、鹿晗、TFboys等流量大咖

他起诉B站的新闻也在微博热榜和知乎热榜上连续霸榜好几天。

他到底是怎么火起来的呢?从百度指数上可以看出端倪。

在百度指数的关键词上输入“蔡徐坤”,时间范围选全部

可以看到他的搜索热度有4个节点。

第1个节点是他开始被人知道的时候,时间是2015年6月,当时他参加《星动亚洲》时被媒体挖出曾是TFboys原成员的往事,只是后来因学业繁忙选择退团。

第2个节点是他开始爆红的时候,时间是2018年2月,当时参加《偶像练习生》并拿到冠军。

第3个节点是潘长江在录制综艺节目《王牌对王牌》时,误将蔡徐坤认成了李易峰,结果蔡的粉丝瞬间攻陷了潘的微博,各大媒体纷纷报道。

第4个节点,也就是人气最巅峰时,是他打篮球的视频在B站被大量玩梗的时候!

梳理了一下他的用户触达过程,大概是这样的

后面2个群体人数比前面2个多很多,特别是拥有全网最强玩梗能力的B站用户,可以将蔡的梗病毒式传播到全网。

其实这是好事,毕竟触达了更多的用户,可惜蔡的做法是各种声明和律师函。

这样做只会让黑粉更黑,且多了一个新的梗可以玩

其实他大可以学学Skr吴自黑

这样除了再上一遍头条,粉丝更喜欢他之外,还可以让很多黑粉转路人,甚至转粉!

所以用户运营真的是一门艺术!

——————————————

往期精彩:

东哥上热搜的样子,真像蔡徐坤

数据整理—dplyr包(mutate系列)

内推|阿里大文娱-数据分析(广州/北京)

R语言中文社区2018年终文章整理(作者篇)

R语言中文社区2018年终文章整理(类型篇)