登录
深度学习 数据挖掘

数据挖掘如何从挖掘事实(fact)成长为挖掘洞见(insight)?

008

更多
高慧寒
95
0
2020-02-28

1.从业务角度拆解
总结来说八个字:时间对比 维度划分(纵向 横向)

拿知乎举例:
拿题主提到的用户活跃来说,如何对知乎用户活跃做分析?

1.1 时间对比。

今天的用户活跃度相对于昨天是上升了还是下降了?相对于上个星期的一天是上升还是下降?相对于上个月呢?
1.2 维度划分。

横向:是哪一部分用户上升或下降?新用户还是老用户、哪个年龄段、哪个城市、哪种机型?再来对产品拆分,是回答问题的用户数有变化?还是提问的用户有变化?这样就形成了一张巨大的二维表,能够细分到每一块看是上升还是下降。

纵向:而对于产品的某一块,还可以做漏斗转化分析,从注册页面到首页转化率,从首页到浏览问题转化率,从浏览到点赞转化率。
做完之后就会发现哪里转化率相对较低,这个时候就可以与业务人员交流,思考如何从产品、运营角度来提升,不断的用时间前后对比来看是否数据有提升(这里会有大量的ABtest)。

总结来说就是不断的对比 不断的维度划分

2.从技术角度挖掘数据
要想完成数据挖掘,除了业务上的知识,还需要一定的编程能力和算法能力。

业务部门提出的问题,大部分问题都可以转化为数据挖掘中的分类、回归或聚类等问题。

还是拿知乎举例:
比如知乎用户如何在大量的问题中看到他想看到问题,这是个性化推荐问题,运用的到的是各种分类算法。
用户的留存与什么因素有关,如何准确得知用户是否留存?如果熟悉逻辑回归,就可以选择特征来建模,解释模型中各个feature的weight,而逻辑回归的输出就是留存的概率,可以根据业务需求,指定阈值,预测是否留存。
关于如何做到,个人认为需要注意以下几点:
1.增强自己的数据清洗能力,这是基本功。
2.增强与业务人员的沟通能力,发现运营、产品上的业务痛点,这点很重要,直接决定你的工作是否真正有用。
3.一定的编程能力,对统计模型、机器学习算法要熟悉,能快速产出原型,迭代验证。

4.增强数据敏感度,保持好奇心,多多观察数据



原文链接:https://www.zhihu.com/question/62425650/answer/206292696

相关推荐