阿里商业评论:天猫大数据挖掘解密
2675
2016-05-31 16:40
文章摘要:天猫一天能产生多少数据? 截至2013年底,天猫已经汇集了8万商家,10多万品牌,服务近5亿消费者。2013年“双11”的那些数字仍就令人激动:6分钟07秒,成交10亿;38分钟05秒,成交50亿;下午1点钟,我们的成交已经超过了2012年的190亿;整个“双11”成交了350亿。 面对这么大的交




天猫一天能产生多少数据?


截至2013年底,天猫已经汇集了8万商家,10多万品牌,服务近5亿消费者。2013年“双11”的那些数字仍就令人激动:6分钟07秒,成交10亿;38分钟05秒,成交50亿;下午1点钟,我们的成交已经超过了2012年的190亿;整个“双11”成交了350亿。



 


       面对这么大的交易量,天猫日常的数据有多大的量呢?天猫每天产生的数据有80多个T,这80多个T的数据正是数据分析和挖掘的基础。在阿里巴巴集团内部,数据是打通的,很多数据要关联的分析。目前,天猫每天导购数据分析任务1万多个。面对这么海量的数据,如何能够做到精准、稳定又快速地响应业务多变的需求,一直是数据团队不断研究和解决的问题。


天猫大数据挖掘的对象有哪些?


天猫大数据挖掘的对象主要有三类:


人。人是我们的消费者,只有了解了消费者的需求是什么,才能去精准满足消费者的需求。我们从大数据背后去挖掘用户可能不知道的一些需求,如用户行为偏好、行为轨迹等。如“宝宝计划”,通过对消费者购买行为的分析,判断他有没有小孩?小孩现在多大?处在哪个阶段?然后给出相应的推荐消费模型,点击率相比与之前提升了4倍。


店。店是商家。一是招商。基于消费者的需求来指引商家的类型、商家提供的货品。二是助商。商家进来之后,怎么样帮助他们成长?尤其是一些传统品牌的商家,互联网化营销经验不足,我们需要通过数据化的产品教他们怎样去做。


货。要实现人和货的精准匹配,一方面了解什么样的货能够满足消费者的需求,另一方面清楚我们缺什么样的货。实现的路径主要有搜索、个性化推荐、营销活动等。


天猫数据挖掘的技术架构长啥样?


首先是数据源。就阿里内部而言,数据源非常多,如天猫、淘宝、无线、1688、支付宝、小微等等。外部数据,则主要来自合作伙伴,如气象数据等。其次是通过hadoop集群和Spark集群等,建立各种主题的数据提示。建立数据提示的基础是,有很好的数据。很多数据是非结构的数据、有噪声的数据,需要把这些数据处理好,这样才能进行快速分析,建立商品、会员等各种数据提示。


天猫数据挖掘今后努力方向在哪里?


移动电商。阿里正在全面推进All in无线战略。去年“双11”,前1小时无线端的交易额已超过10亿,这是很有说明性的数据。显而易见,无线端的消费模式和PC端完全不同,无线用户在使用无线终端时,时间碎片化特性明显。等红灯时、睡觉前都可以手机看下淘宝。如何利用这些碎片化的流量给整合在一起呢?从技术角度上看,我们要去做的就是,在移动电商时代,怎样把所有移动终端的数据都采集到一起。只有这样,前期积累的数据才会有用,才能会帮助我们后续对项目的理解和推动。


继续学习。尝试使用“Deep Learning”和新的算法在我们的业务上。面对海量数据,如何准备的进行数据采集、数据优化,如何快速实时地响应业务需求,如何保障信息安全这都是数据处理工作的挑战,都将是天猫数据挖掘团队今后努力的方向。



版权声明:

凡本网内容请注明来源:T媒体(http://www.cniteyes.com)”的所有原创作品,版权均属于易信视界(北京)信息科技有限公司所有,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,易信视界(北京)信息科技有限公司将追究其相关法律责任。

标签:

评论