自4月29日阿里入股新浪以来,外界开始揣摩马云花5.86亿美元要去干什么,一边倒的观点认为,马云是看中了新浪微博的数据。
没错,笔者也这么认为,但最关键的问题是,马云为何会看中新浪微博的数据、他要用这些数据去干什么,是用来做简单的营销+导流?NO!阿里浪联姻最大的价值在于需求预测模型的构建。
为何是新浪微博不是百度?
国内数据挖掘企业中,百度有百度指数,数据来源是海量的网页、新闻搜索;新浪微博有微指数,抓取的是微博用户的行为、博文数据;阿里有淘宝指数、数据魔方,数据来源旗下电商店铺、商品浏览记录、商品品类、成交收藏评价数据。
阿里为何不去与百度结合,继而生成一个更为巨大的怪兽?有人笑了,怎么可能?
一、单从数据层面来看,百度数据来源、用户成分很复杂,与淘宝、天猫等电商数据整合难度大,建立能准确反映消费需求的数据模型更困难。谷歌具备这个实力,百度难说。
二、相比之下,新浪微博的数据来源更单一,全部来自旗下5亿多用户的社交数据,而最核心的因素是,新浪微博与天猫、淘宝网的用户重合度高达40%。目前,天猫、淘宝网的用户数量约为5亿。这意味着有2亿用户既是新浪微博的用户,又是天猫、淘宝网的会员。
通过新浪微博后台的数据分析,天猫、淘宝网能够获知该用户的消费需求。比如,一微博用户发了许多关于健身的状态,系统在分析后就会猜测:该用户可能有健身喜好,天猫、淘宝网就能向其推送健身产品的促销信息了。
阿里入股新浪微博后,二者用户账户、数据交换、在线支付、网络营销展开合作。笔者认为,只有打通用户数据、网络营销两项可行性强点,其余都是浮云。
三、新浪微博数据挖掘技术积累不足,而阿里无线团队的强大。笔者曾采访过微软MVP付海军,他的观点是新浪微博虽有海量数据,但目前连垃圾粉筛选过滤都很糟糕,更别谈深层面的数据挖掘,而阿里的淘宝、支付宝团队数据挖掘实力强大,从发布的淘宝交易趋势可以看出。
最大价值是需求预测模型!
两个平台的用户数据全部打通后,阿里就能通过数据挖掘进行精准营销+导流。但这就完了吗?这只是基础而已,阿里浪联姻的最大的价值在于构建精准的消费需求预测模型。
与新浪微博数据相比,阿里的数据库最大的缺陷在于滞后性。这跟《大数据时代》中,谷歌与美国医院冬季禽流感数据类似:一位可能患有禽流感的用户,首先会去谷歌上搜寻“流感的症状”,等病情严重后才会去医院就诊。
那么同样,一位用户有消费需求,首先可能会在微博行为中体现,等需求到达一定程度,才会去天猫、淘宝网上去购买。新浪微博数据更原始,更前瞻,能直接获知用户的消费需求。
以阿里旗下的淘宝数据魔方为例,主要功能为品牌、产品热销分析,淘宝热词分析(产品热词),消费流量来源分析,属于总结性数据,缺乏对趋势的预测性,对商家的价值不大。
有了新浪微博的数据之后,阿里可以怎么做?
两个平台的数据库全面打通后,新浪微博的海量数据可进行对消费需求的预测,如哪些用户可能产生消费需求?而阿里数据库则可用来验证,有需求的哪些用户会把需求转化为实际购买行为?
具体的做法是,利用新浪微博的词条挖掘,建立一批词条与消费需求联系的数学模型,然后逐一进行测试。再将得出的测试结果与用户在淘宝、天猫上消费的实际数据进行对比,重新筛选出与实际消费数据吻合的特定数学模型。
模型建立后,阿里就能精准预测哪些用户会发生购买行为,哪些商品会热卖?有了这些数据后,天猫的50000卖家、淘宝网的1400万卖家才能有效安排商品的采销、库存等环节。
阿里的消费数据与新浪微博的用户原始数据,会组合成一个巨大的竞争门槛,可能把国内数据指导销售做到一个新的水平。当然,这件事还有一个企业能做,那就是腾讯。
它旗下有腾讯微博、QQ空间、微信等社交媒体,再加上易迅、QQ网购等电商网站。但遗憾的是,其中多属于“千年老二”,要干过“阿里浪组合”,还得看自身造化。