tianchi

我曾经写过一个创业公司 datapark.cn(数据公园)是为创新和设计领域的专业人员,提供关于建筑、室内、时尚、产品、品牌和互联网六个板块的创新设计趋势和商业决策研究分析和数据报告,以帮助他们发展具有竞争力的想法、创意和创新结果。现在阿里巴巴也要准备在它海量的用户数据里寻找出一套更为可靠的推荐模型。

今日阿里云计算宣布启动新一赛季的 “天池大数据竞赛”,吸引全球新生代数据科学家,为预测手机党购物喜好、余额宝资金流动、时尚穿衣搭配,提供更精准的数据分析模型。

首届 “天池大数据竞赛” 是由阿里巴巴集团董事局主席马云 2014 年 3 月在北京大学发起。首届大赛共有来自全球的 7276 支队伍参赛,海外参赛队伍超过 148 支。阿里巴巴集团为此开放了 5.7 亿条经过严格脱敏处理的数据。上一赛季的数据提供方为贵阳市政府,参赛者根据交通数据模拟控制红绿灯时间,寻找减轻道路拥堵的方法。

本届天池黄金联赛将向全世界的科研人员和高校师生开放,从 3 月底一直持续到 12 月份。参赛选手可以免费使用:由阿里云计算提供的御膳房、ODPS(Open Data Processing Service)等大数据处理工具;由阿里巴巴、蚂蚁金服集团提供的,经过严格脱敏处理的海量商业数据。大赛采取积分晋级制,排名通过官网每天更新,总奖金可最高挑战 100 万元。

其中两道赛题,是关于 “移动电商推荐算法” 和 “淘宝穿衣搭配算法”。比如,一个 20 岁的都市女性,在夏天某个周末下午的星巴克时间,想要一条玛丽莲梦露式的白色连衣裙,还是更喜欢奥黛丽赫本式的黑色小洋装,或者她只是想要一瓶防狼喷雾剂?

另一道来自蚂蚁金服的赛题,听起来则严肃得多——“资金流入流出预测”。蚂蚁金服拥有上亿会员,余额宝 2014 年底资金规模高达 5789 亿。如何既保证用户高收益,又避免大量赎回出现挤兑风险?参赛选手们需要精准预测未来每天的资金流入流出情况。

知名大数据专家、阿里巴巴集团副总裁涂子沛介绍,比赛中胜出的优秀数据模型有可能直接应用于淘宝、支付宝等真实的商业场景,影响中国乃至世界数以亿计的用户。