不久前,re:Invent 2022在美国落下帷幕,作为全球云计算产品和技术的风向标,今年亚马逊云科技在本次大会上发布了大量和数据和机器学习相关的新服务和新功能。

2020年4 月,国家发展改革委、中央网信办联合印发《关于推进“上云用数赋智”行动培育新经济发展实施方案》,鼓励在具备条件的行业领域和企业范围内,探索大数据、人工智能、云计算、数字孪生、5G、物联网和区块链等新一代数字技术应用和集成创新,为企业数字化转型提供技术支撑。

而上云、用数、赋智,精炼地描述了企业上云的三个阶段,三重境界。上云可以相对容易,用数学问比较大,赋智是更高的境界。

亚马逊云科技开展机器学习的一个独特之处是授人以渔。Amazon SageMaker推出以来,亚马逊云科技不断围绕机器学习平台Amazon SageMaker,推出大量新功能,将机器学习技术传授给客户。五年来已经为Amazon SageMaker增加了260项新功能,不断降低机器学习的技术门槛,简化机器学习的前期工作,加速为客户“赋智”。在数据服务方面也是如此,通过各种新服务和新功能,尽可能让开发人员可以上手开展机器学习。

动点科技了解到,Amazon SageMaker Studio Notebook提供全新数据准备功能,帮助客户直观地通过几次点击检查和解决数据质量问题。专业人员在准备训练数据时希望直接在Notebook中探索数据集,以发现和纠正潜在的数据质量问题(如信息缺失、极值、数据集失真和偏差)。专业人员可能要花费数月时间编写样板代码将数据集的不同部分可视化,检查数据集,以期识别和修复问题。

Amazon SageMaker Studio Notebook新提供了内置的数据准备功能,让专业人员只需点击几下即可直观地查看数据特征、修复数据质量问题,所有这一切都直接在Notebook环境中进行。当用户在Notebook中显示data frame(即数据的表格形式)时,Amazon SageMaker Studio Notebook 会自动生成图表帮助用户识别数据质量问题,提供数据转换建议帮助解决常见问题。专业人员选择数据转换后,Amazon SageMaker Studio Notebook 会在Notebook中生成相应代码,可供每次运行Notebook时重复应用。

Amazon SageMaker Studio 是一个集成开发环境,它提供了一个基于 Web 的可视化界面,开发人员可以在其中访问各种工具,执行所有机器学习开发步骤,从准备数据到构建、训练和部署机器学习模型,将数据科学团队的生产力提高多达 10 倍。开发人员可以快速上传数据、创建新记事本、训练和调优模型,在各个步骤之间来回切换以调整实验,还可以在不离开 Studio 的情况下将模型部署到生产环境中。

此外,亚马逊云科技推出的一些新功能也充分利用机器学习技术。例如,Amazon QuickSight Q的自动数据准备功能使用预先训练的机器学习模型,从客户现有的看板和报表等数据资产中进行学习,在几分钟内为每个新数据集预配置业务术语,从而减少开始查询数据所需的时间。例如,流媒体服务可以使用Amazon QuickSight Q自动数据准备功能,通过已经存在的看板为数据集预配置业务术语。之前的看板可能包含了按客户类别、客户编号和地理位置划分的付费用户信息。如果营销经理准备规划一个发布活动,他们可以问,“我们在洛杉矶有多少付费用户?”,Amazon QuickSight Q将返回精确的结果。Amazon QuickSight Q自动数据准备功能现已向所有Amazon QuickSight Q客户提供,不需要额外付费。

“Amazon QuickSight Q改变了游戏规则,使高管、销售和数据工程团队能够即时从数据中获得答案。在许多情况下,我们的团队希望在仅仅提供历史趋势或当前数据快照之外的维度了解事情发生的根本原因并预测趋势。”纳斯达克北美市场产品经理Michael Weiss表示,“Amazon QuickSight Q追问预测依据的新功能将帮助我们的用户了解对关键指标变化贡献最大的主要维度和数值,而预测功能将帮助我们的用户探索前瞻性洞察,例如不同细分市场和客户的未来收入和市场份额增长。Amazon QuickSight Q的这些新功能将帮助我们加速建立商业智能,通过完全自动地进行复杂的数据分析,帮助最终用户实现自助式服务,无需分析师构建模型和分析。”

亚马逊云科技大中华区产品部总经理陈晓建表示,本次re:Invent发布了非常多的数据服务。从这些re:Invent发布的特性中,能够看到未来技术演进的方向是数智融合。其中尤其值得关注的是Quicksight Q,它推出了多项新功能,把人工智能和业务洞察相结合,使得客户不用再去掌握数据分析技术,而是通过人类自然语言来进行业务的洞察,从而大降低了使用门槛。