IBM深度学习模式效率惊人，一举超越Facebook和微软

ibm

8月8日消息，一直以来，“深度学习”作为人工智能的重要组成之一，因其具有与人脑相仿的工作原理，被微软、Facebook、亚马逊和谷歌这几家科技巨头关注。而IBM使用的深度学习系统消化数据所需要的时间已经从数天缩短至几个小时。

IBM研究所研究员和系统加速及记忆主管希拉里·亨特（Hillery Hunter）表示，这一效率的提升将有助于放射学家更快、更准确地找到病变部位，并读取大量医学图像。

截至目前，深度学习主要是在单一服务器上运行的，因为在不同计算机之间移动大量数据的过程过于复杂，而且，在大量不同的服务器和处理器之间保持数据同步也是一大难点。

IBM在今日宣布，已经开发出一款软件够将这些任务分配到64台服务器。据悉，这些服务器总搭载有256个处理器，这也就意味着在速度上取得明显的提升。值得一提的是，凡是拥有IBM Power系统服务器的用户，或者其他想要测试的技术人员，都能享受这项技术。

IBM采用64个自主开发的Power 8服务器，并使用NVLink与特尔微处理器和英伟达图形处理器相连接，促进两种芯片之间的数据流传输。

亨特近一步表示，如果流量管理不当，一些处理器就会闲置。每个处理器都有自己的数据集，同时还需要来自其他处理器的数据，以获得更大的图像。如果处理器不同步，它们就学不到任何东西。

亨利想法是提高深度学习模式的速度，以此提高它的工作效率。例如，深度学习从一个带有8个处理器的服务器扩展到64个，每个服务器有8个处理器，可以将性能提高50-60倍。

IBM还称，该系统通过由加州大学伯克利分校创建的“咖啡因”深度学习框架，在256个处理器之间实现了95%的扩展效率，超越Facebook人工智能研究公司创造的89%扩展效率。

在图像识别方面，IBM系统使用“咖啡因”框架，7个小时内识别了750万张图片，准确率达到了33.8%，击败了微软29.8%的记录。

IBM表示，不仅是“咖啡因”框架，谷歌的TensorFlow框架也可以在这种新技术上运行。莫海德说，值得注意的是，IBM在运用自己在高性能计算方面的专业知识的同时，还应用了Tensorflow和“咖啡因”这种外部资源，这种做法有助于提升该项目的深度学习能力。