ARM Inside! 百度云首席架构师林仕鼎: 30年PC时代终结

2013年1月11日,百度全国数十个数据中心之一的南京云计算数据中心首度对外曝光。百度云首席架构师林仕鼎在与倪光南、侯自强等业界专家的参观交流中指出,数据中心和企业市场是x86 PC的最后一个堡垒,随着百度云带领ARM进入数据中心,30年PC时代宣告终结。


走向移动物联网:变革的时代

从1990年开始普及的桌面互联网(Internet),到2000年萌芽的移动互联网(Mobile Internet),再到2009年随着美国“智慧地球”概念兴起的物联网(The Internet of Things),信息技术正在不断推动人类变革前行。

如果说几年前人们还对“云”的概念云里雾里的话,那么,随着电脑、笔记本、Pad、iPhone、安卓智能手机、智能电视的普及,人们迎来了“多终端”和高速网络的新时代,每个终端都不必强调自身强大的计算力,而可以简单地、普遍地依赖“云”计算。

终端数量爆炸式增长,“云”的依存度显著提升,使大数据成为时代的标志之一。以百度为例,其日处理量达100PB。截至2012年12月,开放注册仅4个月的百度个人云,用户便突破2600万,每天有近20万人改变了存储习惯,把文件放到了百度“云”上。


数据中心:全面

当大数据、云计算来临之时,传统的数据中心也全面“云”化。首先,数据来源日趋异构化,不仅有桌面互联网,还有移动终端和智能设备,更有通过传感器连上网络的物联网物件。其次,在前端OS层面,也需要一个非硬件依赖的云OS,完成应用、连接和交互。再次,需要有软件基础架构(可理解为后端OS),上可以对接数据智能(两者可实现大数据技术),下可以协同数据中心、网络、服务器(两者可实现云计算)。

图:变革背后的技术驱动力

林仕鼎解释,百度云数据中心计算的主要技术领域涵盖了存储、计算 、超大规模系统、数据中心体系结构等。比如存储,不仅要考虑文件、对象以及表等数据组织结构,也要定义访问模式,读少写多、读多写少等不同模式会在很大程度上影响存储系统的设计。再如计算,也分为数据密集型、计算密集型和通讯密集型。相比传统数据中心,技术的处理更加细致入微。

图:数据中心计算的主要技术领域


三大变革:见证30PC时代终结

林仕鼎谈到: 随着云时代的到来,对技术人员来说,也迎来了从Desktop(桌面)到Datacenter(数据中心)的三大变革。

首先是计算范式变革,其中不少为计算哲学的颠覆式革命。如桌面时代讲究Architecture(架构),到了数据中心时代就要讲究Fabric(体系结构);传统的BIOS就要变成Host OS(主宿操作系统);传统的Kernel(核心如linux)变成Infrastructure(大规模分布式基础架构);传统的Application(应用)变成Services/Tasks(服务/任务);传统的质量保障的标准由0 bug(0错误)变成Fault-tolerance(容错系统);传统的数据目标由Correctness(正确性)变为Precision(精准)。想想百度搜索某个关键词的例子就能明白。

第二大变革是环境与设计目标的变革。环境由单用户多任务变成了多用户单任务,对规模、成本、交付时间的要求也变得更加重要。

第三大变革是设计理念的变革。透明性不再成为美德,层次化开始向竖井式演进,软硬件系统都打破原有的预设和行为方式,开始向Application-driven(应用驱动)和Software-defined(软件定义)的方式发展。

林仕鼎举了百度自主研发SSD的例子。传统的系统架构中,是由一个总的SSD controller(SSD控制器)来控制下面的Flash存储单元,这样的好处是黑箱化、层次化。但不利之处是SSD往往读取较快,写入较慢,容易形成瓶颈。在百度自主研发的SSD架构中,取消了写缓冲、擦写平衡等复杂逻辑,大幅简化SSD控制器的设计。通过将一个大的SSD划分为N个单元,每个单元都有独立的控制器和存储单元,这些信息和控制接口暴露给上层存储系统后,形成了多个管道,并行读取、存储效率可以大幅提升。

再以服务器技术为例,百度实现了去RAID,全系统范围实现冗余,引入机器学习预测硬盘故障,采取创新的共享架构,节点概念扩展至机柜,引入ARM节约能耗,这些都是百度在设计理念上的变革所致。


惊艳! 百度云计算硬件基础设施


当林仕鼎介绍完百度云计算硬件基础设施的一些亮点之后,我们只能用一个词来形容百度的这次创新: 惊艳!

  • 全球首个ARM架构服务器在数据中心的规模应用,存储密度提升70%,TCO降低25%;

  • 国内首个大规模部署自主设计的定制化整机柜服务器,TCO下降10%,交付效率提升10倍;

  • 在南京机房部署了5000余台万兆集群,为国内互联网行业内最大规模。该万兆TOR(Top of Rack柜顶式)交换机全部由百度自主研发设计,接入成本对比同类商用方案下降83%;

  • PUE达国内最佳水平。如百度M1自建机房最佳PUE达1.18,年均PUE达1.37,全年约50%的时间实现完全免费冷却;

  • 自主研发SSD,系业内首家自主研发及规模应用,相对SATASSD性能提升6倍成本降低10%,相对PCIEFlash
    性能提升2倍成本降低40%。

云计算带来了30年PC时代的终结。在云时代,不论是硬件还是软件,都实现了彻底颠覆,云带来的变革将无远弗届。非常有意思的是,林仕鼎用毛主席《七律·人民解放军占领南京》作为演讲的结束语,“虎踞龙盘今胜昔,天翻地覆慨而慷……天若有情天亦老,人间正道是沧桑。”。

的确,从PC到Mobile, 从Intel Inside到ARM Inside,我们应该兴奋,因为我们正在亲历一个变革中的IT时代。

毛泽东《七律·中国人民解放军占领南京》一九四九年四月