近日,在“四川大学125周年校庆活动暨第七届生物医学大数据·智能技术应用峰会”开幕式上,四川大学华西医院、华为技术有限公司、赛乐基因科技(北京)有限公司联合发布多组学数据加速分析平台。该平台基于GPU加速,集数据存储、计算、管理、使用为一体,旨在推动基因测序技术创新,加速医疗行业数字化转型。

目前,基于该平台已经取得重大阶段性进展:30X人类WGS胚系变异分析时间从24小时缩短至7分钟,这是全球首次将人类全基因组分析推进至分钟级时代,在多组学数据分析领域具有跨时代的意义。

随着新一代基因测序技术(Next Generation Sequencing,NGS)和测序仪的发展,基因测序速度不断提升,测序成本不断下降,人类全基因组的测序成本从过去的30亿美金已经下降到500美金,由此带来了基因相关科学研究和应用的快速发展,目前基因测序技术已经在生育健康、肿瘤个体化诊断和治疗、遗传病、传染病检测、疫苗研发等领域获得广泛的应用,为精准医疗和个性化医疗带来众多革命性创新。

与基因行业的快速爆发相对应,基因测序数据则呈现指数级增长趋势,未来有可能比肩天文数据量。当前每台最先进的基因测序仪每天产生的测序数据已经达到6TB,每年产生的数据则高达数十PB,且需要永久保存。为了及时分析这些海量的基因数据,测序企业和科研机构往往需要投入高额资金建设高性能计算集群和数据中心。因此,基因数据的分析速度与成本日益成为掣肘基因测序行业发展的关键因素。如何提升基因数据的分析效率、降低成本投入成为业内公认必须解决的新课题。

此次三方创新合作,充分发挥了华西医院在多模态组学数据分析和基因应用等领域的领先学术和产业优势,华为公司在高性能数据存储和先进基因数据管理系统上的技术积累,以及赛乐基因在GPU加速生物信息数据分析领域的行业经验。面向未来,三方的创新合作有望在基因测序领域,以数据为驱动,以创新为引擎,加速数据与存储技术赋能生物科技产业,促进甚至引领医疗行业的数字化变革。

“多组学大数据时代已经到来,华西医院多组学数据加速分析平台创新性地引入华为OceanStor Pacific面向多样化算力的融合分析数据底座,以及赛乐基因BaseNumber基因数据分析GPU加速方案,推动多组学数据分析迈入分钟级时代。”华西医院数据科学家于浩澎博士在下午的演讲中提到,“此项研究成果的发布,将加速精准医疗大数据在医学上的广泛应用。”