图片来自123RF

如何用基因画一幅关于我们自己健康的自画像?

“如果有关于靶向治疗的好项目,我们是很愿意和药厂一起共同努力的。”药明明码首席数字官顾延这样说到。

看了电影《我不是药神》的人都知道,慢粒白血病人对于格列卫是爱恨交加。作为一种靶向药,格列卫对于癌症病人的意义就是生命之光,但其高昂的价格让很多人绝望。看完影片以后,很多观众可能都有自己不同的见解。如果你对新药研发有些许了解就会知道,一种新药的诞生,往往要花费数十年的时间和数十亿资金。

药明明码(WuXi NextCODE)的一个基于区块链的“基因大数据库”也许可以帮助药企在新药研发的路上少走弯路。

个人健康数据资产管理

药明明码是药明康德集团企业,拥有一体化基因研发应用和大数据赋能平台。其在近期发布了基于区块链技术的大健康数据银行—— LifeCODE.ai,并在苹果应用商店以及安卓平台同步上线用户端 APP — 来因部落。简单来说,LifeCODE.ai 大健康数据银行希望通过区块链应用在大健康领域,帮助所有人都能够安全有效地管理和使用自己的健康数据,并且从中获益。 “我们最终的目标是帮助研究人员、临床医生、健康机构进行研发及诊断,进而为患者提供全面的精准医学解决方案。”顾延这样说。

怎么理解基因和这些场景的关系?首先,顾延分享了他的观点:基因是精准医疗的必要条件。那么,什么是精准医疗?比如,前文提及的格列卫。与癌症化疗“宁错杀一千,不放过一个”的方式不一样,靶向药物可以直接针对癌细胞,而不“伤及无辜”。但是一般患者服用靶向药前是需要进行基因检测的。如何找到匹配的靶向药?基因则是这个精准医疗的桥梁。“基因是一个人的特性。”他说。

“精准医疗也是个性化医疗,根据每个人的生活习惯和基因情况来量身定制健康方案。以前要这样做可能很难,因为全世界有60多亿人口,数据样本量十分巨大。但是现在通过计算机数字化把这一设想变为可能。”顾延认为,我们的医疗健康应该朝“可以建立一个人的全方位的数据画像”方向发展——就像搜索引擎需要对每个用户建立线上画像,知道这个人的阅读习惯,再做精准的网络推手。“通过基因,我们可以建立一个人的物理的画像,加上他的一些医疗数据,和机器计算能力的协助,能够建立个人的整体健康画像,实现个性化医疗健康。”顾延介绍道。

不过各方面数据的融合并不是一件简单的事情。目前各种问题叠加在一起形成了一堵数据共享及应用的围墙,个人健康画像无法被建立。一方面,二代基因测序成本的下降促使一些消费级基因市场的兴起,基因测智商、测皮肤等应用逐渐被关注,不过很多基因公司的测试数据用处并不大。“很多基因公司的数据是单向化的。只有全方位的数据,如将地理位置、生活习惯等因素整合在一起才更精准。”顾延说。另一方面,数据不能共享也是目前的一个难题。“中国不是没有数据,医院、测试机构有很多数据,而且我们现在有足够的计算能力,但我们没有链接他们的纽带。”顾延说。

据赛迪顾问发布的《2018 中国基因测序产业演进及投资价值研究》白皮书数据指出,2017 年,中国基因测序市场规模约为 72 亿元,预计到 2022 年中国基因测序市场规模将达到 183 亿元。基因检测企业活跃起来,也产生了大量基因数据。不过,这些数据的存储和共享问题却是一个顽疾。其实许多基因测序公司对于未来商业模式的期望之一是,将数据提供给药企或保险公司,也就是说最终的理想应用场景多是医疗级。但是就目前形势来说:现实有些残酷。以华大基因曾公开的的销售收入为例,药物研发类服务仅为 0.59 亿。而且,就一个小型基因创业公司来说,测序产生的数据不一定是非常严肃的医疗数据,在数据量上离大数据也很远。所以,一个基因大数据平台是很急迫的需求。

“我们通过基因数据切入个人健康画像的时候,涉及到数据安全、国家法律法规、利益分享等几方面问题。”顾延直言其实数据平台都会有这样的痛点。以前没有好的解决方案,直到区块链技术的到来。

LifeCODE.ai 大健康数据银行利用区块链很好地解决了上述问题。顾延介绍了该平台的应用原理:“第一,个人或者基因测序企业把数据上传到平台上后自动加密,没有个人授权,谁也不能看到;第二,如果药厂等数据应用方对某些数据感兴趣时可以询问个人是否愿意进行有偿或者无偿合作;个人的健康数据是个人资产,我们的平台是帮助个人管理健康数据资产。”

药明明码首席数字官顾延

分享、互利

提起基因,顾延很兴奋。

这种激情让你很难想到他以前是一个互联网技术人。去年 11 月,前百度首席信息官顾延加入了药明明码,出任首席数字官。从互联网到基因生物领域,顾延这个跨界步伐似乎挺大。“人生是一段旅程,如果最终目的地都是同一个地方,那么我们应该享受这个过程。所以我最喜欢的事情就是跨界,接触新的事物。”他说。就像在生活上喜欢环游世界,探索未知,在专业上顾延也喜欢跨界。“也许技术人到了一定阶段就会对生命科学情有独钟吧!”顾延笑着解释自己为什么会选择基因科学领域。在他看来,基因的本质是把人及生命数字化,这是和互联网互联互通的部分。

一个技术人出于情怀做一些事情,顾延将技术的应用看的很透彻。“分享、互利、共赢是我们发布 LifeCODE.ai 大健康数据银行的初衷。”他解释道,“单个人的基因数据是没有意义的,哪怕拥有单个人所有的医疗诊断信息也没有意义。因为不知道个体的基因变化会引起什么后果,只有把很多样本数据汇集在一起,通过大量的数据解读和分析,基因数据才具有意义。”的确,基因行业的发展需要各环节的协作才能更好的发展。

“我们的整个逻辑是把患者的基因数据汇集在一起,制药企业、医疗机构等数据应用方通过分析这些数据,帮助他们研究更加个性化的和精准的治疗方案,进而惠及患者,实现共赢。”顾延再次解释了“让每个人都更好地生活。”

基因科学作为一个专业的领域,一般消费者并不完全熟知。所以,这也导致一些测序公司可能“走捷径”,如某位患者的基因测序并没有走完整的流程,而患者得到的只是一个现成的报告。“而区块链技术可以把测序的流程细节完整的记录下来以便溯源,如:样本送到了哪里?采用了什么仪器?使用的什么化学试剂?谁进行了什么操作?结果是什么?这在某种程度上可以解决测序行业不规范的问题。”顾延说。

也许现在整个基因大数据还处于数据开发应用的早期阶段,但顾延坚信真正的基因大数据应用会很快到来。