“有好几次,我都觉得公司会破产,但最后还是过来了。所以只要坚持下去,一般都会就好的。”HistoWiz  的创始人程可以( Ke Cheng)没想到自己最开始一个人建立的公司,在短短数年内,可以实现很好的盈利。需要强调的是,程可以是在建立癌症病理数据库,这事并不简单。

癌症数据孤岛堵上了攻克癌症的大门

癌症让人不由自主地联想到死亡,所以几乎每个人都是谈癌变色。这样的恐惧,来自于我们对于无法治愈癌症的现状的不安。程可以也体会过这样的不安。曾经目睹癌症带走亲人生命的她一直对癌症“耿耿于怀”。“我一直想治愈癌症。”她说。

获得了康奈尔大学和哈佛医学院双料博士学位后,程可以到了 ISREC(瑞士临床癌症研究中心)。十多年来,程可以泡在实验室,以科学家的身份与癌症打交道。不过她发现病理组织学发展太慢,人类与癌症这场拉锯战的速度跟不上癌症吞噬生命的步伐。此前,世界癌症研究基金会公布的一份调查报告显示,到 2035 年,全球癌症病例数量将达 2400 万例,增长幅度将达到 58%。

就像目前整个医疗行业面临的数据孤岛问题一样,癌症数据孤岛成为了攻克癌症的一大围墙。“癌症研究需要看基因,也需要看病理组织。现在的基因基本已经数据化,但是病理数据还停留在切片上,没有数据化。”程可以说。

其实,在癌症的诊断过程中,临床医生并不是宣布“死刑”的人,而是病理学专家。临床医生怀疑患者患有癌症时,患者需要做活检,也就是医生从患者体内取出一块病变组织,做成病理切片。病理学专家会分析病理切片,最后作出准确的诊断。病理学专家的诊断被作为临床的最后诊断。

“一个是做切片速度特别慢,另外一个就是数据没有办法共享。这是全世界的癌症病理组织研究的痛点。”程可以解释道,传统的手工活检过程要花一个多月时间。而且每个医院或者实验室都有成千上万个病理切片,这些数据无法共享。也就是说,即使之前有遇到相似的病症情况,医生也因无法参考之前的分析,而需要从零开始花大量时间做分析。而且,病理学专家也是非常“稀有”。这无疑是对癌症研究的时间、精力浪费。

建立共享病理数据库

如何打通癌症研究的围墙,加速癌症研究的速度?这个思考让程可以放弃了安稳的科学家生活,一头扎进了创业生涯。2013 年,她离开实验室回到纽约独自创立生物科技公司 HistoWiz。

“HistoWiz 建立了一个全球病理数据库,绘制一个像谷歌地图一样的,全面、精细的疾病细胞地图。”程可以依旧坚持着攻克癌症的决心,不过这一次,她打算以一个支点翘起整个癌症研究系统。“我希望通过建立一个全球性的共享数据库,可以让癌症研究从单兵作战变成全世界的协同作战。”HistoWiz 利用大数据、人工智能算法为癌症研究助力。基于癌症数据库,其提供切片扫描、病理学专家诊断、人工智能辅助诊断,科研等数据应用服务。


为研究机构和医院提供切片服务是 HistoWiz 的基本服务。“我们有一个全自动化的软件,集合了样品处理过程中每个步骤需要的仪器。这些仪器以前是分散开的,我们现在把它们集合在一起。这样,客户可以直接在网上看到分析结果,病理专家也直接在网上可以做诊断。”

程可以说,HistoWiz 可以在两天之内把样品做成虚拟切片图像,这些图片可以放大 400 倍,效果和显微镜无异。而且,可以在电脑或者手机上观察。

“病理学家和医生、患者都可以随时随地看见高清晰度的切片数据。这就等于给癌症领域打开一个新的窗口,让更多的人可以进入这个领域。我觉得这是一个非常伟大的工程。”程可以笑着说。

虚拟切片

通过切片服务收集数据只是第一步——建立数据库,HistoWiz 还需要建立一个标签化的数据库。“我们需要给数据做一些标签,比如它是属于哪种癌症,这对于数据的应用有很大的帮助。”据程可以介绍,HistoWiz 现在建立了一个网上的会诊团,优秀的病理学专家可以在平台上兼职。这些专家在做一些诊断服务的同时,也完成了数据标注的过程,这对于数据的管理或者后期大数据的应用、人工智能诊断模型的研发都是关键。这样的模式下,病理专家可以得到 60% 的提成收入,平台分成 40%。

“切片服务和与给专家提供诊断平台收取分成是我们的主要收入渠道。”程可以透露,这家成立了 5 年左右的生物科技公司早已收支平衡。医疗行业发展漫长,很多公司在没有明白商业模式的时候就已经夭折。而细分领域下的生物科技初创公司或医疗大数据初创公司,更是面临入不敷出的局面。HistoWiz 算是一家“活得明白”的公司。

有利标准化的数据库,HistoWiz 打算考虑时下的技术时尚宠儿——人工智能诊断。“对于中国、墨西哥等癌症研究发展比较慢的国家,我希望可以人工智能帮助病理专家做诊断。因为往往人眼看不出来的规律,算法可能会找出来。数据越多,攻克癌症的机会大。”

目前,HistoWiz 的数据库已经有 7 万多个虚拟切片。这些数据来源主要有两个方向,一些临床前的研究数据(小白鼠研究数据)和从机构、医院客户那里收集到的数据。“如果客户把数据捐赠给我们,我会在给他的切片服务上有一个很大的折扣。”程可以说。

据悉,目前还没有人做癌症病理数据库,HistoWiz 数据库的作用可见一斑。医生、科研人员、药厂、研究机构等都可以用 HistoWiz 的数据库。如科研人员在发表文章时,可以在文章里加一个虚拟切片的网址,更直观、清晰的展示论证;药厂在制药做数据分析时,可以通过数据库了解一些反应数据分析,不用再去花大量时间养小白鼠做实验。

跑销售的科学家创始人,真格和YC都喜欢

程可以

“自己跑销售的科学家”,这是别人给程可以的笑称。当初一个人研究,一个人销售,程可以的创业很长一段时间都只有自己一个人。

“我以前做科研的时候就是一个人在做,很少跟别人打交道。我之前不关心建立团队这件事情,认为一个人什么东西都能做。徐小平跟我说,你赶快建立优秀的团队,我没有听他的。后来不断跑市场,实验室,终于把自己累垮了,就开始建立团队。”程可以第一次见到徐小平是在一次饭局上,不过她不知道旁边就是著名的天使投资人。“我没想过去融资。”程可以是典型的科学家,一心扎在研究上,即使是销售也是为了交流研究。不过,这个跑销售的科学家吸引了徐小平。就这样,真格基金在 2015 年投了 HistoWiz 数百万美元。

“我们的团队很年轻,我自己也没有创业的经验,所以走了不少弯路。曾经我在找团队的时候,还被欺骗过,花了时间精力打官司。不过,现在想来,这都是创业过程中的必经之路。”作为一个科学家出身的创始人,程可以需要在创业过程中改变很多。

不过,像文章开头程可以说的那样:坚持下去,一般就会好的。因为她一直对攻克癌症的执着,目前,HistoWiz 已经建立了一个 20 多人的团队,有 1500 多个客户,包括美国的大型药企、美国知名的研究机构、医院和大学如哈佛、MIT 等等。

值得一提的是,著名孵化器 YC 也抛来了橄榄枝。“被 YC 选上和去哈佛一样难,我觉得很意外。因为 YC 从来不选像我这样的一个人做企业的项目。”程可以笑到:“可能他们想让更多的人都听到这个故事,一个跑销售的创始人和一个成立几年就盈利的生物科技公司。YC 的风格是选最聪明、最好的人。我很开心被选上。”在 YC 不断的路演中,程可以与硅谷的资本接触很多。“这段经历让我对融资的理解深刻了很多。”她说。

如果了解一下目前的医疗大数据或者人工智能医疗市场,也许我们可以理解为什么 YC 选择了程可以。现在,很多公司积累数据的方式是花钱买数据,再花钱让专家做标签。“这是一个挺危险的方法,很有可能花了很多钱却做不出来产品。而且人的数据还会涉及到私密性的问题。”而 HistoWiz 通过服务积累数据,此外寻找了临床前的数据,这些问题就迎刃而解了。

对于程可以来说,一切的事业成就都只是因为她坚持了初心。技术可以变,解决方式可以变,当初开始的理由是永远不会变的,她一直想攻克癌症。

注:题图来自123RF