你用互联网查过健康相关问题吗?如果有,那么你并不孤单,搜索引擎中5%以上的搜索请求是与健康相关的。但是你也知道,得到的成千上万条搜索结果信息量大得可怕。酸痛的脚趾是因为抽筋呢,还是因为像痛风这种严重的疾病?不断地干咳是因为感冒一直不好还是因为间质性肺炎?这个现象太普遍了,人们还给这个现象起了个新名字叫上网自我诊断。
幸运的是,人工智能的发展可以让这个经历不再这么吓人了,对于病人或者医生来说,有效性也大大提升。很快我们就能够建立起高度个性化的健康问答系统, 比起仅仅回答“什么是麻疹?”这种简单的问题,这个系统能够做更多的事情。
为了展示其可行性和前景,我们先来了解如今搜索引擎是如何回答那种相当简单的问题的。首先,它会先舍去“什么是?”,然后简单检索最符合“麻疹”的条目。在搜索引擎语言中,条目是一个人,地方或是东西。 每种疾病、症状、化学物质、疗法和医师都有相关的条目。不同条目之间的关系——某药品中有某化学物质;或某蛋白质组总是在某器官的某种癌的肿瘤中出现——是基于事实的框架。如果你的搜索引擎搜索到了药物的相互作用的相关知识,它就能轻易回答“如果我在服用辛伐他汀,能同时服用布洛芬吗?”这种问题。
事实库越大,得到的回答就越详细和个性化。如果我问“我工作单位附近有地方能让我检查下膝盖吗?”会怎样?首先,搜索引擎需要检查我的个人情况来搞清楚我说的是什么样的膝盖问题。如果它能调出我的医疗档案查看以前是否有任何建议疗法出,这也很有帮助。其次,它需要知道什么样的医疗机构能够处理这种膝盖问题,并且他们提供的治疗方案是否适合我的情况。然后,这里还涉及到保险的问题——这家医疗机构是在我保险覆盖范围内吗——当然,还有和我办公室的距离。
不过,最有趣的地方在于不确定性。在健康医疗事实库中,许多联系是基于概率的。皮肤白皙的人有15%的可能性得红斑痤疮。胰腺炎患者眼白出现黄色的几率更高。这些事实有助于回答诸如“我的脚麻了,我该怎么办”之类的问题。
在有小条目组和小事实库的医疗领域中,我们已有数十年成功用机器诊断潜在病因的经验。我希望能看到问答系统给这些问题提供答案,当然首先要谨慎。最初,我们能够看到搜索引擎在现在搜索结果上的一点延伸:根据提供的症状提出一个可能成因的清单。但是,就像地图和高速导航的情况一样,当越来越多的人使用这个系统,信息积累也会加速。知道个人信息,比如性别或之前的症状,有利于诊断系统权衡可能的起因,并且在某些情况下全基因组信息也很有用。事实库包括已知的特定疾病的基因组标记,更为重要的是它与个人标记、疗法和结果之间的关系。我确信,到2020年,病人们可以他们的搜索引擎提出这种问题:“我之后该如何治疗腱炎?”。
不仅仅是我一个人对未来的进展和这个诊断系统挽救千万人生命的潜力有信心。我们看到这个领域内的大项目和多方协作。就在上个月,卡耐基梅隆大学、匹兹堡大学和匹兹堡最大的医院系统,UPMC,宣布结盟。该连盟认为他们将通过大数据变革医疗体系,计划以十年为期,呈现一个稳定和可测量的健康问答系统。医疗软件的提供者,例如IBM和Cerner,还有主要的电子商务和搜索引擎公司,都在争夺成为个性化医疗体系后台技术主要供应商的机会。
我认为基于人工智能和大数据的个性化医疗系统即将来临。在我对此充满信心的同时,还有一些待解决的问题。首先,我们还不清楚是不是所有的新信息都会被整合到医院的信息系统和医患咨询过程中。如果整合力度小,我们可能仅仅看到病人拿着满是建议诊断和测试的iPad走进医生的办公室。如果两者整合,我们可能得到对病人问题更有效力的回答,并且在与医生的咨询中更好地安排时间。第二个问题涉及隐私和数据泄露。这个系统只有在个人坦白足够多的个人信息才有效。但是正如我们在网上购物中所见,当这些数据泄露了,结果会是沉重的。而病人的医疗历史的泄露将是灾难性的。
如果我们能够解决这些突出的问题,我相信我们能就能够彻底革命医疗保健行业。
(作者为卡耐基梅隆大学计算机科学学院院长)
评论