Skip to content
搜索以了解InterSystems产品和解决方案,职业机会等。

无效输入想换来有效输出?—— 技术没有“上帝之手”

在古代,甲骨文是人们接收智慧和神圣谏言的途径。从亚述文明到埃及文明,再到更出名的希腊文明,甲骨文是神向人传达旨意的媒介。中国的《礼记·表记》中记载:“殷人尊神,率民以事神,先鬼而后礼。”已知在殷商时期,国王在处理大小事务之前,都要用甲骨进行占卜,祈问鬼神,事后将所问之事契刻于甲骨上。甲骨文为我们打开了探索未知的大门,指引人类文明了解未来并做出正确决定。

在我们的现代文化中,电脑和科技成为了新的“甲骨文“(甚至有一家大型软件公司采用了同一个名字)。面对日益剧增的数据,人们想要通过洞察数据来预测未来。如今,人们前所未有地想得到“德尔菲神谕”(传说天神阿波罗在德尔菲颁布神谕,预言和指示深刻地影响了希腊世界的文化和历史发展),希望借助它窥见未来世界。

科技公司都争相去满足人类这一古老需求。今天,新的“甲骨文“是人工智能、机器学习和深度学习算法。

相比其他行业而言,人工智能在医疗领域更具吸引力,它在治疗和诊断方面潜力无限。这不是空穴来风——医疗是一个极其宽泛的领域,是随新技术革新而快速变化的复杂学科。因而,和古希腊人寻找德尔菲的智慧一样,我们希望 AI 能帮助我们预测未来,指引我们做出正确的医疗决策。

但是在 AI 和机器学习带来的医疗黄金潮中有一条永恒的法则:无效输入,则无效输出。也就是说,计算机输出结果的质量只取决于输入数据的质量。如果你在偏置数据上来做 AI,显然只能得到偏置结果。

简而概之,在虚假数据或错误数据基础上是无法进行深度学习、机器学习和使用人工智能的。

一个虚假数据导致错误的经典案例是:2015 年的一项研究旨在通过有效的机器学习技术来预测哪些患者会发展肺炎并发症,这项研究适用于大多情况。但是算法犯了一个大错:它的结果指向允许临床医师让某高危哮喘患者出院。原因是医院协议虽然自动将哮喘患者转到重症特别护理病房,但是这些患者却没有被列入系统能够识别的‘需要进一步治疗’的类别,导致非“需要进一步治疗”数据,即出院数据出现误差。

引用 Pedro Domingo 在《大师运算法则》中的一句话:“人们担心计算机太聪明将会占领世界,但事实是它们太愚蠢,不过它们确实已经占领了世界”。

由于许多机构想轻松得到答案,因而导致早期利用AI和机器学习后产生严重后果:“无效输入,有效输出”。正如许多文章指出,当今认知计算和深度学习的前期经验表明,成功稍纵即逝。也就是说,我们太渴望和相信这些新技术能带来神谕,甚至以为光靠技术就可以得到洞察,提升医疗服务,改善收益。

很遗憾,事实却从未如此。

“计算机之父” Charles Babbage 在其 1864 年的《经历哲学家人生》一书中写道“有两次有人和我说,‘Babbage 先生祈祷吧,如果您将错误数字输入机器,没准正确答案也能出来呢?’……我简直无法想象多么混乱的思维才能生出这种想法。”

所以,明智的机构应该怎样利用 AI 和机器学习真正改进医疗呢?对于这些期望撬动新技术的机构,我的建议很简单。

不要创造“新闻发布策略”
外包数据策略或期望不做任何计划,仅靠 AI 就能神奇地解决由未经验证的技术所造成的复杂业务问题,这都是愚蠢的想法。

俗话说船家最快乐的两天是他们买船的日子和他们卖船的日子。为新闻发布而创造的 AI 策略也是如此。第一个新闻发布宣布短期的突破和待解决的问题。接下来,如果还有第二个新闻发布,那就是宣布项目失败关闭。

像新闻发布这样的大肆市场宣传可没时间听充实的策略,也耐不住数据科学的艰苦工作。大肆市场宣传也会将你的 AI 策略和某个厂家捆绑。当你宣布用某个 AI 技术来做项目时,你就倾向于锁定单一解决方案。但是,对 AI 系统的正确理解是:它是另外一整套信息技术基础设施,必须是模块化的,以便组件更新。同样,正确的数据策略是必备的,它可以支持从不同系统中收集并标准化医疗数据,支持在全机构构建、测试、部署机器学习算法。这种办法让机构能够利用行业创新,同时降低机器学习的风险–系统陈旧,并规避了量身定制以及整合系统的成本。

虽然繁复,却也不必要一开始就把它看得难于登天,别提早让自己知难而退。

把 AI 技术看成学生而不是老师
本质上,AI 和机器学习就是复制人类认知及学习能力,只不过更快。假如没有稳固的学习策略,AI 或者机器学习也帮不上忙。这个道理听起来简单,却常被忽视。另一个关键是我们应将这些技术看作虚心的学生并助其成长,它们不是先知,也不是对业务发展无所不知的神谕。

梅奥诊所的首席信息官 Cris Ross 这样描述 AI 的现状:“人工智能仍然很笨,我这么说并不带有贬义……今天最好的人工智能仍然完全依靠所谓的语意模型,也就是理解语言、词与词之间的关系以及词的组成。所以只能给这些模型大量成堆的数据,通过尝试得到具有统计学意义的关联,利用这些关联来获取更多理解。就像一个 2 岁的儿童学习说话、走路、和世界交流一样。就像把手直接放在开着的火炉上,肯定没有好结果——我们当然能理解,但一个 2 岁的儿童也能理解吗?

人工智能不能直接攻克癌症,消除饥饿或者为世界带来和平。它们能做的是让人类更高效地处理并分析正确的数据。要让 AI 能帮上忙,必须对它们进行培训,把它们当作新生儿,为它们学习创造良好的环境。

制定你的数据策略——优质数据无可替代
优质数据无法替代。我们都知道这个永恒的算法法则;GIGO ——垃圾进,垃圾出——我们都得注意。依靠坏数据,AI 并不能输出奇迹般的好结果。正如最近 Forrester 研究所的 John Bruno 谈到 Salesforce 的新 AI “爱因斯坦”的意义时说道,“基于计算分析的销售进程,未来是光明的,但道路是曲折的。

Salesforce 当下及潜在的客户需要注意:智能建议依托于大量高质量的数据。如果进来的数据质量低,得出来的肯定也是欠佳的建议。数据清洗以及建议的反复调参是保持长期成功的关键。

有志于撬动当前科技成果的人一定要知道 AI 是依存于海量数据的。这意味着技术只有在具有足够深层以及定义足够清楚的丰富数据基础上才能应用。

数据为 AI 铺路,要想享受 AI 和机器学习带来的便利,就需要建立一个医疗数据策略——一种实际管理所有数据的方法,是开展任何 AI 或机器学习的尝试的必备基础。在医疗领域,数据策略的建立意味着超越电子医疗档案(EHR)和数据仓库。

只有这样才能保证你的”登月“计划能上发射台。

采取下一步行动

我们希望与您详细沟通,请您填写表格,我们将尽快与您取得联系。
*必须填写的字段
Highlighted fields are required
*必须填写的字段
Highlighted fields are required
** 选择 "是",表示您同意我们就现有及未来InterSystems产品和活动的新闻、更新和其他营销与您联系。此外,您同意将您的业务联系信息输入我们的CRM解决方案,该解决方案托管在美国,但按照适用的数据保护法进行维护。