自然语言处理似乎有点神秘的类型和技术——软件工程师的东西谈论到深夜,但执业医生和病人的用处有限。
然而软件可以“读”医生和护士的笔记可能是数字医学的重要突破之一。展览,从世界医学研究:最近的研究有关使用质子泵抑制剂随后心脏病发作。这是通过将通过1600万年电子健康记录笔记。虽然合法的流行病学协会可以质疑(稍后),这项技术很可能会改变。
让我们先从一个小的背景。
一位伟大的紧张局势在卫生信息技术中心对患者如何记录数据。这是简单的。希波克拉底的时候,医生记录病人的症状在散文。图表,从本质上说,医生的日记。医学史家斯坦利Reiser描述了一个名叫阿波罗Abdera的绅士,生活在公元前5世纪。医师的注意阅读:
有发烧的发作;内部通过几乎任何的食物;尿液是薄和稀疏。没有睡眠。大约14天从他上床,严格之后,他变得热;神志不清,大喊大叫,痛苦,漫无边际,紧随其后的是平静;这个时候昏迷了。
案件往往以严峻的终结。在阿波罗的情况下,上面写着:“三十四天。死亡。”
在接下来的二千年,更多的数据元素被添加:生命体征,体检发现,,最终,血液检查和放射学研究的结果。约定的速记记录这些元素,从“VSS”(生命体征稳定)“没有HSM”(没有肝脾肿大)的小盒组件的基本代谢面板(钠、钾等)记录。
这一切都相当不错,如果经常暧昧地,直到两个主要力量生根。第一个是观众的变化对医生的注意。在过去50年里,随着医学成为大规模的GDP和其质量和安全提出了担心大量的利益相关者成为医生在做什么很感兴趣和思考。床边的这些“陌生人”的标题1991年出版的由哥伦比亚历史学家大卫·罗斯曼)包括政府官员、监管机构、授信人,纳税人,质量措施和事故律师。他们需要判断和价值自然医生的工作集中在医生的注意。
第二个变化,当然,一直是医学数字转换。在过去的七年,由于300亿美元的联邦奖励费,采用电子健康记录飙升从医生的办公室和医院的10%到2008年的大约75%。现在,各方有浓厚的兴趣在医生的报告中不再有筛选潦草涂鸦。很好。但他们真的很想知道一组有限的事实,这可能最有效的是清点迫使医生填写各种模板和检查几十个盒子。
当然,这成为一个即时的冲突来源,因为医生继续培训和社会化2022卡塔尔世界杯预选赛排名认为在故事。但是付款人想知道医生记录至少九审查系统的元素。质量测量器想知道医生戒烟咨询记录。等等。
这些“陌生人”会说,他们试图把医生的文档到人性,干的复选框。事实上,大多数无疑将支持需要的叙述性描述病人的担忧,即使这样的描述是毫无用处的。所有他们需要的目的,许多人会说,是医生记录“还有一件事。”
但几十的累积影响“一件事情”医生变成荣耀(或不)数据输入职员花近一半时间点击框为了满足这些外部团体。,尽管希望迫使医生记录患者信息离散,可分析的数据元素会使注意保鲜储藏格和更容易使用,恰恰相反的发生。今天的笔记是膨胀的,充满了复制&粘贴官样文章,通常作为临床援助一文不值。
一个很受欢迎的,如果贵,一直是解决数据条目的负担抄写员的招聘。好的做远比简单的抄写EHR医生的话。他们检查盒、解释、预测、有时甚至促使医生或患者采取某些行动或回答关键问题。但根本问题是:箱子是否被文士或医生,检查框不能消失,只要所有的“陌生人”需求结构化数据来满足他们的需求。
输入自然语言处理,一个计算机程序的能力去理解人类的语言以书面形式。如果计算机能“读”和理解单词在医生的注意,这种思路,需要所有的复选框会消失。(当然,这是一个简单的,在一个完美的NLP系统仍然需要监控医生和病人的单词和提示都记录关键要素要求的记帐员和质量措施。虽然可能不需要一个叫做“戒烟咨询,记录”复选框如果软件正在寻找它,没有发现它,它需要提示医生通过类似“说”,“我没有听到你提到任何关于吸烟。病人吸烟吗?”)
如果健壮的自然语言处理,嗡嗡作响,会有另一个好处:把医疗记录的机会变成一个巨大的学习的机会。的主题上周的研究。斯坦福大学的调查人员利用先进的语言处理技术搜索1600万(近300万名患者)的证据指出,患者已经服用PPI (PPI;他们用于溃疡和胃灼热,现在规定的第三大药品类别在美国),然后,后来在图表,因为证据表明病人心脏病发作或死于心脏相关并发症。
搜索这些词和概念是比看起来更严格。不难计算机搜索pantoprozole或埃索美拉唑,特别是当它可以看看这些病人的药物名单。但在心脏并发症,软件必须找到心肌梗死,心肌梗死,瑞士法郎,射血分数低,EF < 35%,心绞痛,导管,L主要疾病,等等。然后,它必须确保这些病人开始PPI后并发症发生。那么它必须应对语言骗子否定和家族史:“上个月病人MI”,但“病人的ER和排除MI”和“病人的哥哥MI”。
最后,还有环境的问题。当一个心脏病专家说“抑郁”,她在一次心电图跟踪可能讨论一个偏差,可能预示心脏病。当一个精神病学家说,她可能是指一个情绪障碍。同上心脏病专家的“女士”(二尖瓣狭窄)和神经学家(多发性硬化)。
在之前的工作,斯坦福大学的研究人员证明,他们的软件是准确的,很少这样的问题——欺骗了假阳性和阴性的速度是令人印象深刻的低(89%的准确性;阳性预测值的81%)。在当前的研究中,通过使用这种技术,他们发现使用PPI的历史关联到一个较大的撞击(16%)MI的调整利率,和双重增加心脏相关死亡。
当然,还有各种各样的潜在问题与这种类型的分析。第一,有熟悉的危害的数据挖掘:如果你筛选一个巨大的数据集,你会发现许多协会仅靠机会,特别是如果没有生理合理性的链接,你是比喻扔墙上看到卡的数据。有统计技术为了抵消这一问题;从本质上讲,他们较低的阈值(通常p < 0.05)的接受协会一样真实。
但还有更多。例如,有棘手的问题解决因果关系与联系。也许这些人出现紫色药丸“胃灼热”真的有心绞痛。这将使它看起来PPI的导致心脏病,但事实上他们只是一个标志。
作者努力解决这些局限性,和部分。他们发现PPI-cardiac协会在两个不同的数据集:一个从学术实践设置(斯坦福大学医疗系统),和另一个用户的实践融合门诊EHR系统,主要是用于小型社区实践。他们调整的疾病的严重性,证明没有一个协会之间的使用另一种类型的酸阻滞剂(H2受体阻滞剂)和心脏事件。他们还发现,心脏风险并不取决于患者的抗血小板药物氯吡格雷(之前的研究指着一个质子泵抑制剂药物之间的相互作用和氯吡格雷更高的心脏问题的风险)的机制。最后,还有明显的生物合理性的协会,有一些证据表明质子泵抑制剂可以耗尽血管舒张,一氧化氮。
也就是说,如果我需要反流性食管炎的PPI,我不会停止它独自在本研究的基础上。但是很多人在不应该的质子泵抑制剂。一项研究质子泵抑制剂发现超过一半的门诊病人没有迹象;另一个发现,69%的患者不适当地规定的质子泵抑制剂在出院。一个第三个研究发现,55岁以上的病人从医院出院质子泵抑制剂的应该是短暂的,只有一个人被临床医师指示停止药物在接下来的六个月。斯坦福大学论文提供了一个理由思考开出质子泵抑制剂时,当去制止他们。
但我想强调这项研究的原因远远超出临床内容。自然语言处理已经运用于其他产业,背后是魔法的一部分Siri(当她心情很好)和类似的“智能”语言识别工具和答疑。思考一个病人的世界的电子笔记,回去多年,可以开采关键风险因素或其他历史元素,而不需要限制搜索结构化数据字段,如处方列表或计费记录。(冲突警戒:我是一个顾问公司,QPID健康构建这样的一个工具。)
或想象在一个世界里大数据的方法可以检查的临床记录给定的病人,然后说,“这样的病人在药物比药物B”——一个解析的壮举不是明显比当它说,“什么亚马逊客户和你一样也喜欢这本书。”或想象一个世界里,使用某些药物或其他方法(运动、巧克力、瑜伽等等)可以与正面(更少的癌症)或负面(心脏病发作)通过NLP-aided分析临床结果。使用一个哈利波特的类比,Michael Lauer国家心脏,肺和血液研究所称这种方法“麻瓜世界的魔法。”
现在,大多数病人的数据都存储在数字记录,自然语言的软件可能会允许我们将这些数据转化为可操作的见解。这将是一个受欢迎的但是有些讽刺意味。电脑把我们从我们的世界的叙述笔记,把我们变成越来越受管制的,人性世界的模板和清单。岂不是很可爱的复选框如果电脑能解放我们,让我们回到业务与我们的病人和描述他们的发现,我们的思维,在散文吗?
鲍勃韦希特尔是一个医学教授,加州大学,旧金山。他创造了“hospitalist”一词,是全国领先的专家医疗质量和病人安全。他的作者理解病人的安全,第二版和数字医生:希望、炒作和伤害在医学数字时代的黎明。他博客韦希特尔的世界,这篇文章最初发表。
图片来源:Shutterstock.com