当业绩报告卡可用时,纽约和宾夕法尼亚的心脏外科医生就会回避高危病人.在即将到来的透明度革命之后,类似的事情会在全国范围内发生吗ProPublica的数据发布?
以两个虚构的整形外科医生为例:医学博士Cherry Picker和医学博士发病率Hunter。
Cherry Picker住在纽约上东区。他的病人在Yelp上给了他很好的评价。他的病人在做任何决定之前都会阅读Yelp上的每一条评论。采樱桃人有一个美丽的家庭。当他微笑时,光从他闪亮的牙齿上折射出来。
切里经常出现在电视上。他为时髦的都市美男子杂志《男人hm》撰稿。切里专门治疗周末勇士队的膝盖受伤。他的病人经常从科罗拉多州、惠斯勒和采尔马特的滑雪场给他打电话。切里擅长他的手艺。但他的病人甚至更擅长手术后恢复。Cherry并没有积极寻找这样的患者。他的病人是根据他的邮政编码、声誉、长长的等候名单和Yelp为他挑选的。
发病率猎人的真名是哈金德·辛格。他从旁遮普移民过来,在北费城的一家安全网医院工作。辛格想在贝弗利山工作,但要将j1签证转换为绿卡,他必须在有需求的领域工作。他一开始工作,就喜欢上了自己的工作。他的女儿们喜欢他们的学校,他的妻子喜欢他们买的房子。辛格没有闪亮的牙齿。他还没有上过电视,尽管他的女儿们取笑他可以扮演桑尼异国情调的万寿菊酒店.
辛格的同事称他为“发病率猎人”,因为他不管病人的病情如何,都要进行手术。他从不说不。他的病人几乎都是肥胖和糖尿病患者。公共卫生学院派学生跟随他学习综合用药。辛格上任后,这家医院开始疯狂招聘住院医生。
他的病人跨越联邦贫困限额,在Yelp上不给他打分。他的病人不用Yelp。即使他们是知情的消费者,他们也不得不选择辛格,因为在那个地区,很少有整形外科医生愿意给他们做手术。他的病人都没听说过樱桃采摘者。他们不滑雪,不跳交际舞,也不跑半程马拉松。
辛格也很擅长他的手艺。准确地说,技术上非常出色。从他病人的再入院率,感染率和深静脉血栓形成率来看,你不会知道这一点。但手术室的工作人员和他的同事都知道这一点,他经常在艰难的手术中帮助他们。就连樱桃也仰慕他。
辛格不是来赚钱的。他挣的钱没有切莉多,但也够了。他做事不是为了荣誉。他的工作是为了职业自豪感——这是一些卫生经济学家无法理解的一个虚无缥缈的概念。
很难打击这位来自旁遮普的壮实小伙子的士气。但数据透明运动实现了这一点。他一直知道,为社会中最生病、最贫穷、最被剥夺公民权的人群做手术是不会赚钱的。但他从来不知道自己会成为这艘船的船长——他很高兴能成为他们整个髋部的船长——但他觉得,他们进入手术室前后发生的一切都不是他的错。
人们开始称辛格为不称职的外科医生。他反对,但他不明白这些数字背后的逻辑。他的并发症发生率是费城最高的。据推测,数字是不会说谎的。这使他难以忍受。他不介意失去CMS扣发的可怜奖金,但原因却让他心碎:他的素质太差。
辛格对那些声称为穷人而失眠的人感到困惑。他们的感情和行动之间的鸿沟使他感到困惑。旁遮普开始比费城更有意义。但后来切里邀请辛格加入他在纽约的诊所。切里向辛格承诺,他可以为技术上有挑战的病人做手术。辛格不情愿地接受了这个提议,这让他的妻子非常兴奋地去皇后区买印度菜。不过,她坚持说辛格必须先去看牙医。
智人一直在寻求救赎。今天是通过数据。数字取代了耶和华和因陀罗。但是,就像古代的神一样,数字可能是多变的、武断的,有时甚至是完全不公平的。毕竟,数字是人类的产物。
我最喜欢的是辛普森的悖论——结论实际上是,而且准确地,与从数据中推断出的相反的。也就是说,当一项研究显示了劣治疗的优越性,反之亦然。
你可以想象旧约中的上帝在亚伯拉罕要献祭以撒的时候大喊:“住手!这是辛普森悖论。现在我知道你敬畏神。把刀放下,慢慢地。艾萨克,答应爸爸你会学会乘法表。”
ProPublica发布的数据是辛普森悖论的一个宝库。这意味着,当数据显示“糟糕的外科医生”时,这个外科医生实际上可能是一个顶级医生——一个有技术天赋的疾病猎手——穷人和病人的最后希望。
难道你不为这个悖论感到好奇和不安吗?这意味着数据可能不仅仅是半真半假,而是彻头彻尾的谎言。我以为我们不会再在塞勒姆焚烧无辜的人了。
这张图表是由分析师John Alan Tucker博士(@JohnTuckerPhD)绘制的,很有启发意义。让我们假设2.5%的并发症率是外科医生的全国基准。让我们假设一个外科医生,足够好,医学博士,在现实中符合标准。如果我们对他最近的35次手术进行抽样,数据显示在《足够好》中并发症发生率为4%的概率——比基准高出60%——接近40%。百分之四十!你能接受市场上新他汀类药物的不确定性吗?外科医生比立普妥更值得牺牲吗?
机会似乎更青睐大批量的外科医生。但不要太兴奋。如果记录“足够好”最近的200次手术,数据显示并发症发生率为4%的几率是15%,而他的真实发生率实际上是2.5%。这虽然没有高达40%,但也很难令人尊敬。
这一数据——塔克将备受吹捧的风险调整纳入其中——也不能让人安心。你可以看到加州髋关节外科医生的并发症发生率在95%的置信区间内。这意味着近乎最差和近乎最好的髋关节外科医生之间的差别可能就像掷骰子一样。当然,这不是真的。外科医生的技术水平各不相同。这些数字不能复制频谱。
这凸显了一个奇怪的伦理问题。如果病人有权知道外科医生的表现,点估计,他们是否应该被告知测量方法的局限性,混杂因素,置信区间——这就像房间里的大象一样大?
不,有人会说,这是信息过载。但是仅仅因为我们认为病人无法处理这些信息就限制我们给他们的信息是有原因的。叫什么来着?是的,家长作风。
我们正处于医学问责制革命的边缘。我们每天都有十几次处在这样或那样的革命边缘。透明运动的未来是光明的。未来的病人需要发病率猎人,MD不是那么好。如果你说旁遮普的哈金德是一个糟糕的外科医生,他不会照顾最贫穷和病重的人——即使是为了绿卡。
Saurabh Jha是一名放射学家,可以通过Twitter联系到他@RogueRad.本文最初发表于卫生保健博客。
图片来源:Shutterstock.com