全文共3162字,预计学习时长10分钟

为什么要叫做新型冠状病毒(为什么冠状病毒的死亡率具有误导性)(1)

来源:gucheng

冠状病毒或“2019新型冠状病毒肺炎”(COVID-19)是一种引起呼吸道疾病的新型病毒,目前正在世界肆虐。

尽管媒体对于新型冠状病毒做了似乎无穷无尽的报道,许多问题仍未得到解答。确诊病例真的只有目前这么多吗,还是这个数字缩水了?是否还有未报道的死亡人数?病毒每天的传播速度有多快?它有多危险?为了精准评估它所带来的危险,计算死亡率是很有必要的。虽然病毒传播速度很快,但是如果人们感染病毒后没有死亡,这就不算是一个大威胁。

目前,死亡率的计算方法是不正确且具有误导性的。截至目前,死亡率是由死亡人数除以感染人数计算得到的。下图显示了自1月22日以来湖北省具有一定“误导性”的死亡率。基于这种计算,目前的死亡率被确定在2.5%左右。然而,这种计算方法是不正确的,因其没有考虑到一个非常重要的因素:滞后效应。

为什么要叫做新型冠状病毒(为什么冠状病毒的死亡率具有误导性)(2)

什么是滞后效应?

假设2020年1月10日有100人感觉不适。对该群体进行一段时间的跟踪。其中一些人在几天后病情加重。一些人康复了,而另一些人仍然患病。如果从现在开始把时间快进一年,就能精确地知道这个群体的死亡人数。其中大多数患者已经康复,其余人则已经死亡。此时,可以按照死亡人数除以最初感染人数来计算该群体的死亡率。例如,可使用这种方法来计算2002年中国爆发SARS病毒时的死亡率,因为当初感染SARS病毒的人要么已经康复要么已经死亡。但COVID-19目前还在流行,因此使用这种算法是不对的。

在不同感染阶段有不同的感染群体。例如,昨天刚刚感染的几千人不会在今天死亡;而今天的死亡人数来自更早感染的群体。因此,用死亡人数除以感染人数的算法是完全错误的。正确方式应该是分别跟踪每个群体,计算每个群体的死亡率。当然,当疫情完全结束后,两种方法便殊途同归了。然而,目前疫情仍在继续,因此这种方法并不适用。相比之下,这种方法适用于在当前计算SARS病毒的死亡率。

下面是描述此次疫情的图表:

为什么要叫做新型冠状病毒(为什么冠状病毒的死亡率具有误导性)(3)

X轴是群体成员的感染天数(他们在同一天被感染),Y轴是该群体成员的累计死亡率(死亡人数/感染人数)。

据报道,出现症状之前会有2-14天的潜伏期,而从出现症状距死亡可能还有大约几周时间。因此,不论群体人员是否被感染,感染程度如何,在最初几天的死亡率可能为零。

为了阐释清楚,来看两组不同的群体。一组是来自武汉的25岁男性(以2%的死亡率且在14天内达到顶峰为模型),另一组是80岁男性(以5%的死亡率且在7天内达到顶峰为模型)。可以假定后者疫情发展更为迅速,比前者更早达到更高的高度,且更早进入平原期。这意味着,80岁群体由于其普遍更低的免疫力和更差的健康状况,死亡人数更多,速度更快。这同样适用于心脏病、糖尿病等疾病患者以及长期吸烟者。除了此类因素(老年人和年轻人已经被证明更易患病),群体曲线还会随着国家、财富等因素差异而变化。

所以,为什么不能按照群体计算死亡率呢?

这个想法在理论上似乎很简单:找到每天的感染人数,按照群体级别进行跟踪即可得到死亡率。但实际操作起来有一定的困难。这里列举一些挑战。

1、感染日期:由于潜伏期不同且不定,很难确定感染日期。此外,不同人群的发病症状不同,对每个出现如发烧或咳嗽等症状的人进行统计是非常耗时的。因为感染COVID-19后的症状不明确,模棱两可的症状如咳嗽等很可能只是流感或一般感冒的症状。

2、#/感染人数:可能有很多人没有接受过检测,但携带有不明病毒。更有甚者,在感染后没有发病症状。现在,由于武汉正在隔离,统计稍微容易了一些。

3、死亡时间:因为人们出现发病症状的时间不同,即使在同一天感染的人群,其报告日期也可能不同,因此不能确定人群从感染到死亡要经历多长时间。

4、死亡风险因年龄和健康状况等而异:病人和老年人比健康人的身体脆弱得多。如果每个感染人群中不同风险组的比例改变,那么死亡率也会发生变化。

5、死亡风险因地而异:对于任何快速传播的传染病,由于病毒传播迅速,感染了不同地区的不同人群,决定死亡率的样本选取会存在偏差。迄今为止,死亡率主要来自1月份在武汉感染冠状病毒的患者。当病毒传播到不同地方,死亡率本质上是不同的,因此对地方所构成的威胁必须具有代表性,以便采取充分的预防措施。例如,由于人们的免疫力/健康、公共卫生、医疗服务等因素,冠状病毒对索马里所构成的威胁将远高于瑞士。因此,为对威胁做出精准的评估,死亡率应该以群体为单位表示。

理想情况下,应该如何解决该问题?

我们需要更多群体级别上的细分数据以建立死亡率模型。不幸的是,这些数据似乎并不能得到。

三角图是按群体计算死亡率的正确方式。需要为尽可能同质的群体构建三角图,以确保某些成员不会影响死亡率的准确性。需要关注的正确的细分领域包括年龄、高危医疗群体和国家。通过这些,可以最精准地估算出每个群体的死亡率。

以下是死亡率的三角图示例。

为什么要叫做新型冠状病毒(为什么冠状病毒的死亡率具有误导性)(4)

图中,最顶行指较年老的群体,最底行指较年轻的群体。每一列代表感染天数,方块里的数字指该群体的累计死亡人数。从右到左浏览对角的方块,可得到同一天每个群体的死亡人数。

为建立死亡人数模型,做出以下两个假设:

1)所有群体都是5%的死亡率。

2)若感染者死亡,死亡时间将在7天之内。所有数据只来自湖北省。

为什么要叫做新型冠状病毒(为什么冠状病毒的死亡率具有误导性)(5)

可以立即看到最高处和最低处之间从冷到暖的变化。这意味着,年老群体最初感染规模较小,而年轻群体较大,表明了COVID-19的传播。(见上图)

尽管这些信息能够描绘出疫情的大致面貌,阐明COVID-19传播的基本性质,但该模型依然有几个缺点。首先,不是所有信息都能被获取,因此整行没有数据。可能有不明的死亡人数,尤其是在疫情中心的武汉。很大程度上可能低估了被感染人数。从感染到死亡的时间长短不明。老人和年轻人、健康人和病人等的混合情况不明。尽管有这些缺陷,这个模型仍具有一定说明性。

以下是表明数据严重错误的一些初步分析。

接下来,使用模型(5%的死亡率和7天的感染-死亡时间)来比较湖北省的预测死亡人数和实际死亡人数。

为什么要叫做新型冠状病毒(为什么冠状病毒的死亡率具有误导性)(6)

上图对假定死亡率和死亡时间的模型所得出的累计死亡人数与北京报道的死亡人数进行比较。可以看出,该模型与当前的数字十分接近。然而,考虑到除了死亡时间和死亡率之外还有大量影响因素,并不能完全确定真实的数字是多少。这里是一些重要看法:

Ÿ 如果感染人数如实,那么死亡率很可能远高于2.5%,并接近5%甚至更高。

Ÿ 如果死亡时间超过7天,那么死亡率将远超过5%,并接近10%甚至更高。

Ÿ 如果感染人数大幅增加,那么死亡率可能大幅减小(甚至跌至1%)。

应该注意,通过改变一些参数,可以有多种方式来得到相同的死亡人数。不管怎样,数据很可能存在严重错误(即存在更多的被感染者),或者我们可能面临着严重的危机(死亡率>5%)。

小结:

Ÿ 目前计算COVID-19死亡率的方法是有本质缺陷的,因为它没有考虑滞后效应。

Ÿ 文中展示了一种新的(基于群体的)死亡率计算方法。

Ÿ 使用特定参数(5%的死亡率和7天的死亡天数)的模型与实际数据高度吻合。

Ÿ 要么死亡率高于预期,要么感染者数量远高于报道人数。

为什么要叫做新型冠状病毒(为什么冠状病毒的死亡率具有误导性)(7)

图源:约翰霍普金斯医学院

希望世界疫情能得到有效治理。

为什么要叫做新型冠状病毒(为什么冠状病毒的死亡率具有误导性)(8)

留言点赞关注

我们一起分享AI学习与发展的干货

如转载,请后台留言,遵守转载规范

,