流行病学和公共卫生评论德赢娱乐国际

全文

研究文章
一种快速估计低风险人群子集中隐藏风险的方法

Xuguang (Grant)道

美国巴尔的摩约翰霍普金斯医学院医学系职业与环境医学部

*通讯作者:徐光(Grant) Tao,美国约翰霍普金斯医学院医学部职业与环境医学部,E-mail: xtao1@jhmi.edu


摘要

本文提出了一种简单的筛选方法,用于在总体风险较低的人群子集中检测可能隐藏的高风险。使用该方法的一个示例,未知标准死亡率(SMR)考虑到研究人群中某一疾病子集的比例和SMR,可以预测该疾病子集中该疾病的置信区间。为估计SMR计算的置信区间可用于判断该子集中可能存在的风险是否在desired显著性水平。该方法可能是一个有用的工具,用于建议是否在无风险或低风险人群的子集中隐藏统计上可检测的高风险疾病,需要进一步研究。

关键词

健康的工人效果;方法;,阶梯短环到超级扁环相对风险;风险筛查

介绍

标准死亡率(Standard Mortality Ratio, SMR)分析在职业流行病学队列研究中非常流行,在该研究中,观察到的死亡与基于美国一般人群[1]死亡率的预期死亡进行比较。它的优点之一是,在计算平均寿命时,只需要汇总的信息,如疾病总死亡人数和人口总体年龄分布。换句话说,个人级别的信息是不必要的,尽管有时他们的数据也是可用的。在对总体风险较低的研究人群进行SMR分析后,有一个经常被问到的问题。是否有可能在研究人群中存在高风险子集,仅仅是因为当把所有研究人群合并在一起时,子集中的高风险被稀释了,或者是因为所谓的健康工作者效应?我们是否会错过在研究人群中暴露于危险因子的子集中出现的任何风险在那个子集中我们可能错过的最大风险是什么?如果我们在期望的显著性水平上对子集做进一步的研究,风险是否在统计上可检测?为了回答这些问题,人们通常需要收集更多关于子集甚至个体水平的暴露信息,泊松回归或Cox比例风险模型可以用来进行内部比较。然而,在研究人员收集更多信息并进行进一步分析之前,是否有方法进行可行性筛选试验,以基于有限的数据预测子集中的最大风险,以及这种风险在统计上是否可检测到?为了做到这一点,本文提出了一种简单的筛查方法,可以帮助研究者系统地决定是否需要进一步研究,即使研究总人群中没有显著的疾病风险。 An example will be given to show the application of the method used based on a published paper [2].

方法

这种筛选方法应该包括两个任务。第一个任务是预测最大隐藏风险,第二个任务是估计风险的置信区间。

一般概念

如果已知研究人群患某种疾病的风险较低,则研究人群中某一亚群的患病风险由该亚群在研究人群中的比例和其余研究人群的风险决定。通过假设其余人群的风险处于零风险水平,可以估计子集的最大隐藏风险。如果估计的95%置信区间的隐藏下界大于1,则表明即使在整个研究人群中没有发现显著的风险,但在子集中可能存在可检测的隐藏风险。

假设

与外部标准相比,风险无显著升高的人群中识别潜在高风险亚群的程序依赖于以下假设:1)假设选择子集之外的其余人群没有额外的风险,即相对风险等于1或标准死亡率(SMR)等于100%。如果认为健康工人的影响是一个问题,则假设一种疾病对其余人群的SMR等于研究人群中所有死因的SMR。假设所有原因的死亡率为特定原因相对风险的空值,这是一种被广泛接受的做法,以纠正健康工作者的影响[3-7]。2)为简便起见,假设年龄等混杂因素在子集和总体中是均匀分布的。3)假设利害关系引起的死亡服从泊松分布,这是一个被广泛接受的假设[8]。

估计子集中最大隐藏SMR

为了得到子集的估计SMR,我们需要得到一个疾病的估计病例数和一个疾病的预期病例数。基于假设,下列公式成立:

$ $ {{\ rm {E}} _ {{\ rm{子集}}}}{\ rm { = }}\,{\ rm {p}} {\ rm{。}} \, {{\ rm {E}} _ {{\ rm{总}}}}{\ rm { }}..............\左(1 \右){\rm{}}$$

$ $ {{\ rm {E}} _ {{\ rm {nonsubset}}}} {\ rm{=}} \ \离开({1 - p} \右){\ rm {}} {\ rm{。}}\,{{\ rm {E}} _ {{\ rm{总}}}}$ $

$ $ {{\ rm {E}} _ {{\ rm{总}}}}\,rm {= p}} {\ \, {\ rm{。}} {{\ rm {E}} _ {{\ rm{总}}}}\,rm结构为{+}}{\ \离开({1 - p} \) \, {\ rm{。}} {{\ rm {E}} _ {{\ rm{总}}}}$ $

$${\rm{N}}}}{{\rm{subset}}}}}}}、{\rm{=}}{{\rm{N}}}}}{{\rm{total}}}}}}、-{\rm{SM}{\rm{R}}}}}{{\rm nonsubset}}}}}}、{\rm$$

{{{{{{{{{{{{{{{{{{{{{{{}}}}{{{}{{{{{{{{{{{{{{{{{{}}}}}}{{{{{{{{{{{{}}}}}{{{{{{}}}}}}}}{{{{{{{{{{{{{}}}}}}{{{{{{{{{{{{{}}}}}}}}}}}}}}}{{{{{{{{{{{{{{{}}}}}}}}}}{{{{{{{{{{{{{}}}}}}}}}}}}}}}}}}}}}{{{{{{{{{{{{{{{{{{{{}}}}}}}}}}}}}}}}}}}}}}}}}}}}}{{\rm{E}}{{\rm{total}}{\rm{}}……….\左(2 \右)$$

$${\rm{SM}}{{\rm{R}}}{{{\rm{subset}}}}}\,{\rm{{{N}}}{{\rm{N}}}}{{\rm{subset}}}}\,{\rm{/}{\rm E}}}{\rm E}}}{{\rm subset}}}{{{\rm 3}{$$

在那里,

E子集:一种疾病亚群的预期病例数

p:整个人口子集的比例

Etotal:整个人群中的预期病例数

Enonsubset:一种疾病在非亚群人群中的预期病例数

N子集:某一疾病子集的估计病例数

N总计:在整个人群中观察到的疾病病例数

SMRnonsubset:某一疾病亚群以外的其余人群的SMR

SMR子集:亚群疾病的估计SMR

公式(1)将用于计算亚群人群的一种疾病的预期病例数,公式(2)将用于计算亚群人群的一种疾病的估计最大病例数。因为p是总体子集的比例,E总计,已知某一疾病在整个人群中的预期病例数为E子集,公式1中某一疾病子集的预期病例数可以很容易地解决。式(2)中,E总计,为整个人群中疾病数量的预期病例数,N总计,即已知某一疾病在整个人口中观察到的病例数,以及p,即整个人口子集所占的比例。唯一未知的项是smrnon子集,即某一疾病对该子集以外的其余人群的SMR。基于假设(1),假设子集之外的其余人群的疾病风险处于零水平。如果健康工人的影响被认为是一个问题,则假设整个研究人群中所有死亡原因的SMR为零水平。有了这个假设,N子集,可以计算出子集的疾病估计病例数。最后,SMR子集,估计的子集疾病的SMR,可由式(3)计算。

图1显示了给定疾病总体(SMR)中观察到的SMR的子集中的最大SMR总计),子集的比例(p),并假设剩余总体的SMR (SMR .)nonsubset等于1。例如,当总体人口的SMR与外部比较时,占总数14%的子集的SMR最高可达3,而其余人口的SMR为1,如图1所示。

图1:估计最大隐子集SMR与总体SMR和子集比例假设其余总体SMR为1。

表1:样本数据的最大子集smr估计值和95%置信区间
子集的估计病例使用公式(1)计算。子集的预期病例使用公式(2)计算。SMR子集使用公式(3)计算。子集SMR的95%置信区间使用公式(4)计算。

子集SMR估计的置信区间

Breslow和Day提出了一种基于Poisson假设的计算SMR[9]的95%置信区间(95% CI)的方法,公式(4)和(5),当病例数大于50时,SMR的95% CI也可以用公式(6)计算

在那里,

SMRl:亚群中某一疾病SMR的下界;

SMRu:亚群中某一疾病SMR的上边界;

SMR:亚群疾病的SMR;

Z:正态分布Z值;

α: 95% CI 0.05显著性水平;

D:预计病例数。

一个例子

以下数据来自已发表的职业人群[2]的队列研究。这里的例子包括九种不同预期死亡人数及其smr风险的疾病。5种疾病(包括所有死亡原因)的标准死亡率高于1,7种疾病(包括所有死亡原因)的标准死亡率低于1。与美国普通人群相比,没有一个smr显著高于1。问题是,“我们会不会错过某个工人子集的任何风险?”例如,大约14%的研究人群接触到某种工业过程,“其他化学制浆”,化学制浆除了硫酸盐和亚硫酸盐制浆。实际上,子集可以用任何定义来定义,比如一组接触到某种产品、工作区域或一组化学品的工人。根据目前的数据,我们能否找出占人口14%的子集中是否存在潜在的风险?子集中可能隐藏的最大smr及其置信区间的计算方法假设其余人群中的风险为零值等于所有死亡原因0.74,如表1所示。结果表明,一个子集,是研究人口的14%,可能会统计所有肿瘤检测隐藏的风险(:阶梯短环到超级扁环1.31,95%置信区间CI: 1.17, 1.47),肺癌(:阶梯短环到超级扁环1.24,95%置信区间CI: 1.02, 1.50),前列腺癌(:阶梯短环到超级扁环2.31,95%置信区间CI: 1.40, 3.78),肾癌(:阶梯短环到超级扁环2.81,95%置信区间CI: 1.19, 6.30),和白血病(:阶梯短环到超级扁环 2.24, 95% CI: 1.09, 4.47), if internal comparisons are used in the further analysis, since the all cause of death for the entire study population is assumed as a null risk value in the calculations. The risks in a subset of 14% of the population for stomach cancer, testis cancer, brain cancer, lymphosarcoma, and Hodgkin’s disease, would not be statistically detectable.

讨论

所提出的分析方法简单明了。这些方法将帮助研究人员决定是否需要进行进一步的研究,并可能在人群中某一疾病的总体风险不显著高的情况下,在某个子集中发现显著风险。与其放弃一项仅仅基于整个队列研究的调查,不如使用“散弹枪”调查方法来筛查人群中的子集可能会有所帮助。

在Matanoski博士的论文[2]中,泊松回归分析了暴露于不同制浆工艺的工人群体的风险,使用了内部比较组。疾病中被预测可能的子集的统计检测风险使用筛选方法在表1中,相对风险基于泊松回归的结果在上一篇文章[2]为1.14(95%置信区间:1.04—-1.26)为所有肿瘤与其他化学制浆过程和1.35(95%置信区间CI:1.04, 1.75),这与预测水平非常一致。在被预测为在统计上没有可检测风险的疾病组中,除了脑癌,没有人在泊松回归分析中显示出任何显著的风险。使用该方法,在表1中对脑癌的预测最大SMR为2.17 (95% CI: 0.96, 4.67),尽管不显著。95% CI的下限实际上接近1。泊松回归结果显示,“其他化学制浆”的相对风险为2.33 (95% CI: 1.38, 3.93)。这种差异可能是由于违反了其中一个假设。例如,总体剩余部分的风险可能低于假定的空值。

如果存在健康工人效应,则假定除计算中的子集之外的其余人群的疾病零风险值等于所有死亡原因的风险。健康工人效应是与一般人群相比,观察到的工人死亡率下降,这是由于各种选择b偏差和工作对健康的有益影响。选择偏差的来源可能来自雇主选择健康个体就业,或通过自我选择,以及由于健康个体继续就业而导致的不完全跟进,以及患病者离职的倾向[1,10,11]。工作对健康的有益影响可能来自体力消耗和获得更好医疗护理的能力等[10].健康工人效应在职业流行病学研究中非常常见,与普通人群相比,这往往会使工业工作人群的死亡率相对风险下降约10-30%,低于零值[10]。工业工作人口中疾病的相对风险是工业危害(如果存在)的向上影响和健康工人效应的向下影响的综合结果。由于总体相对风险远低于一般人群,因此工业危害的真正向上影响可能会因e健康工作者效应的向下影响。本文提出的方法允许用户通过假设剩余人群的相关疾病风险的空值等于平均全死因,来纠正健康工作者效应,因为这是一种广泛接受的纠正健康工作者效应的做法工人效应[3-7]。

参考文献
  1. Monson RR(1981)关于健康工人效应的观察。《职业医学杂志》28:425-433。[Ref。
  2. Matanoski GM, Kanchanaraksa S, Lees PS, Tao XG, Royall R et al.(1998)纸浆和造纸厂工人死亡率的全行业研究。美国医学杂志33:354-65。(Ref。
  3. 死亡率比值比、比例死亡率和健康工人效应。美国医学杂志14:345-353。(Ref。
  4. Park AM, Maizlish NA, Punnett L, moore - eraso R, Silverstein MA (1991) pmr和smr作为职业死亡率估算值的比较。流行病学2:49-59。(Ref。
  5. 黄澳,解耦P(1982)职业研究中涉及标准化死亡率和比例死亡率的方法学问题。《职业医学杂志》24:299-304。(Ref。
  6. Wong O,Morgan RW,Kheifets L,Karson SR(1985)在一组可能接触柴油废气排放的工会成员中对SMR,PMR和PCMR进行比较。Br J Ind Med 42:449-460[Ref。
  7. (1)比例死亡率分析的效用。J Chron Dis 31: 15-22。(Ref。
  8. Beaumont JJ, Breslow NE(1981)氯乙烯工人流行病学研究中的权力考虑。Am J流行病学114:725-34。(Ref。
  9. Breslow NE, Day NE(1987)《癌症研究统计方法的比率和比率标准化》。第二卷:队列研究的设计和分析。Ed Breslow NE和Day NE,国际癌症研究机构,里昂。(Ref。
  10. Choi BCK(1992)健康工作者效应的定义、来源、量级、效应修正因子和降低策略。职业医学34期:979-988。(Ref。
  11. Arrighi HM, Hertz-Piccotto I(1994)卫生工作者幸存者效应概念的演变。流行病学5:189 - 196。(Ref。
  12. Carpenter LM(1987)关于健康工人效应的一些观察。医学杂志44:289-291。(Ref。
  13. Fox AJ, Collier PF(1976)由于行业中工作和生存的选择,工业队列研究中的低死亡率。Br J Prev Soc Med 30: 225-230。(Ref。
  14. McMichael AJ(1976)标准化死亡率和“卫生工作者效应”:表面下的抓挠。职业医学杂志18:165-168[Ref。

在此下载临时PDF

PDF

条信息

文章类型:研究文章

引用:Tao X(2016)一种快速估计低风险人群子集中隐藏风险的方法。J流行病学公共卫生Rev 1(2): doi http://dx.doi.org/10.16966/2471-8211.108

版权:©2016 Tao X这是一篇开放获取的文章,根据创作共用署名许可协议发布,该协议允许在任何媒体上无限制地使用、发布和复制,前提是注明原作者和来源。

出版的历史:

  • 收到日期:2015年12月22日

  • 接受日期:2016年1月20日

  • 发表日期:2016年1月27日