流行病学和公共卫生评论德赢娱乐国际

全文

评论文章
一种估算未测量工作中化学物质浓度的方法

Xuguang (Grant)道*

美国巴尔的摩约翰霍普金斯医学院医学系职业与环境医学部

*通讯作者:徐光(Grant) Tao,美国约翰霍普金斯医学院医学部职业与环境医学部,E-mail: xtao1@jhmi.edu


摘要

在职业流行病学研究中,对未测量工作接触化学物质的估计是一个公认的问题。本文以苯乙烯暴露与缺血性心脏病的病例队列研究为例,描述了一种简单的Z-score方法及其在工作和工厂苯乙烯浓度估算中的应用。这种估算方法假设整个行业中工作的相对暴露程度是相似的,因为与该工作相关的任务是相似的,但个别工厂的实际化学物质水平可能存在总体差异。某一特定工厂中未测量工作的暴露量可以根据该工作在其他工厂的相对暴露水平和同一工厂中测量工作的浓度分布参数来估计。该方法克服了现有非测量作业集中度估算方法的一些缺点。

关键字

接触评估;缺少值;职业;苯乙烯;z分数

介绍

在职业流行病学研究中,测量数据并不总是适用于所有工作。估计伪装污染物暴露,何时没有测量,是职业数据中有公认的问题[1]。The following methods have been used to resolve the problem by investigators: 1) One commonly used method to deal with the problem is to ask industrial hygienists to give each unmeasured job an exposure estimation category or so-called industrial hygienist’s rank (IH rank) based on their knowledge and experience. Exposure categories (high, medium and low) or IH ranks (ranging from 0 to 10) can be used as relative exposure indicators in risk analysis [1-4]. The assumption behind this method is that the relative exposure of a job is similar across the industry because tasks associated with the job are similar. The advantage of this method is that it can provide a relative exposure indicator by job in the analysis. One problem with this method is that it ignores potentially large variations in exposure concentrations for the same job among plants, if different plants are included in the study population. A job ranked at 5 can actually have a higher exposure to a chemical in one plant than the same job in other plants. In other words, a job ranked at 5 in a “dirty” plant could have an actual concentration level which is similar to a job ranked at 8 in a “clean” plant. Risk analysis based on this exposure assessment system would possibly have misclassification problem. 2) If measurement data are used, a common method is to use an average concentration of the pollutant at the same job from other plants as concentration estimation for the unmeasured job. This method also ignores the variations in exposures of the same job among different plants. Utilizing the exposure from other plants for an unmeasured job in a specific plant may also alter the relative orders of all jobs in terms of exposure levels within that plant, since the measurements from other plant could be systematically higher or lower than that in the particular plant. 3) Another method is proportional interpolation [5]. Exposure concentration at an unmeasured job in Plant A is estimated using the exposure concentration of the same job in Plant B multiplying the ratio of the mean concentrations of available measurements in Plant A versus Plant B. The advantage of this method is that it takes the variation of the mean exposure concentrations among different plants into account. The problem is that the distribution parameters of concentrations such as a standard deviation in Plant A are assumed the same as Plant B, which is not true in most circumstances. 4) Another method is deterministic modeling [6-8]. If the significant factors determining the level of exposure can be identified and assessed, a deterministic model can be used to calculate the exposure. The advantage of this method is that it can be used without measurement data. The problem is that the identification and the data collection of these significant determinants are difficult and the result is likely to be less reliable than a measurement based estimation.

本文介绍了一种简单的方法,Z-score法,该方法通过工作和工厂提供未测量工作的苯乙烯和丁二烯浓度(ppm),用于苯乙烯暴露和缺血性心脏病[9]的病例队列研究。该方法的目的是克服上述现有方法的一些缺点,以估计未测量工作的浓度。

z分数的基本概念

让我们从一个简单的例子开始。假设有一个平均值为0.5,标准差(SD)为0.2的分布,我们可以很容易地看出,高于平均值1.5倍SD的点值是0.8。这个例子告诉我们什么?首先,这个例子表明,分布中的任何点值都可以用与均值的差值或距离来表示,这种差值可以用分布的SD的比例来表示。一个分值与SD的某一部分所代表的平均值的差值称为“z分数”或“标准分数”[10,11]。换句话说,z分数是一个距离分布的平均值的度量,该分布的标准偏差标准化。在上面的例子中,1.5是一个均值为0.5,SD为0.2的分布中0.8点值的Z-score。数学上的z分数点值可以通过使用公式a .其次这个例子也显示,鉴于一个分布的均值和SD和z分数点值,我们可以很容易地判断原始点值,使用公式B,这是一个反向的格式公式a。在上面的例子中,例如,当Z-score为1.5,均值为0.5,SD为0.2时,可以很容易地计算出原始点值0.8。因此,只要已知分布的均值和标准差,并能识别出点的相对位置,就可以填充分布中的未知点值。

$ $ Z \ = \ {{X \ - \酒吧X} \ {SD }}..............\ (\) $ $

$$ x \,= \,z \,。\,sd \,+ \,\ bar x .............. \ left(b \右)$$

在哪里

Z:点浓度的Z分数;

X:点浓度值;

X:分布的均值;

SD:分布的标准差。

z分数变换及其反变换的数学是简单而直接的。然而,这种方法的独特之处在于z分数分布的特性。如果将一个分布的所有点值都转化为z分数,则z分数的分布的均值必然为零,标准差必然为1[10,11]。也就是说,Z-score变换将具有不同均值和SDs的分布转换为均值为0,标准差为1的标准分布。更重要的是,尽管z得分,意味着和SDs更有意义的比其他分布,正态分布的常态分布没有必要使用z分数转换创建标准化分布常数的零和一个标准差。z分数变换所做的只是从每个点值减去一个常数,然后除以另一个常数,这样点值的相对顺序是一致的,但比例不同。使这个特性导入,因为总是有一个恒定的z分数分布意味着零和一个标准差,点值的相对顺序是一致的,z分数从不同的分布将会与对方虽然原始点值分布与不同的大小,范围,或者单位没有可比性。换句话说,z分数是原始点值相对位置的标准化指标,因此在其自身分布中相对位置相似的点值将具有相似的z分数。因此,如果点值的相对位置相似,那么它们的z值在不同的分布中是可以互换的。

在估算未测量的工作估算中使用z分数法

根据上面的描述,Z-score方法如何用于估计一个未测量的工作的浓度变得清晰了。为了根据公式B估算工厂中未测量工作的化学浓度,人们必须知道:1)该工厂中化学分布的分布参数,即该化学分布的均值和SD。均值和SD在植物可以估计基于浓度的测量工作在植物假设这些测量工作是一个具有代表性的所有工作在工厂和2)相对暴露指标分布,z分数的测量工作。因为那个工厂的那个工作的浓度没有被测量,所以我们不能得到同一个工厂的那个工作的z分数。然而,基于Z-score的特征,假设该工作在整个行业的相对暴露程度是相似的,因为与该工作相关的任务是相似的,尽管绝对暴露程度可能因工厂而异,但其他工厂相同工作的Z-score应该是相似的。在这种情况下,来自其他工厂的相同工作的z分数可以用作特定工厂工作的z分数。如果该工作的浓度没有在任何一个工厂中测量,z分数不是基于测量,而是作为替代的IH等级,因为IH等级是设计来代表相对暴露的。IH等级的z分数转换是必要的,以使其分布可与基于测量的z分数分布相比较。然而,基于z分数的IH排名的有用性取决于IH排名系统中设计的类别的数量。在使用这种方法时,0-10的排名系统会比高、中、低的排名系统更好。

有一件事需要指出。当一个工作的z分数可从多个信息源获得时,可以计算加权平均z分数。不同信息源的权重,包括测量值和IH等级,应由调查者根据每个信息源的效度和信度确定。然而,如果假设某一工作在整个行业中的相对暴露程度是相似的,因为与该工作相关的任务是相似的,这是正确的,那么该工作来自不同来源的z分数应该是相似的,尽管绝对暴露程度可能因来源而异。

一个应用实例

case-cohort研究苯乙烯曝光和缺血性心脏病(IHD)包括498例死于胆道和sub-cohort大小的两倍,997年,选为15%随机样本总数的男性群体曾经受雇于两丁苯聚合物制造工厂之间1943 - 1982[9]。为了建立苯乙烯暴露与IHD之间的剂量反应关系,病例队列研究的暴露评估任务包括1)对未测量工作的苯乙烯和丁二烯浓度进行估计,以及2)对随时间变化的暴露进行调整。本文所介绍的Z-score方法用于两个任务中的第一个任务,这里仅以第一个任务中未测量工作的苯乙烯估计为例介绍。

虽然不是无节制的工作都需要在这个case-cohort研究估计,我们事先不知道哪些工作将会参与其中,因此我们估计苯乙烯浓度对所有测量和测量工作中总579个工作岗位的工作词典开发这个行业在先前的研究[2 - 4]。这579个工作中的每一个都被分配了一个唯一的工作代码,这是细分代码、工作区域代码、子区域代码和特定工作的职称代码的组合。所有工作都由一组来自行业和学术界的工业卫生专家和工程师审查,以确定工作分类的准确性。然后,这些专家被要求在工作代码列表上对苯乙烯和丁二烯的工作进行从0到10的排序。这些估计是基于这些工程师的个人经验做出的,他们中的大多数人从行业成立之初就在这个行业工作。在579个研究对象的工作经历中,涉及独特工作的实际数量只有166个。

对于来自不同来源的许多工作,例如Niosh,国际合成橡胶生产商等许多工作,以及以前研究的参与植物,收集了测量数据。在先前研究的八种植物中[2-4],只有五种植物提供苯乙烯测量。与苯乙烯测量五个分厂四是美国的工厂,包括涉案的队列研究,植物6和7为了使用所有可用的测量信息的两家工厂,从四个美国工厂的所有测量用于获取关于相对曝光,Z分数的信息,为每项工作。每种植物的可用测量数据用于提供用于将Z分数转移回到基于上述方法的未测量工作的均值和SD。

在计算平均z分数时,测量值的权重z分数是该信息源对该工作的测量值除以所有权重之和。IH等级z分数的权重是1除以所有权重的总和。z分数平均值的所有权重之和是测量次数+ 1。这个加权系统更多地依赖于测量数据而不是IH排名。

工厂中未测量工作的暴露浓度是根据该工作的相对暴露值、该工作的平均暴露Z-score以及该工厂中实测值的实际平均值和SD估计的。实际上,这些估计也是为测量工作做的。然而,在分析中,如果观测到的浓度是可用的,则观测值将超过估计值。估计的浓度仅用于未测量的工作。

评估采取了以下步骤

  1. 用公式A计算每个工厂每个测量工作的苯乙烯浓度Z-score;
  2. 使用公式A计算每个工作的IH等级的Z-score;
  3. 计算每个工厂苯乙烯浓度的平均值和标准差基于工厂中所有测量的工作;
  4. 基于所有工厂的所有z得分和IH排名,计算每个工作的加权平均z得分;
  5. 根据工作的平均z分数和使用公式B的工厂的平均值和标准差计算每个工厂的每个作业的估计浓度。

在这些步骤完成后,每个工厂的所有579个工作都有一个估计浓度。在本文中,很难给出579个工作岗位的估算值。然而,作为一个总结,表1显示了两种植物(植物6和植物7)的测量和估计数据的百分位分布,这两种植物参与了病例队列研究。测量工作的平均值和SDs(植物6为0.153和0.157,植物7为0.290和0.339)以及其他Plant和IH排名的平均Z-score被用来确定每个工作的唯一估计浓度。通过比较它们的百分比、平均值和SDs, 579个工作岗位的估计浓度分布与可用的测量工作岗位的分布相似。在估计数据中浓度的范围比实测数据稍宽。在这两个工厂中,经过测量的工作数量很少。表2通过IH秩和Plant总结了用于计算平均z分数、平均z分数和估计平均苯乙烯浓度的测量数。除了植物6和7,植物1和4的结果也已上市表明尽管平均z得分相同的同样的工作,每个工厂一直保持自己的原始分布与不同手段和SDs浓度的估计浓度。

讨论

这种方法的概念和实施非常简单。然而,在职业流行病学研究中,作为未测量工作的暴露评估替代方案,它可能非常有用。如引言部分所述,该方法克服了现有方法的缺点。它既考虑了工作的相对暴露,又考虑了特定工厂中所有工作的浓度分布。然而,这种方法仍然有局限性。该方法的两个主要假设之一是,在整个行业中,这些工作之间的相对暴露是相似的,因为与这些工作相关的任务是相似的,尽管绝对暴露水平可能是非常不同的。一般来说,这一假设与IH排名系统的假设相同,可能是正确的。这就是为什么IH排名方法在职业流行病学研究中如此流行的原因。然而,在不同的植物中,有可能有些工作的变化与其他工作不成比例。如果假设不成立,错误的分类可能是一个问题。 The other important assumption of this method is that the limited measurements on limited number of jobs in a plant are representative of the concentrations of all jobs in that plant so that the distribution parameters obtained from these limited number of jobs can be applied for all jobs in that plant. This assumption may not be true, 1) if the jobs are not randomly picked or those jobs with higher exposures might be measured more. However, if all plants had the same tendency to select more exposed jobs, would the influence of the issue might not that big, when applying Z-score from other plants for an unmeasured job in a particular plant? This should be investigated further and 2) if the numbers of the measured jobs are too small to obtain stable means and SDs even if the jobs are randomly picked for measurement. In the example of this paper both issues might exist. Anyway, one has to have some measurements in a plant to obtain the distribution parameters so that Z-score can be used to estimate concentrations for unmeasured jobs for that plant. Without any measurements, one cannot use this method. The other issue may rise when only IH rank is available for Z-score calculation. Since IH ranks are categorical, Z-scores of IH ranks are not continuous. For instance, a 0-10 ranking system will only have 11 Z-score values at the best. Sometimes, not all ranking categories are used by the experts as in the example study. For instance, rank 5, 7, and 9 were not assigned to any job (Table 2), so that a possible 11 level ranking system had actually only eight categories in this case. The estimation based on this categorical system would be less precise than that based on measurements.

表1:在两个研究工厂中测定和估计的苯乙烯浓度分布(1976-1985)
* 6号工厂有22个测量岗位,144个测量岗位
†7号工厂有44个测量工作,704个测量

表2:美国四种植物按等级估计的平均浓度(ppm)
*排名内工作平均z分数的平均值
†等级内估计苯乙烯浓度的平均值

需要指出的是,这里介绍的方法是用于横断面浓度的估计。没有考虑浓度随时间的变化。然而,该方法也可用于时间周期浓度的估计,只要有足够的时间维度信息。例如,如果有不同时间段的测量数据,则在[9]不同时间段的浓度估计中使用不同时间段的平均值和SDs。

参考文献
  1. Harvey C, Pearce NE, Crawford-Brown DJ(1996)职业流行病学研究方法。纽约,牛津大学出版社。
  2. (1987)苯乙烯-丁二烯聚合物生产中工人的死亡率。J Occup Med 29: 675-680。[Ref。
  3. Matanoski GM, Santos-Burgoa C, Schwartz L(1990) 1943-1982年苯乙烯-丁二烯聚合物(SBR)制造业工人的死亡率。环境与健康展望86:107- 117。[Ref。
  4. Matanoski GM, Elliott E, Tao X, Francis M, corria - villasenor A, et al.(1997)合成橡胶生产中丁二烯和苯乙烯的暴露与淋巴造血癌。西安理工大学学报837:157-169。[Ref。
  5. 谢德尔,奥尔森,乔根森,劳厄森(1991)暴露信息评估。应用Occup环境Hyg 6: 475-481。[Ref。
  6. Theriault GP, Burgess WA, Di Berardinis LJ, Peters JM(1974)佛蒙特州花岗岩棚内的粉尘暴露。Arch环境卫生28:13- 17。[Ref。
  7. Yu RC, Tan WY, Mathew RM, Andjelkovich DA, Levine RJ(1990)历史暴露定量估计的确定性数学模型。美国工业卫生协会51:194- 201。[Ref。
  8. Macaluso M, Larson R, Delzell E, Sathiakumar N, hovina M, et al.(1996)合成橡胶工业工人中丁二烯、苯乙烯和苯的白血病和累积暴露。毒理学113:190 - 202。[Ref。
  9. (2003)苯乙烯暴露与缺血性心脏病的病例队列研究。Am J流行病学158:988-995。[Ref。
  10. 生物统计学原理:第7章:理论概率分布。Duxbury Thomson Learning, Pacific Grove, CA, USA。[Ref。
  11. 雷雨(1997)卫生服务研究方法:第14章:卫生服务研究中的统计分析。德尔玛出版社和国际汤姆森出版社。奥尔巴尼,纽约,1997年。[Ref。

在这里下载临时PDF

PDF

条信息

文章类型:评论文章

引用:Tao X(2016)一种估算未测量工作中化学物质浓度的方法。J流行病学公共卫生Rev 1(2): doi http://dx.doi。org/10.16966/2471 - 8211.113

版权:©2016 Tao x。这是一篇开放获取的文章,在知识共享署名许可协议的条款下发布,该协议允许在任何媒体上无限制地使用、发布和复制,前提是要注明原作者和来源。

出版的历史:

  • 收到日期:2016年12月22日

  • 接受日期:2016年2月26日

  • 发表日期:2016年3月1日