국제원자력기구(IAEA) 방사선 응급상황 대응 번역

 

국제원자력기구(IAEA) 방사선 응급상황 대응 번역에 대해서 알아 보겠습니다(영어번역)

 

국제원자력기구(IAEA) 방사선 응급상황 대응 번역

국제원자력기구(IAEA) 방사선 응급상황 대응 번역(영어 원본)

VI-2. STATISTICAL DISTRIBUTIONS
There are several forms and classes of distributions that can be used to model the probability of occurrence of events. The type of distribution chosen is very important for accurate data analysis, and several models have been proposed and implemented in assessment of cytogenetic data. A selection of the most commonly
VI-2.1. The Poisson distribution
The Poisson is a discrete probability distribution which expresses the probability of occurrence of rare random events. The Poisson distribution is by far the most widely recognized and commonly used type of distribution for cytogenetic data analysis. Chromosome aberration data are usually fairly small in number, and Edwards et al. showed that it is much more realistic to assume that chromosome aberrations follow the Poisson distribution than the Normal distribution [4]. Merkle showed that Poisson-based goodness of fit tests, including the χ2, variance and u-test that are all discussed in this publication, were shown to be applicable for cytogenetic data, particularly in the case of large sample sizes [5]. For curve fitting, regression analysis has been shown to be applicable for Poisson data. The resulting forms of maximum 197 likelihood [6] and/or weighted least squares [7] fitting are now almost universally used for creating dose based calibration curves for chromosome aberrations, such as dicentrics or micronuclei.
VI-2.2. Binomial distribution.
The binomial distribution is a discrete probability distribution which describes the probability of the number of successful outcomes from a sequence of independent experiments, each with one of two possible outcomes. In each case, if outcome 1 has an associated level of probability of p, outcome 2 will have probability 1 – p. In cytogenetics, a good example of a set of data that can be modelled with this distribution is counting numbers of damaged cells, where the two ‘binomial’ outcomes are a cell is either damaged, or intact. Indeed, the binomial distribution is often used to calculate standard errors associated with yields of damaged cells. VI-2.3. The mixed Poisson model Sasaki [8] presented a method of analysis for chromosome aberration data, in an attempt to deal with the problems of inappropriate estimation of average dose which result from inhomogeneity. The cell population consists of a mix of sub populations, each exposed to a different dose, causing a different amount of damage. The distribution of chromosome damage in cells can therefore be expressed in terms of a mixed Poisson distribution, and ‘unfolding’ of this creates a dose distribution profile. The model was demonstrated to provide adequate fits for the linear-quadratic dose response for simulated and real data.
VI-2.4. The negative binomial distribution
Like the Poisson distribution, the negative binomial distribution is a discrete probability distribution, however the negative binomial has an additional parameter which can be used to represent overdispersion. As the overdispersion parameter tends to 0, the negative binomial tends to Poisson [9]. The negative binomial distribution has been used by several authors in place of the Poisson, for example in a 2008 study of frequency of translocations in airline pilots [10].
VI-2.5. The Neyman type-A distribution
The Neyman distribution was first proposed in 1939 by Neyman, who introduced this new class of distribution to be used to test the difference between means of two samples with different variances. This is in contrast to other standard test such as the z-test and t-test, for example, which are based on normally distributed data with known and unknown population standard deviations respectively, and for which variance must be similar if not identical. The Neyman type-A distribution tends towards the generalized Poisson distribution with increasing sample size [11]. In 2008, Morand et al. published a technical note describing the NETA computer program, which can be used to calculate the 95% confidence limits of Neyman type A distributed events [12]. Morand and colleagues found that the confidence limits calculated using the Neyman distribution were smaller than those calculated using the traditional Poissonbased method for low sample sizes (numbers of cells) [12].
VI-2.6. Other distributions
The Beta distribution defines a family of continuous probability distributions, which are defined on the interval 0–1 by two shape parameters, usually referred to as α and β. The Dirichlet distributions are an extension of the Beta distribution for multiple (>2 parameters). Stiratelli et al. [13] compared the Poisson and Binomal distributions for chemically induced chromosome damage with the beta-binomial, negative-binomial and correlated-binomial distributions. In contrast to the Poisson and simple Binomial distributions, these models do not rely on independence of cellular response. The authors found that all the Beta distribution based 198 models showed improved fits with respect to the Poisson and Binomial models (as tested by the χ2 test). The Beta-binomial model provided the best fit with respect to the author’s data set [13].
The log-normal distribution was formally described by Aitchison and Shen in 1980. Logistic transformation of a d-dimensional normal distribution produces a log-normal distribution over the d-dimensional simplex. This distribution can be applied in statistical diagnosis where classification of the basic cases is subject to uncertainty, such as chromosomal aberration data. The authors give examples of usage, for instance in the direct statistical description and analysis of compositional and probabilistic data and also as a substitute for the Dirichlet conjugate prior class in the analysis of multinomial and contingency table data [14].
VI-3. A ROUTINE FOR FITTING DOSE RESPONSE CURVES
Curve fitting software has been described in Section 8.3. In this Annex a worked example is presented using one of the software options, the R-based tool, applied to the 60Co data shown in Table 4. Whereas CABAS and Dose Estimate are available as ready-to-use packages, the R procedure needs a routine to be written by a mathematician. The required routine has been composed (by H. Braselmann) and is presented here in Box 1 in full because it has not been published elsewhere. The routine has four parts. The first is used to input the observed data i.e., doses, numbers of aberrations, number of cells scored and the distribution index (disp). For this index there are two options; either to use a constant value for every dose point or to ascribe a separate value to each dose. In the worked example a constant value of 1.0 is used. The alternative, which is also shown, would be to use the individual σ2/y values shown in Table 4. (Note that all lines in the routine starting with a ‘#’ symbol are for information only and will not run). The next part is for entering optimal settings; i) the sigma correlation coefficient, for which it is recommended to use the value 1 or else to estimate this coefficient; ii) the required weight and; iii) the function that one wishes to fit. For this, enter either ‘l’ for a linear fit or ‘lq’ for linear quadratic. The remaining two parts of the routine should only be modified by developers of the script. If one wishes to fit data to the linear dose response function, the data that would be entered using the 3He data in Table 4 are shown beneath Box 1. Thereafter the routine is identical to that shown in Box 1. To run the routine one should download the R programme from the internet site (see Section 8.3). Using a PDF version of this publication, copy and paste directly into a word processor software the routine shown in Box 1. Replace the 60Co worked example input data with your own data and select your desired options such a ‘l’ or ‘lq’. With the R programme on your screen, paste in the routine after the symbol >. The output is shown in Box 2 where x0, x1 and x2 are, respectively, the C, α and β coefficients as shown in Eq. (2) together with their standard errors. The z value is a test of the significance of each coefficient with its probability (Pr). Also shown are the variance and
covariance values for each coefficient. It may be noted that the values of the coefficients are identical to those shown in Table 5 and the variance / covariance values with those shown in Section 9.7.3. The R output also presents the data points and the fitted curve as a graph (Fig. VI-1).

국제원자력기구(IAEA) 방사선 응급상황 대응 번역(한국어 번역본)

Ⅵ-2. 통계적 분포
사건의 발생 확률을 모델링하는데 이용할 수 있는 분포의 형태와 종류에는 몇 가지가 있다. 선정된 분포의 유형은 정확한 데이터 분석을 위해 매우 중요하며, 세포유전학 데이터를 평가할 수 있는 몇몇 모델들이 제안되고 실행되었다. 가장 일반적으로 이용되는 모델의 유형과 방사선 세포유전학에 적용 가능한지는 아래에서 논한다.
Ⅵ-2.1. 포아송 분포
포아송은 임의의 희귀 사건이 발생할 확률을 표시하는 이산확률분포이다. 포아송 분포는 세포유전학적 데이터 분석에 일반적으로 이용되고, 가장 광범위하게 용인되는 유형의 분포이다. 염색체 이상 데이터는 일반적으로 그 수가 상당히 적으며, Edward et al.은 염색체 이상이 정규분포가 아니라 포아송 분포를 따른다고 가정하는 것이 보다 현실적임을 입증하였다 [4]. Merkle은 본 저서에서 다룬 χ2, 분산, u-테스트를 포함해 포아송 기반 적합성 검증이 세포유전 데이터 특히, 표본의 크기가 대규모인 경우에 적합하다는 것을 입증하였다 [5]. 곡선 맞춤의 경우에는 회귀분석이 포아송 데이터에 적합한 것으로 입증되었다. 현재 최대우도 [6]의 결과 형태 및/또는 가중 최소 자승 [7] 맞춤은 이동원체나 소핵과 같은 염색체 이상과 관련된 선량 기반 보정 곡선을 작성하는데 거의 일반적으로 이용되고 있다.
Ⅵ-2.2. 이항분포
이항분포는 두 개의 있을 수 있는 결과 중 하나마다 독립적인 실험의 시퀀스로부터 성공적인 결과의 수가 도출될 확률을 나타내는 이산확률분포이다. 각각의 경우에 만일 결과 1이 p의 확률과 관련이 있는 수준이라면, 결과 2는 확률 1-p를 갖게 될 것이다. 세포유전학에서 이 분포에 따라 모델링할 수 있는 데이터 세트의 우수한 사례는 두 개의 ‘이항’ 결과가 손상된 세포이거나 손상되지 않은 세포인 경우, 손상된 세포의 수를 평가하는 것이다. 실제로 이항분포는 손상된 세포의 수율을과 관련된 표준오차를 계산하는데 주로 이용된다.
Ⅵ-2.3. 혼성 포아송 모델
Sasaki [8]는 이질성으로 인해 평균 선량이 부적합하게 추정되는 문제를 처리하고자 염색체 이상 자료를 분석하는 방법을 제시하였다. 세포 집단은 상이한 정도의 손상을 일으키는 상이한 선량에 피폭된 각 하위집단의 혼합물로 구성되어 있다. 그러므로 세포 내 염색체 손상의 분포는 혼성 포아송 분포로 표시할 수 있으며, 이것을 ‘전개’하면 선량 분포 프로파일이 생성된다. 모델은 시뮬레이션 데이터와 실제 데이터에 대한 선형 이차 선량 반응에 충분히 적합한지 검증되었다.
Ⅵ-2.4. 부정이항분포
포아송 분포처럼 부정이항분포도 이산확률분포이지만, 음성이항은 과산포를 나타내는데 이용할 수 있는 추가 모수이다. 과산포 모수는 0을 향하는 경향이 있기 때문에 부정이항은 포아송을 향하는 경향이 있다 [9]. 2008년 항공기 조종사의 전좌 빈도 연구에서와 같이 몇몇 연구자들은 포아송을 대신해 부정이항분포를 이용하였다 [10].
Ⅵ-2.5. Neyman 유형- A 분포
Neyman 분포는 1939년, 분산이 다른 두 표본의 평균 간의 차이를 검증하는데 이용하기 위해 새로운 종류의 분포를 도입한 Neyman에 의해 최초로 제시되었다. 이는 예를 들어, 분산이 동일하지 않다면 반드시 유사해야 하며, 각각 모집단 표준편차가 알려져 있고 알려져 있지 않은 정규분포 데이터를 근거로 하는 z-테스트와 t-테스트 같은 다른 표준 테스트와 대조적이다. Neyman 유형-A 분포는 표본의 크기가 커지면 일반화시킨 포아송 분포를 향하는 경향이 있다 [11]. 2008년, Morand et al.은 Neyman 유형 A 분산 사건의 95% 신뢰한계를 계산하는데 이용할 수 있는 NETA 컴퓨터 프로그램을 설명하는 기술 노트를 출판하였다 [12]. Morand와 동료들은 Neyman 분포를 이용해 계산한 신뢰한계가 크기가 작은 표본 (세포의 수)을 대상으로 전통적인 포아송 기반 방법을 이용해 계산한 것보다 작다는 것을 발견하였다 [12].
Ⅵ-2,6, 기타 분포
베타 분포는 일반적으로 α와 β라고 하는 두 개의 형상 모수에 따라 간격 0-1에 대해 규정되는 연속확률분포군으로 정의된다. Dirichlet 분포는 다항 (≻2 모수)에 대한 베타 분포의 확장이다. Stiratelli et al. [13]은 베타이항분포, 부정이항분포, 상관적 이항분포가 있는 화학적으로 유도된 염색체 손상을 대상으로 포아송 분포와 이항 분포를 비교하였다. 포아송 분포와 단순한 이항분포와 반대로 이러한 모델들은 세포 반응의 독립성에 의존하지 않는다. 저자들은 포아송 모델과 이항 모델과 관련해 베타 분포 기반 모델의 적합성이 모두 향상되는 것을 발견하였다 (χ2 검정을 통해 테스트된 바와 같이). 저자의 데이터 세트와 관련해 가장 적합한 것은 베타 이항 모델이었다 [13].
로그-정규분포는 1980년 Aichison고 Shen에 의해 공식적으로 기술되었다. d-차원 정규분포의 로지스틱 변환은 d-차원 심플렉스에 대한 로그-정규분포를 산출한다. 이러한 분포는 염색체 이상 데이터 같은 기본적인 사례의 분류가 불확실한 경우, 통계적 진단에 활용 가능하다. 저자들은 예를 들어, 직접적 통계적 기술과 구성적 데이터 및 확률적 데이터 분석 시 그리고 다항 분할표 자료의 분석 시 Dirichlet 사전 분포를 대신하는 것으로서 이용 사례를 제시하였다 [14].
Ⅵ-3. 선량 반응 곡선 맞춤을 위한 루틴
곡선 맞춤 소프트웨어는 8.3절에 기술되어 있다. 본 부록에서는 소프트웨어 옵션인 R-기반 툴을 표 4에 제시되어 있는 60C에 적용한 자료작업 사례를 제시한다. CABAS와 Dose Estimates는 바로 사용이 가능한 패키지로 이용 가능하지만, R 절차의 경우에는 수학자들에 의해 작성되어야 하는 루틴이 필요하다. 필요한 루틴은 작성되어 있으며 (H. Braselmann에 의해), 이는 어디에서도 공개된 바가 없기 때문에 박스 1에 전부를 제시하였다.
루틴에는 4개의 부분이 있다. 첫 번째는 관찰된 데이터 즉, 선량, 이상의 수, 평가된 세포의 수, 분산 지수 (disp)를 입력하는데 이용된다. 이 지수의 경우에는 두 개의 옵션이 있다. 모든 선량점에 상수값을 이용하거나 각각의 선량에 별도의 값을 귀속시킨다. 작업 사례에서는 상수값 1.0이 이용되었다. 입증된 또 다른 방법은 표 4에 제시되어 있는 개별적인 σ2/y 값을 이용하는 것이다. (# 기호로 시작하는 루틴의 모든 라인은 정보에 불과하며 실행되지 않을 것임에 유의한다) 다음 부분은 최적의 설정을 입력하기 위한 것이다. ⅰ) 시그마 상관계수, 이 계수를 추정하거나 값 1을 이용할 것을 권고한다. ⅱ) 필요한 가중치 ⅲ) 맞춤을 원하는 함수. 이러한 경우, 선형 맞춤에는 ‘1’을 입력하거나 선형 이차의 경우에는 ‘1q’를 입력한다. 루틴의 나머지 두 부분은 스크립트 개발자에 의해서만 수정되어야 한다. 만일 선형 선량 반응 함수에 데이터를 일치시키고 싶다면, 표 4의 3He 데이터를 이용해 입력될 데이터를 박스 1 아래에 제시한다. 그러면 루틴이 박스 1에 제시되어 있는 것과 같아진다.
루틴을 실행하려면 인터넷 사이트에서 R 프로그램을 다운로드받아야 할 것이다 (8.3 절 참조). 본 저서의 PDF 버전을 이용해 박스 1에 제시되어 있는 루틴을 워드프로세서 소프트웨어로 직접 복사하거나 붙여넣기 한다. 60Co 작업 사례 입력 데이터를 자신의 데이터로 교체하고 ‘1’이나 ‘1q’와 같이 원하는 옵션을 선택한다. 스크린에 있는 R 프로그램으로 기호 ≻ 뒤에 루틴을 붙여넣기 한다.
표준오차와 함께 x0, x1, x2가 방정식 (2)에 제시되어 있는 바와 같이 각각 C, α, β 계수인 출력 결과는 박스 2에 제시되어 있다. z 값은 확률 (Pr)에 따른 각 계수의 유의성 테스트이다. 또한 각각의 계수에 대한 분산과 공분산 값도 제시되어 있다. 계수의 값은 표 5에 제시되어 있는 값들과 9.7.3절에 제시되어 있는 것들의 분산/공분산 값과 동일하다. R 출력 결과에는 자료점과 맞춰진 곡선이 그래프로 제시되어 있다 (그림 Ⅵ-1).

.

이상 식품의약품안전처에서 의뢰한 국제원자력기구(IAEA) 방사선 응급상황 대응 번역(영어번역)의 일부를 살펴 보았습니다. 
번역은 기버 번역