유전영향 번역

 

유전영향 번역에 대해서 알아 보겠습니다(영어번역)

.

유전영향 번역

유전영향 번역(영어 원본)

I. THE HUMAN GENOME
A. GENE NUMBER AND SIZE
4. The total length of the human haploid genome is about 3 million kilobases (3 106 kb, or 3,000 Mb), distributed between 22 types of autosomes and two types of sex chromosome (the X and Y) that can easily be differentiated by chromosome banding techniques. The amount of DNA varies from chromosome to chromosome.The longest, chromosome 1, contains about 263 Mb and the shortest, chromosome 21, contains 50 Mb. In a 550-band metaphase chromosome preparation, an average band corresponds to about 6 Mb of DNA [M55]. The genes are not distributed uniformly along the length of DNA; the Giemsa light-staining bands in metaphase chromosomes contain more genes than do dark-staining bands [S1].
5. The most often quoted range of gene numbers in humans is 50,000 to 100,000 [U16]. Antequera and Bird [A1] used the number and distribution of CpG islands in genomic DNA as a measure for the number of genes. The CpG islands are clusters of cytosine-(C) and guanine-(G) rich sequences present at the 5′ ends (i.e. left ends) of all housekeeping genes and of a large proportion of genes with a tissue-restricted pattern of expression. Thus, the presence of a CpG island denotes the 5′ end of the associated gene [C1, L2]. Since the number of CpG islands in the human genome is approximately 45,000, and 56% of the genes so far sequenced contain CpG-islands, the estimate of total gene number is about 80,000. Extrapolation from sequencing of large chromosomal regions suggests that there are 60,000 to 70,000 genes [F1]. It is worth noting that in any given tissue, only a relatively small proportion of the genes are expressed. Current estimates, based on the draft human genome sequences generated by Celera Genomics [C81] and the Human Genome Project [I15] and published in 2001 suggest that the number of genes may be of the order of about 26,000 to 40,000.
6. There is a wide range of size differences, from about 2 kb to 2,000 kb, between human genes. The size distribution of the 253 genes for which information is catalogued in McKusick’s compendium [M1] is as follows: 59 (23%) are less than 10 kb, 90 (36%) are between 10 and 25 kb, 51 (20%) are between 25 and 50 kb, 33 (13%) are between 50 and 100 kb, 17 (7%) are between 100 and 500 kb, and 3 (1%) are more than 500 kb. Table 1 presents some examples.
B. GENE ORGANIZATION AND FUNCTION
7. As with other eukaryotic genes, most human genes are made up of coding (exon) and non-coding intervening (intron) sequences. Each individual gene differs not only with respect to its DNA sequence but also with respect to its structure. A few human genes, e.g. histone genes, interferon genes, and mitochondrial genes, are devoid of introns, whereas some possess a considerable number of introns, with their lengths varying from a few base pairs to several kilobase. Less than 5% of the genome consists of protein-coding sequences (exons of genes), the remainder being made up of non-coding regions (such as the various types of repeat sequences present in introns and between genes), whose functions remain to be elucidated.
8. The first two bases of the 5′ end of each intron areguanine (G) and thymine (T), and the last two bases (at the3′ end of intron) are invariably adenine (A) and guanine(G). In the sense strand, at the 5′ end of the gene is the ATGcodon, which is the transcriptional initiation site. Upstreamfrom this are a number of non-coding sequences, referredto as promoters, and further upstream are a number of cisactingregulatory elements of defined sequence (TATAAAand CCAAAT motifs, which play a role in constitutivegene expression, and enhancers, which respond toparticular proteins in a tissue-specific manner by increasingtranscription). At the 3′ end of the gene, following thetermination codon (e.g. TAA, TAG, and TGA), is apoly(A) tail.
9. The process by which genetic information in the DNAis transmitted to mRNA is called transcription. During thisprocess, the entire unit of both introns and exons istranscribed into precursor mRNA. The region of precursorRNA transcribed from the introns is then excised andremoved and does not form mRNA and therefore does notspecify the primary structure of the gene product. Theaccuracy of the excision is determined, at least in part, bythe virtually invariant GT and AG dinucleotides present atthe 5′ and 3′ exon-intron junctions, respectively. Theprecursor RNA from the exons is spliced together to formthe definitive mRNA, which specifies the primary structureof the gene product. The definitive mRNA is transported tothe cytoplasm, where protein synthesis occurs (translation).These aspects are discussed in detail by Lewin [L2].
10. A large number of phenotypes of Mendelian geneticdisease have been recognized. McKusick’s 1994 compendium[M1] has 6,678 entries: autosomal dominant, 4,458;autosomal recessive, 1,730; X-linked, 412; Y-linked, 19; andmitochondrial, 59. As of January 2000, the on-line version ofthe above compendium [M2] had 11,062 entries. Well over6,980 genes have been assigned to specific chromosomes andmost of them to specific sites on those chromosomes. Formany of these genes, extensive information is available,including sequence organization, the nature and function ofthe gene product, and the diseases associated with mutationsin them; for others, the information on the gene is indirectand limited to linkage of a Mendelizing phenotype to theparticular chromosomal site [M2, S2].
11. Although well over 1,100 clinical diseases have beenmapped to specific chromosomal regions (about 1,000 loci),data on mutational spectra (i.e. nature, type, and distribution ofmutations along the gene) are available for fewer than one halfof the above. These data are more extensive for some of thegenes, including the cystic fibrosis gene (CFTR) with morethan 500 independent mutations; the β-globin gene (HBB) withmore than 400 mutations; and the factor IX gene (haemophiliaB), α-globin genes (HBA), and the LDLR gene (familialhypercholesterolemia), each with more than 100 allelicvariants. With many other genes, these numbers are muchsmaller. Some of the reasons for these differences are size andfunction of the gene; clinical relevance of mutations and theamount of effort expended; ease of detection; availability foranalysis; and the specificity of the type of mutational event, i.e.whether it is restricted to specific gene regions [S2].

유전영향 번역(한국어 번역본)

Ⅰ. 사람 게놈
A. 유전자 번호와 크기
4. 사람 반수체 게놈의 총길이는 약 3만 킬로베이스 (3 106 kb 또는 3,000 Mb)로 이는 분염법으로 쉽게 구별되는 2가지 성염색체 (X와 Y)와 22가지의 상염색체 사이에 분포되어 있다. DNA의 양은 염색체마다 다르다. 가장 길이가 긴 1번 염색체의 길이는 약 263 Mb이며, 가장 짧은 염색체인 21번 염색체는 50 Mb이다. 550개 밴드 중기 염색체의 평균 밴드는 약 6 Mb의 DNA에 상응한다 [M55]. 유전자는 DNA 길이에 따라 일정하게 분포되지 않는다. 김자로 밝게 염색된 중기 염색체 밴드에는 어둡게 염색된 밴드보다 더 많은 유전자가 들어 있다 [S1].
5. 가장 흔히 인용되는 사람 유전자의 수는 50,000-100,000개이다 [U16]. Antequera와 Bird는 게놈 DNA 내 CpG 섬의 수와 분포를 유전자 수의 척도로 이용하였다. CpG 섬은 발현 패턴이 조직 제한적인 유전자 대부분과 모든 항존 유전자의 5´말단 (즉, 좌측 말단)에서 나타나는 시토신-(C)과 구아닌-(G)이 풍부한 서열의 클러스터이다. 따라서 CpG 섬의 존재는 관련 유전자의 5´말단을 의미한다 [C1, L2]. 사람 게놈에 있는 CpG 섬의 수는 45,000개이고, 지금까지 순서가 배열된 유전자의 56%에는 CpG 섬이 있으므로, 총 유전자수는 약 80,000개로 추정된다. 거대 염색체 부위의 서열에서 외삽을 하면, 60,000-70,000개의 유전자가 있음이 암시된다 [F1]. 어떤 일정한 조직에서는 유전자의 비교적 적은 부분만이 발현된다는 사실은 주목할 만한 가치가 있다. 사람 게놈 프로젝트 [I15]와 Celera Genomics [C81]에 의해 생성되고, 2001년에 발표된 사람 게놈 서열 초안을 근거로 하는 현재의 평가들은 유전자 수가 약 26,000-40,000개일 수 있음을 암시하고 있다.
6. 사람 유전자 크기는 약 2 kb에서 2,000 kb까지로 그 차이가 광범위하다. McKusick의 개론서에 정보가 실린 253개 유전자의 크기 분포는 다음과 같다. 10 kb 이하 59개 (23%), 10-25 kb 90개 (36%), 25-50 kb 51개 (20%), 50-100 kb 33개 (13%), 100-500 kb 17개 (7%), 500 kb 이상 3개 (1%). 표 1에는 일부 사례들이 제시되어 있다.
B. 유전자 조직 및 기능
7. 다른 진핵 유전자들과 마찬가지로, 대부분의 사람 유전자는 암호화 (엑손) 서열과 비암호화 개재 (인트론) 서열로 구성된다. 각각의 개별 유전자는 DNA 서열뿐 아니라 구조와 관련해서도 서로 다르다. 히스톤 유전자, 인터페론 유전자, 미토콘드리아 유전자 같은 일부 사람 유전자에는 인트론이 없는 반면, 일부는 몇 염기쌍에서부터 몇 킬로베이스에 이르기까지 그 길이가 다양한 인트론을 상당 수 지니고 있다. 게놈의 5% 이하는 단백질 암호화 서열 (유전자 엑손)로 구성되어 있으며, 나머지는 비암호화 부위 (인트론과 유전자 사이에 존재하는 다양한 유형의 반복 서열 같은)로 구성되어 있다. 이들의 기능은 아직도 해명되지 않은 채 남아있다.
8. 각 인트론마다 5´말단의 첫 두 염기는 구아닌 (G)과 티민 (T)이며, 마지막 두 염기 (인트론의 3´말단)는 언제나 아데닌 (A)과 구아닌 (G)이다. 유전자의 전사가닥 중 5´말단에는 전사 개시 위치인 ATC 코돈이 있다. 이 것의 상단부에는 프로모터라고 하는 다수의 비암호화 서열들이 있으며, 더 위쪽 상단부에는 규명된 서열 (구조적 유전자 발현 시 역할을 하는 TATAAA와 CCAAT 모티프와 전사가 증가하면 조직 특유의 방식으로 특정 단백질에 반응을 하는 촉진자)의 작동 위치 조절 요소들이 많이 존재한다. 유전자의 3´말단에는 종결 코돈 (예를 들어, TAA, TAG, TGA) 다음에 폴리(A) 꼬리가 있다.
9. DNA의 유전 정보가 mRNA로 전달되는 과정을 전사라고 한다. 이러한 과정이 진행되는 동안, 인트론과 엑손의 모든 단위는 전구체 mRNA로 전사된다. 그러므로 인트론에서 전사된 전구체 RNA 부위는 절제, 제거되며, mRNA를 형성하지 않으므로 유전자 산물의 1차 구조를 드러내 보이지 않는다. 절제의 정확성은 최소한 부분적으로 각각 5´말단과 3´말단의 엑손-인트론 접합점에 존재하는 사실상 불변의 GT와 AG 디뉴클로에타이드에 의해 결정된다. 엑손으로부터 전구체 RNA가 접합되어 완성된 mRNA를 형성한다. 이는 유전자 산물의 1차 구조를 보여준다. 완성된 mRNA는 단백질 합성 (해독)이 일어나는 세포질로 이동한다. Lewin은 이러한 측면들을 상세하게 논하고 있다 [L2].
10. 멘델성 유전 질환 표현형은 상당히 많은 수가 알려져 있다. McKustick의 1994 개론서 [M1]에는 6,678개의 목록이 기재되어 있다. 상염색체 우성형질 4,458; 상염색체 열성형질 1,730; X-연관성 412; Y-연관성 19; 미토콘드리아 59. 2000년 1월 현재로, 상기 개론서의 온라인 버전 [M2]에는 11,062개의 목록이 기입되어 있다. 6,980개 이상의 유전자가 특정 염색체에 배열되어 있으며, 대부분은 그 염색체의 특정 위치에 배열되어 있다. 이러한 유전자들의 경우에는 서열 조직, 유전자 산물의 성격과 기능, 이들의 돌연변이와 관련이 있는 질환을 포함해 광범위한 정보가 이용 가능하다. 이와 다른 경우, 유전자에 대한 정보는 간접적이며, 특정 염색체 위치와 멘델 표현형을 연결시키는 데에도 한계가 있다 [M2, S2].
11. 1,100개 이상의 임상적 질환이 특정 염색체 부위 (약 1,000 loci) 지도로 작성되었지만, 돌연변이 스펙트럼 (즉, 성격, 유형, 유전자에 따른 돌연변이 분포)과 관련해 이용할 수 있는 자료는 앞의 정보의 절반도 되지 않는다. 500개 이상의 독립적 돌연변이가 있는 낭포성 섬유증 막횡단 전도 조절 유전자 (CFTR), 400개 이상의 돌연변이가 있는 β-글로불린 유전자 (HBB), factor Ⅸ 유전자 (혈우병), α-글로불린 유전자 (HBA), 각 100개 이상의 대립형질 변형이 있는 LDLR 유전자 (가족성 고콜레스테롤혈증)를 포함해 일부 유전자에 대한 자료는 보다 광범위하다. 다른 많은 유전자들을 고려한다면, 이 수치는 훨씬 적다. 이러한 차이는 유전자의 크기와 기능, 돌연변이의 임상적 관련성, 기울인 노력의 정도, 검출의 용이함, 분석의 유용성, 돌연변이 사건 유형의 특이성 즉, 특정한 유전자 부위에 제한되는지 등의 이유로 인해 발생한다 [S2].

.

이상 식품의약품안전처에서 의뢰한 방사선의 유전양향 번역(영어번역)의 일부를 살펴 보았습니다. 

번역은 기버 번역