Chapter 3
『遺伝子: 発現、機能、進化』
Genes: Organisation, Function and Evolution

3.1 『遺伝子の発現レベル』
Levels of genetic organisation

遺伝学は急速に発展し、各分野に貢献している。
→進化の分野においては種間の遺伝子の相同性が進化史の再現に用いられる。

3.1.1 『DNA、タンパク質、染色体』
DNA, proteins and chromosomes
 
・遺伝情報は、DNAを構成するヌクレオチドの線上の配列に書き込まれている。
>遺伝子配列の例:fig.3.1

・遺伝子DNAは複製によって世代間で情報を受け継ぐことができるという非常に重要な特性を持っている。
→進化学者はDNAの特性として突然変異を強調する。

●デオキシリボ核酸(DNA)
・DNAはバックボーンとしてデオキシリボースを持ち、4つの塩基から構成され、二重らせん構造を形成する。

・各塩基は以下のタンパク群に分類される。
プリン(purine)タンパク群 ピリミジン(pyrimidine)タンパク群
アデニン(adenine;A) チミン(thymine;T)
グアニン(guanine;G) シトシン(cytosine;C)

・DNAの二重らせん(double-helix)構造:fig.3.2
>以下の規則に従う
1.A-T、G-Cの組で水素結合により対を形成する。 
2.特定の方向(5'→3')に読まれる。 

・遺伝情報の発現過程では、まずDNAの一定の領域が転写されて相補的配列を持つRNAができ、それを基にタンパク質のアミノ酸配列に翻訳される(3.2.2にて詳述)。

・DNAはコード(coding)部と非コード(non-coding)部から構成される。

●リボ核酸(RNA)
>DNAとの違い
 1.塘-リン酸のバックボーンにはデオキシリボースでなくリボースが含まれる。 
 2.塩基としてチミンの代わりにウラシル(U)を持つ。 
 3.二重螺旋でなく一本鎖で存在する。 
リボザイム   RNAは自らの複製の鋳型として働くだけでなく、ヌクレオチド間の共有結合の切断や形成を触媒できる。 
・アミノ酸の表(table3.1)

●タンパク質
・タンパク質はその機能により細胞などの物理的な構成要素と酵素(enzymes)に分類される。

・タンパク質の構造上の階層
・一次配列(primary sequence)  ペプチド結合によりアミノ酸が結合したポリペプチド
>アミノ酸(amino acids) -(ペプチド結合)→ ポリペプチド(polypeptide)

モチーフ(motifs) 一次構造上で一定の機能に関与する平均的な配列
モジュール(module)  タンパク質を構成する構造又は機能の基本単位
・二次構造(secondary structures)  アミノ酸配列の最初の折り畳みの段階
・三次構造(tertiary structure)  単量体のタンパクサブユニット
・四次構造(quaternary structure)  2個以上の3次構造の集まったタンパク分子。(fig3.3:ヒトのヘモグロビン構造)

●染色体(chromosomes)

・染色体は常染色体(autosome) と性染色体(sex chromosomes)より構成される。
染色体は構造上 q(long) arm と p(short) armとに区分され、その間に位置するセントロメア(centromere)の部分で相同染色体を作る。
>ヒトの染色体一覧(fig3.4)
 
・ゲノム(genome)  ある生物が持つひとそろいの遺伝子
・遺伝子座(locus)  ゲノム上での遺伝子の位置
・対立遺伝子(allele) 同じ遺伝子座を占める、対立形質に対応する遺伝子

・染色質(chromatin)
>真核生物におけるDNA結合タンパクと核DNAの複合体
・真正染色質(euchromatin)  染色質の中で電子密度が低く、機能的に活性の高い部分。
・異質染色質(heterochromatin)  染色質の中で電子密度が高く、機能的に活性の低い部分。
・テロメア(telomeres)  染色体の末端部分。            
>染色体バンドと遺伝子地図についてはChapter 7で述べる。



3.1.2 『遺伝コード』
The genetic code

・遺伝子の塩基配列をアミノ酸配列に翻訳する規則は遺伝コード(genetic code)とよばれ、コドンを単位とする。

・コドン(codons)
>遺伝コードの単位。塩基3個で構成され、それぞれアミノ酸に対応している。
・縮重(degenerate)  1種類のアミノ酸に対して複数のコドンが対応していること。
・同義語コドン(synonymous codon)  同一アミノ酸に対応する異なるコドン。
・終止コドン(stop codons)  mRNAが翻訳されるとき、タンパク質生合成の終止を指示するコドン。 
対応するアミノ酸を持たないコドンがこれに相当する。
・開始コドン(initiation codon)  mRNAが翻訳されるとき、タンパク質生合成の開始点となるコドン。
>遺伝暗号表(table 3.2)

・遺伝コードは生物に広く共通であるが、一部の例外もある。
>酵母などのミトコンドリアゲノムでの変則性の例(Table3.3)。



3.1.3 『ミトコンドリアと葉緑体』
Mitochondria and Chloroplasts

●細胞小器官(organelles)
>DNAは核以外の場所にも存在する。
・ミトコンドリア)mitochondria)  真核生物の細胞内に広く存在する呼吸・エネルギー生成器官。 
>fig.3.5: ヒトのミトコンドリアゲノム(mtDNA)。
・葉緑体(chloroplasts)  植物や藻類で見られる光合成を行う細胞内小器官。 
>fig.3.6: コメ(Oryza sativa )の葉緑体ゲノム(cpDNA)。
>ミトコンドリアや葉緑体のゲノム中には非コードDNAは殆ど存在しない。

●細胞内共生(endosymbiosis)
・ミトコンドリアや葉緑体の起源は、原始的な真核細胞が細菌と安定な共生関係を確立したことに端を発すると考えられている。

・植物や菌類のmtDNAでは自己スプライシングイントロン(self-splicing introns) が見られる。(3.1.4&3.2.2で詳述)



3.1.4 『遺伝子の構造』
The structure of genes

●遺伝子発現(gene expression)
>以下の2つのプロセスからなる。
転写(transcription)  遺伝子形質発現の第1段階。遺伝子DNAの塩基配列を相補的RNAとして写し取る反応。 
翻訳(translation)  mRNA上の塩基配列を読みとってその情報に対応するアミノ酸を選び出しペプチド鎖を形成していく過程。 

●構造遺伝子(structural genes)
>タンパク質やrRNA、tRNAなどの一次構造を決定する情報を持った遺伝子。 その発現は調節遺伝子により制御される。
 
・調節遺伝子(regulatory genes) 
=調節配列(regulatory sequences)
他の遺伝子の形質発現を調節する機能を持っている遺伝子。 
・ハウスキーピング遺伝子(housekeeping genes)  どの細胞でも常に構成的に発現し、細胞の生命活動に必須な機能を果たしている遺伝子の総称。 
>組織に特異的な遺伝子(tissue-specific genes) 
・読み枠(reading frames)  mRNA上に塩基配列としてコード化されている遺伝情報がタンパク質に読みとられていく枠組み。 
開始コドンの位置により決定、コドンごとに3塩基ずつに区切られる。 
・プロモーター(promoters)  RNAポリメラーゼが特異的に結合して転写を始めるDNA上の領域。 
・エンハンサー(enhancers)  隣接する遺伝子の転写を促進するDNA上の調節配列で、それ自身の方向性、プロモーターからの距離や位置によりあまり大きな影響を受けないもの。
・オペロン(operon)  遺伝子発現制御の際の転写単位。

真核生物 原核生物
・TATA box 
・CAAT box(哺乳類) 
・GC box(GGGCGG)
・Shine-Dalgarno BOX (AGGAGG) 
・-10 site (TATAAT) 
・-35 site (TTGACA)
・これらの繰り返しは3'末端でもよく見られ、その安定化に貢献している。
>ex) polyadenylation signal(AATAA)

・典型的なタンパクコード遺伝子の構造。
>真核生物とバクテリアのアルコールデヒドロゲナーゼ遺伝子(fig3.7)。

・真核生物のDNAはエキソンイントロンからなる。
 
・エキソン(exons) 最終的にタンパク質又は機能RNAとして発現する塩基配列。 
・イントロン(introns) 遺伝子又はその転写物の中にあって、その遺伝子から作られる最終RNA産物に含まれない配列。 
・イントロンの種類

・spliceosomal introns  真核生物のイントロンの大部分を占める。 
>spliceosome(タンパク質+RNA)によってスプライスされる。
・protein-spliced introns  tRNAやrRNAの一部に見られる。
 ・イントロンの種別
group I introns  タンパク無しで自己スプライスが可能。 
多くがタンパクをエンコードするためゲノム周辺を移動する。
group II introns  別のメカニズムによる自己スプライス機能を持つ。 
ミトコンドリアや葉緑体に散在しあまり多くない。
group III introns  わずかに原始的な真核生物と鞭毛虫(Euglena galacilis )で見られる。 
まだあまり研究されていない。
Box 3.1 The evolution of introns
イントロンの起源についての2つの対立仮説 
introns-early theory  introns-late theory
概略 独立なタンパクドメインをコードする別々のエキソンが様々な組み替えを行った結果、その発火点がイントロンになった。 進化の後期(比較的「最近」)に真核生物系に付加されたものである。
問題点 (1)大部分のイントロンがコドン中のランダムに挿入されており、明瞭に機能的な部分として分けられているわけではない。 
(2)古細菌やバクテリアなどにはイントロンが存在しない*
記述無し
*(2) 選択圧により細胞分裂周期ごとに合成される不要なDNAの量を最小限にする必要があるためにイントロンを失ったという反論がある。 
**それに対する反論> ミトコンドリア・葉緑体由来の核ゲノムにイントロンが複数見られるのに、ミトコンドリア・葉緑体、それらの起源と考えられるバクテリア群で見られないのは何故か? (fig B3.1)

・イントロンはミトコンドリア・葉緑体を獲得した後に細胞小器官由来のゲノムを含んだ真核細胞系で始めて現れた。



3.1.5 『多重遺伝子族』
Multigene families

●多重遺伝子族(multigene families)
>ゲノム内に繰り返して存在する同一種類の遺伝子の一群。遺伝子重複の極端な場合と考えられる。

・構造と進化についての詳述は3.3.2で。
 
・遺伝子重複(gene duplication)  ゲノム内に同じ遺伝子が2個以上存在すること。 
>ヒトのβ-グロブリンの遺伝子ファミリーの進化図(fig3.8)。
 
・偽遺伝子(pseudogenes)  既知の正常遺伝子と塩基配列の上で高い類似性がありそれとの相同性がはっきりと認められるにもかかわらず、遺伝子としての機能を失っているDNAの領域。 
>(ex: ヒトのβ-グロブリンの遺伝子ファミリー中の偽遺伝子(fig3.8)。
 
・CG島(CpG islands)  ゲノム上に島状に点在するCpG配列を多く含む領域。 
高い割合でメチル化を受け、CpG→TpGの変異が起きる。 
活性の高い部分ではメチル化から保護されることでこの配列が良く保存されている。
>CG島は大部分の哺乳類の5'末端でよく見られるので遺伝子座のマッピングに有用である。


3.2 『遺伝子は如何にしてその機能を為すか』
How genes function

3.2.1 『DNA複製』
DNA replication

●DNA複製
>DNAポリメラーゼ(DNA polymerases)によって行われ、元の鎖が鋳型として機能する(fig3.9)。
・複製フォーク(replication fork)  相補的な二本鎖DNAを複製するためには順方向に複製の進むリーディング鎖では連続的複製が起きるが、逆方向に進行するラギング鎖では岡崎フラグメントと呼ばれる短いDNA断片ずつ逐次的に複製される。 

・細胞内でDNA複製が起き、染色体同士の対合によって相同染色体が形成される。
その後有糸分裂では分裂により倍数体の娘細胞ができ、減数分裂では連続して二回の分裂が起き半数体の娘細胞ができる。
>概念図(fig3.10)。
 
・相同染色体(homologous chromosomes) 減数分裂において対合する染色体。
・半数体(haploid)  半数の染色体数を持つ細胞または個体。
・倍数体(diplaoid)  生活環の中の相同又は異種の染色体組を2組もつ時期の細胞または個体。
・配偶子(gametes)  動物・植物を通じて合体や接合を行いゲノムセットの一部を混合あるいは交換し、1個体として発生できる生殖細胞。 半数体。
・接合体(zygote) 2個の配偶子が接合して生じた細胞。倍数体。
・有糸分裂(mitosis) 真核生物の細胞核の一般的な分裂様式。染色体や紡錘体などがいわゆる糸状構造の形成を伴う複雑な核内変化が見られるもの。
・減数分裂(meiosis) 2回連続した有糸分裂から構成され、その結果染色体が半減する核分裂。
・姉妹染色分体(sister chromatids ) DNA複製の終わった一本の染色体を構成している二本の染色分体のそれぞれを指す。



3.2.2 『タンパク合成』
Protein synthesys

・遺伝子DNAから転写された相補的RNAがRNAプロセシングをうけてmRNAとして完成する。
tRNAにより運搬されたアミノ酸がリボソーム上でmRNAの情報を基に翻訳され、最終的に糖質の付加(glycosylation)などが施されて機能タンパクが完成する。

●タンパク合成(Protein synthesys)
>以下の2つのプロセスからなる。
・転写(transcription)  遺伝子形質発現の第1段階。遺伝子DNAの塩基配列を相補的RNAとして写し取る反応。 
>RNA polymerase II によって行われる。
・翻訳(translation)  mRNA上の塩基配列を読みとってその情報に対応するアミノ酸を選び出しペプチド鎖を形成していく過程。 
>真核細胞におけるタンパク質合成の模式図(fig3.11)。
 
・messenger RNA (mRNA) タンパクをコードする配列を持つRNA。
・転写因子(transcription factors) 転写を開始する特別なタンパク質。

・転写の際には、DNA二本鎖のうち片側のみが意味を持ち(sense)、もう片側の相補DNA(complementary DNA)は意味を為さない(antisense)。

・mRNA processing
>概略(fig3.12)。
1. cap配列の付加(5'末端) および poly(A) tailの付加(3'末端) 
2. イントロンのスプライシング
3. RNAエディティング(RNA editing) 
>転写後のRNAで塩基の置換が生じる。主にC→Uが生じ、コドンが変更される。
'Mature' mRNA分子の完成。
・リボソーム(ribosomes) タンパク質生合成の場となる細胞内構造体。ribosomal RNA (rRNA)から構成される。

・各アミノ酸の情報はそのコドンに相補的なアンチコドンによって認識され、対応するtransfer RNA (tRNA) によってリボソームに運ばれる。
・アンチコドン(anticodon) 遺伝コードのコドンと相補的な関係にある3塩基の配列。 
tRNA分子のほぼ中央に位置し、遺伝情報の翻訳の過程でmRNA上のコドンと対合する事でコドンとアミノ酸の間の対応付けが行われる。

●セントラルドグマ(central dogma of molecular biology)
>核酸やタンパク質の生合成過程で、遺伝情報の流れは一方向的でありいったん情報がコード化されタンパク質に転換すると、その遺伝情報は再度核酸の遺伝情報を構築することはないという生物則。

・逆転写酵素(reverse transcriptase)の発見がこの法則に変革をもたらした。(pp80-82で詳述)



3.2.3 『変異』
Mutation

・DNAの複製過程は非常に正確なものであるが、時折エラーが生じる。
変異が世代間で受け継がれ進化の要因となるためには、生殖細胞系列(germ-line)で変異が生じなければならない。

●変異の種類(fig3.13)

>塩基レベルで起きる変異
・点変異(point mutations)  ゲノム上の一点、あるいはごく一部に変異が起きたもの。 
・トランジション(Transitions)  ピリミジンがピリミジンへ(C/T)、プリンがプリンへ(A/G)置き換わる点変異。 
・トランスバージョン(Transversions)  プリンとピリミジンが置き換わる点変異。 
・synonymous (silent) mutations  同じアミノ酸をコードする、もしくはできあがるタンパクに影響の無いような変異。 
・non-synonymous(replacement) 
mutations 
違うアミノ酸をコードする事で、できあがるタンパク質に変化を伴う変異。 
・復帰変異(back mutation)  変異遺伝子が更に変異を起こして元の遺伝子に戻ること。 

・塩基の挿入と欠失(indels)
・挿入(insertions)  ある塩基配列に新しい配列が組み込まれること。 
・欠失(deletions)  塩基配列の一部が失われること。 
・フレームシフト(flameshifts)  遺伝子DNA上で少数の塩基が挿入または欠失する事で読み枠にズレが生じるような変異。 

>染色体レベルで起きる変異。
倍数性(polyploidy)  染色体数に増減が見られる現象。 
異数性(aneuploidy)  固有の染色体数より一個多い/少ない染色体数を持つ現象。 

三染色体性(trisomy)  倍数体より一個多い染色体数を持つ。 
一染色体性(monosomy ) 倍数体より一個少ない染色体数を持つ。 

>構造的な変異
脆弱部位(fragile site)  染色体異常や染色体の切断点となりやすい領域。 
・逆位(inversion)  染色体の一部の配列が逆転したもの。 
・転座(translocation)  ある染色体から一部が離れて別の染色体に結合したもの。 
・重複(duplication)  同じ配列が複数になる変異。 

●DNA修復(DNA repair)
>変異に対してそれを修復するメカニズムが存在する。
・direct repair  特殊な酵素の働きでDNA上の傷を消去するもの。 
光回復などがこれに相当する。 
・除去修復(excision repair)  損傷した塩基の一部を含むヌクレオチドを切り出し、正常な他方のDNA鎖を鋳型とする修復合成によって元に戻す機構。 
・ミスマッチ修復 
(mismatch repair) 
二本鎖DNAの一部に正常な塩基対合を形成できないミスマッチ部分がある場合、不体合校正系(mismatch proofreading system)により除去修復される機構。
・組み換え修復 
(recombinational repair) 
二本鎖DNA上の片方の鎖状に傷があるまま複製が進むと、傷の部分で鋳型になり得ないために相補的DNA鎖が合成されずギャップが生じるが、その部分を元のDNAの対応部分から切り取って埋め、無傷の子孫DNAを創り出す修復。 



3.2.4 『組換』
Recombination

・相同染色体上での交叉により、両親にはなかった組み合わせの遺伝子連鎖群が形成される。
>有性生殖の最も重要な側面。

・組換えは対合した相同染色体のキアズマの部分で交叉が起きることで生じる。(fig3.14)
・交叉(crossing-over) 相同染色分体間に生じる部分交換現象。
・キアズマ(chiasmata) 減数分裂時、対合した相同染色体において見られる4本の染色分体の間で相手を交換するX字型の部位。

・真核生物の組み換えの殆どが相同組み換えであるが、中には不等交叉遺伝子交換が起きる場合もある。
・相同組み換え 
(homologous recombination) 
相同染色体同士の交叉によって組み換えが起きるもの。
・不等交叉 
(unequal crossing-over)
染色体の交叉はふつう全く相同な染色体部分の交換を生じるのに対し、交換される部分が等しくないような交叉によって起きるもの。
>ヒトのβ-、δ-グロブリン遺伝子の例。(fig3.15)
・遺伝子変換 
(gene conversion)
遺伝子中のDNA配列が別のDNA配列に置き換わること。
>ヒトのγ-グロブリン遺伝子の例。(fig3.16)
・種間組み換え
interspecific recombination
(horizontal gene transfer)
バクテリアでは多種のゲノムとの組み換えが起きることがある。
 

・組み換えは非常に高い頻度で起きているため、遺伝的多様性の大きな要因となっている。
>DNA配列により組み換えの発火点となりやすいものもあれば、くみ換えをまったく起こさないものもある。(Chap7で詳述)

・組み換えはその重要性にもかかわらず、分子的なメカニズムについての理解はまだ不十分で、さらなる研究が必要である。