コザック配列 (Kozak sequence)は、生化学者のマリリン・コザック (英語版 ) により発見された、真核生物 のmRNA に出現する共通配列であり、主に翻訳 の開始に関与している。ただし厳密な共通配列ではなく、不一致のあることも非常に多い。脊椎動物 では (gcc)gccRccAUGG と表され、なかでも開始コドン (AUG) の3塩基上流のR(プリン 塩基・アデニン またはグアニン )と開始コドンの次のGが重要な役割を果たすと考えられている。リボソームが翻訳を始めるためにはコザック配列(不一致のあるものも含む)が必要であり、リボソーム によって認識された部位からタンパク質 の翻訳が開始される。
コザック配列は、リボソーム結合部位 (ribosomal binding site; RBS)、つまりmRNAの5'キャップ や内部リボソーム導入部位 (Internal Ribosome Entry Site; IRES) とは異なるので混同しないことが肝要である。
真核生物の翻訳は、およそ以下のような手順を経て開始される。まずリボソームの小サブユニットが翻訳開始因子やメチオニンtRNAなどと結合して開始前複合体(43S複合体)が形成される。一方mRNAの5'端にあるキャップ構造が翻訳開始因子の1つであるeIF4E に認識される。開始前複合体とeIF4複合体が会合すると、mRNAを読み取りながら5'端から3'端へと開始コドンを探す。メチオニンtRNAなどの働きで適切な開始コドンが見つかると、翻訳開始因子群が解離し代わりにリボソームの大サブユニットが小サブユニットと結合し、そこから翻訳が始まる。したがって単純に考えれば、mRNAのうち最も5'端に近いAUGの3塩基から翻訳が開始するはずである[ 1] 。
しかし実際には常に最も5'端に近いAUGが選ばれるわけではなく、より下流のAUGから翻訳が開始することもある。これは単にメチオニンtRNAが開始コドンを認識しているだけではなく、ほかにも翻訳開始因子などが関与して翻訳開始部位を決めているためだと考えられる。コザック配列はおそらくその反映に違いないのだが、翻訳開始部位決定の詳しい仕組みはまだ明らかになっていない。
コザック配列は厳密でなく、不一致があっても翻訳を開始できる場合が多い。しかし哺乳類においては、最終的に合成されるタンパク質の量が、コザック配列の一致・不一致に影響されることが知られており、これをコザック配列の「強さ」のように表現する[ 2] 。この「強さ」は単に不一致の量で決まっているのではなく、塩基によって重要さに差がある。AUG の3塩基は実際の開始コドンであり、タンパク質のN末端のメチオニンをコードしているため必要不可欠である。このAを起点(+1)として、5'端側から-3,-2,-1,+1,+2,+3のように部位を数える(0はない)。「強い」配列では、+4位のGと-3位のAまたはGが両方とも存在している。「妥当な」配列ではどちらか一方のみが存在し、「弱い」配列では両方とも存在しない。-1位と-2位のccは保存されていないが、コザック配列の強さに寄与している[ 3] 。また-6位のGが翻訳開始に重要であることを示す証拠もある[ 4] 。
こうしたKozak配列のタイプは遺伝子調節メカニズムのひとつとして進化したのだろう。Lmx1b は「弱い」Kozak配列をもつ遺伝子の一例である[ 5] 。こうした部位から翻訳を開始する場合、リボソームが開始部位を認識するためにはさらに他の特徴がmRNA配列に必要になる。
ヒトの全mRNA中における開始コドン周辺の保存塩基を示すsequence logo 。
βグロブリン遺伝子(β+45; human)の研究によれば、-6位のGがCに変異することでこの遺伝子の血液学的な表現型や生合成が損なわれる。これはイタリア南東部の中間型サラセミア の家系から見出された変異で、Kozak配列に見つかった変異としては最初のものである[ 4] 。
もともと脊椎動物のデータ解析によって見つかった共通配列であるが、それ以外の生物でも類似の解析が行われ、広い範囲の真核生物で同様の共通配列が見出されている。以下にその例を挙げるが、なかでも-3位のプリン塩基(特にアデニン)は非常に保存性が高い。
ただし、共通配列への一致とタンパク質の量との相関は、哺乳類ほどはっきりした関係は見られない。出芽酵母を使った実験では、遺伝子によってはタンパク質量が10倍以上も変化する場合もあったが、一貫した特徴とは呼べないようである。
^ Kapp, L.D. and Lorsch, J.R. (2004). “The molecular mechanics of eukaryotic translation”. Annual Review of Biochemistry 73 : 657-704. PMID 15189156 .
^ Kozak M (1984). “Point mutations close to the AUG initiator codon affect the efficiency of translation of rat preproinsulin in vivo” . Nature 308 : 241-246. PMID 6700727 . http://www.nature.com/nature/journal/v308/n5956/abs/308241a0.html .
^ Kozak M (1986). “Point mutations define a sequence flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes” . Cell 44 (2): 283-92. PMID 3943125 . http://www.nature.com/nature/journal/v308/n5956/abs/308241a0.html .
^ a b De Angioletti M, Lacerra G, Sabato V, Carestia C (2004). “Beta+45 G --> C: a novel silent beta-thalassaemia mutation, the first in the Kozak sequence”. Br J Haematol 124 (2): 224-31. PMID 14687034 .
^ Dunston JA, et al (2004). “The human LMX1B gene: transcription unit, promoter, and pathogenic mutations”. Genomics 84 (3): 565-76.
^ Kozak M (1987). “An analysis of 5'-noncoding sequences from 699 vertebrate messenger RNAs” . Nucleic Acids Res 15 (20): 8125-48. PMID 3313277 . http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&pubmedid=3313277 .
^ Cavener, D.R. (1987). “Comparison of the consensus sequence flanking translational start sites in Drosophila and vertebrates” . Nucleic Acids Research 15 (4): 1353-1361. PMID 3822832 . http://www.pubmedcentral.nih.gov/picrender.fcgi?artid=340553&blobtype=pdf .
^ Hamilton, R. et al. (1987). “Compilation and comparison of the sequence context around the AUG startcodons in Saccharomyces cerevisiae mRNAs” . Nucleic Acids Research 15 (8): 3581-3593. PMID 3554144 . http://www.pubmedcentral.nih.gov/picrender.fcgi?artid=340751&blobtype=pdf .
^ a b c d Yamauchi, K. (1991). “The sequence flanking translational initiation site in protozoa” . Nucleic Acids Research 19 (10): 2715-2720. 2041747. http://www.pubmedcentral.nih.gov/picrender.fcgi?artid=328191&blobtype=pdf .
^ Seeber, F. (1997). “Consensus sequence of translational initiation sites from Toxoplasma gondii genes”. Parasitology Research 83 (3): 309-311. PMID 9089733 .
^ Lütcke, H.A. et al. (1987). “Selection of AUG initiation codons differs in plants and animals” . EMBO Journal 6 (1): 43-48. PMID 3556162 . http://www.pubmedcentral.nih.gov/picrender.fcgi?artid=553354&blobtype=pdf .
Kozak M (1990). "Downstream secondary structure facilitates recognition of initiator codons by eukaryotic ribosomes".
Kozak M (1991). "An analysis of vertebrate mRNA sequences: Intimations of translational control". J Cell Biol 115:887–903 . [1]
Kozak M (2002). Pushing the limits of the scanning mechanism for initiation of translation. Gene, 299: 1-34