JAPANESE TOP ENGLISH TOP






>>研究概要


    私たちの研究室では、 ゲノム 情報をもとに生物の共通のシステムならびに多様なシステムを体系的に理解するために、 最先端のバイオサイエンスの知見を理解しながら、あるときはバイオサイエンスの実験にかかわりながら、 また、あるときは、膨大な ゲノム 情報に関わるデータを体系化し予測するための情報科学、 特に、 バイオインフォマティクスケモインフォマティクス技術の開発研究を進めています。




    ゲノム情報と遺伝子発現

ゲノム上の 塩基配列 情報をもとに 転写翻訳 のプロセスを経て タンパク質 が生合成されます(Fig. 1-1の1と2のプロセスと対応)。 Fig. 1-1のプロセス3のように、生合成された タンパク質 は、単独で細胞内で機能するもの、 あるいは、複数の種類の タンパク質 が相互作用して機能するものがあります。 このようにして出来上がった機能単位としての タンパク質 が種々の細胞の中で機能することとなります。 その代表的な機能単位に 酵素 があります。 酵素 は 代謝物(メタボライト)の反応をつかさどる触媒としての働きがあります。 Fig. 1-1の4のプロセスをみていただくと、BとCの タンパク質 が複合体をつくり 酵素 という機能単位により 代謝物(Metabolite 1)が Metab. 2に化学変換されます。このようにして、細胞内の一連の 代謝 パスウエイが 酵素 群により形成されます(Fig. 1-1)。

では、 ゲノム 上の 遺伝子 の全てが常に発現されているのでしょうか? 実際には、細胞の状況に応じた 遺伝子 群の発現制御がなされています。 Fig. 1-2はこのことを概念的に説明した図です。細胞がある環境下におかれると、 特定の タンパク質 が大量に発現されます。 その中には、 ゲノム の特定の構造もしくは 塩基配列 と相互作用するタンパク質があります。 この タンパク質 を、通常、 転写因子 と呼びます。Fig. 1-2では細胞内に大量に発現された、 転写因子 Gが、 ゲノム 上の 遺伝子 群d-e-f-g、j-k、mの上流に結合することにより、 これらの 遺伝子 の発現が活性化されることを図解しています。すなわち、 タンパク質 D,E,F,G,J,K,Mが存在することになります。 一方、Fig. 1-2の場合、特にGにより制御をうけずに細胞に存在する タンパク質 B、Cも細胞内に存在しています。 タンパク質 B,C,D,E,J,K,Mが細胞に存在することにより形成される 代謝 パスウエイは、 Metabolite.1→Metab.2→Metab.4→Metab.6 のようになります。

このように、 代謝 経路が細胞の状況に応じて変化することになります。 特定の生物の ゲノム が決定されると、 ゲノム 上に存在する全 遺伝子 セットを定義することが可能になるので、 有限個の 遺伝子 を対象とした研究が可能となります。 このことは、 ゲノム が決定される前には、 解析対象とした生物にはいったいどのくらいの 遺伝子 があるのか知ることができないなかで、 いくつかの 遺伝子 間の発現制御関係を実験により決める煩雑さを軽減することが可能になりました。 また、 ゲノム 情報をもとに生物がもつ共通の 遺伝子 あるは種固有の 遺伝子 の有無についての情報を得ることも可能となりました。 このように、情報科学とバイオサイエンスの知恵と知識を融合し、 比較ゲノム解析により生物を理解する時代が到来したことを意味しています。 比較ゲノム講座では、さまざまな細胞内の情報とリンクして比較ゲノム解析をもとに生物を理解することを目標に研究を進めています。

目次            


    オミックス研究と大量情報処理

生物の全 ゲノム 配列が決定された1995年までの バイオインフォマティクス 研究のメインテーマは、 遺伝情報のコンピュータハンドリングにありました。分子生物学における バイオインフォマティクス の発展の様子をFig. 2-1に示します。 Fig. 2-1では、分子生物学と関連する情報科学研究を赤字で示しています。


現在、 バイオインフォマティクス では、細胞を情報科学のいかにシミュレートするかということが求められています。 つまり、細胞をシステムとして記述すること、生命を RNADNA 、 代謝物質などの生体物質を要素としてシステムとして記述することにあります。 その出発点として、 基質 -生成物、発現制御関係などの要素間の関係を情報科学的に記述することに焦点があてられています。 染色体 一組の全ての DNA 鎖を ゲノム といいます。 真核生物 の場合、 二倍体 染色体 セットのうちの一方を ゲノム というように、「オーム(-ome)」にはまるごとと言う意味があります。 そこで、生物における全体の 遺伝子 を対象とした転写解析をトランスクリプトーム解析、 タンパク質 の場合を プロテオーム 、 さらには 代謝物の場合を メタボローム と呼びます。 ゲノム 配列が決定された生物については、 ゲノム 情報をもとに、 これらのオーム解析が可能になります。これらのオーム解析では、たとえば、トランスクリプトーム解析の場合には、 ある生物における全ての 遺伝子 の発現量をさまざまな条件下で測定し、常に協調して発現する 遺伝子 群を決定することができれば、 細胞内で協調して働くべき機能単位を推定することが可能になるでしょう。 常に協調して発現する 遺伝子 群を決めるための方法として情報科学により提案された種々の 多変量解析法 があります。 また、各々の 遺伝子 における発現プロファイルデータにより適した解析法を提案することも必要とされている。 比較ゲノム学講座では、種々の解析法の原理を正しく理解する情報科学としての知識の習得と新規解析法の提案できる知恵の習得、 ならびに、種々の分子生物学データに適用した場合に得られる結果について分子生物学により解釈し意味づけをするという バイオサイエンスの知識の習得をめざして研究および教育活動を進めています。
Fig. 2-2では、メタゲノム、 ゲノム から表現型(Phenotype)に向かったオーム研究を表しています。 メタゲノム解析は、ある環境中に存在するバクテリア群をまとめて解析することにより、 バクテリアの社会を理解しようとする新しくかつ非常に重要な分野です。 一方、 ゲノム 解析、トランスクリプトーム解析、プロテオーム解析、メタボローム解析、フェノーム解析は、 一つの生物を対象に行われます。また、これらのオーム解析間をつなぐ研究も必要とされています。 比較ゲノム学研究室では、情報科学あるいはバイオサイエンスの両研究科のいずれの学生諸君にも研究をすすめることができるように教育体制を整えております。

目次            


    ゲノム配列に潜む組織化された内部構造

高等生物における、大半の部分が「 ジャンクDNA 」から構成されており、 進化の過程で行き当たりばったりに出来上がってきたと考えられている。 逆説的にも思え極めて興味深い。 木村資生博士の 分子進化の中立説 や大野乾博士の「 ジャンクDNA 」の考えかたの驚きはこの点にある。 勿論、木村博士自身が、まれに生じると考えられる有利な突然変異の重要性を常に指摘されておられた。 最近では、多数の中立変異の内から機能的に有利であるがゆえに集団に広がった突然変異を識別する巧妙な手法が確立してきている。 この方法の確立の過程においても、 中立説 の考えが基盤になっており、 中立説 の分子進化学への寄与の大きさを示す。 中立説 と関係して最近注目を集めてきている課題として、 ゲノム 配列上に存在しているMb(メガベース)レベルでのドメイン的な構造の存在がある。 広範囲の生物種の大量な ゲノム 配列が解読されるにつれ、その組織的な内部構造の実体が明らかになってきている。 そこで、 ゲノム 配列に潜む組織化された内部構造を ゲノム における塩基組成、塩基配列組成(2塩基配列の組成、3塩基配列の組成など)の出現特性、 さらには周期性についての研究を進めています。

単一生物のコドン解析
種固有の性質として ゲノム の塩基配列上に反映される特徴として コドン の使用特性があります。 mRNA翻訳 して ペプチド 鎖をつくるときに、 mRNA 上の3塩基配列を一つのアミノ酸に対応させる関係を コドン といいます。 ここで mRNA を鋳型に タンパク質 を生合成する過程を簡単に説明しましょう。Fig. 7-1は、 ゲノム 上の 遺伝子 の配列情報をもとに 転写翻訳 の過程を経て ペプチド 鎖( タンパク質 )が合成される過程を表しています。まずはじめに、 ゲノム の二本鎖DNA(Fig. 7-1左側) の赤字部分が タンパク質 となる 遺伝子 領域であるとします。 転写 において、赤字部分のDNAと相補的に mRNA が5'→3’の方向で合成されます(Fig. 7-1中央)。 次に、この mRNA をもとに ペプチド 鎖が合成されます(Fig. 7-2右)。このプロセスを 翻訳 といいます。 リボソーム タンパク質 によりこの 翻訳 による ペプチド 合成が達成されます。 mRNA の5’側の特定の位置の3塩基配列(ここでは5’-AUG-3’) と対合できる3塩基配列(3’-UAC-5’)をもつ tRNA によりメチオニンが リボソーム に運ばれます。 続いて、mRNA配列におけるAUGの次の3塩基配列UUCと対合できる3塩基配列(3’-AAG-5’)をもつ tRNA によりセリンが リボソーム 上に運ばれ、 メチオニンとセリンが ペプチド結合 され、2 ペプチド が合成されます。

つづいてUUCの次の3塩基配列と対合できる3塩基配列をもつ tRNA によりアミノ酸が リボソーム に運ばれてさらにセリンと ペプチド結合 により結合するというふうに、 ペプチド 鎖が合成されます。ここで、 mRNA 側の3塩基配列を コドンコドン と対合する tRNA の塩基配列を アンチコドン とよびます。 Fig. 7-2に示すように コドンアンチコドン の対応は、多対一の関係にあります。 池村先生(遺伝研究所名誉教授、現在、長浜バイオ大学教授)の研究(1981; 1982; 1985)で、 ゲノム 上の発現量が常に高い 遺伝子コドン の使用は細胞内で多い tRNA 量の アンチコドン により 翻訳 される傾向があるということが実験的に示されました。 また、細胞内で多量に存在する tRNAゲノム 上で多コピーもつという傾向が知られています。しかし、それぞれの tRNA 量は ゲノム 上のそれぞれの tRNA 量の測定は 大腸菌枯草菌酵母 といった限られた生物についてしかなされていません。種々の生物における ゲノム 決定がなされる時代となったので、 逆に、 ゲノム 情報をもとに 遺伝子 ごとの コドン 使用特性と、それぞれの アンチコドン と対応する tRNA のコピー数を整理すれば、 生物における細胞内の タンパク質 量をおおまかに推定することが原理的には可能であると考えられます。そこで、情報科学の力が必要になります。


それぞれの 遺伝子コドン使用を適切な規格化をしてxi=(xi1, xi2,…, xij,., xiM)のようにベクトルで表現します。 ここで、添え字のiは、第i番目の 遺伝子 を、j=1,2,…,Mは対象とするコドンを表しています。 大腸菌 ゲノム 全体の解析では、約4000個の 遺伝子 が解析の対象となるため、4000個の 遺伝子 がM次元空間にばら撒かれることになります。 人間が把握できる次元は3次元なので、コドンの種類と対応する64次元を把握することは到底不可能です。情報科学の分野では全体の分布の情報を出来る限り欠落させず、 高次元のデータをより低次元におとす方法が種々開発されております。その中で最もシンプルかつ伝統的方法として、 主成分分析法(PCA) があります。 この方法は、多変量空間の中に、最大の分散をもつ変量の線形軸により、データの分布を見る方法です。 大腸菌 ゲノム 上の 遺伝子 について、 コドン使用を適切な規格化をして 遺伝子 の分布を主成分第1軸と第2軸によりプロットした結果をFig. 7-3に示します。 この図で、▲は リボソーム を構成する タンパク質 など発現量が高い遺伝子群、○は水平伝播したと考えられている外来遺伝子です。 つまり、PCAの第一次軸により、外来性の 遺伝子 と発現量が高い 遺伝子 間の識別が可能となりました(Kanaya, 1996)。多くのバクテリアでこのことは成り立ちます(Fig. 7-4)。
微生物、植物、動物など ゲノム 配列が決定された多くの生物の解析を進めた結果、 ゲノム 上の 遺伝子コドン使用に与える影響としては、 [1]複製方向と 遺伝子 の方向の関係、[2]細胞内の tRNA 量、[3] ゲノム 上のGC含量の不均一性の三つに結論づけられることがわかりました。 Fig. 7-5はその要約図で、縦軸は ゲノム 全体の 遺伝子 について主成分第1軸とコドンの第3位置のGC含量の相関、 横軸は ゲノム 全体の 遺伝子 についてコドンの第3位置のGC含量の分散をあらわしています。 ゲノム 全体の 遺伝子 のGC含量の分散が小さいときには、[1]複製方向と 遺伝子 の方向の関係による影響が ゲノム 塩基組成に影響を及ぼし、 その結果、 遺伝子コドン使用にも影響する。また、 ゲノム 全体の 遺伝子 のGC含量の分散が非常に大きいときには、 [3] ゲノム 上のGC含量の不均一性が 遺伝子コドン使用に影響する。これらの中間の位置にあるときには、 [2]細胞内の tRNA 量がコドン使用に影響を及ぼしていると結論付けられます(Kanaya et al., 2001)。


Kanaya, S., Kudo, Y., Nakamura, Y., Ikemura, T., (1996) Detection of gene in Escherichia coli sequences determined by genome projects and prediction of protein production levels, based on multivariate diversity of codon usage, CABIOS, 12, 213-225.


Kanaya, S., Yamada, Y., Kudo, Y. Ikemura, T., (1999) Studies of codon usage and tRNA genes of 18 unicellular organisms and quantification of Bacillus subtlis tRNAs, Gene, 238, 143-155.
Nakayama, K., Kanaya, S., Ohnishi, M., Terawaki, Y., Hayashi, Y., (1999) The complete nucleotide seuqence of phaiCTX, a cytotoxin-converting phage of Pseudomonas aeruginosa: implications for phage evolution and horizontal gene transfer via bacteriophages, Mol. Micorobiol., 31, 399-419.
Nakayama, K., Takashima, K., Ishinara, H., Shinomiya, T., Kageyama, M., Kanaya, S., Ohnishi, M., Murata, T., Mori, H., Hayashi, T., (2000) The R-type pyocin of Pseudomonas aeruginosa is related to P2 phage, and the F-type is related to lambda phage, Mol. Microbiol., 38, 213-231.
Hamada, K., Horiike, T., Kanaya, S, Nakamura, H., Ota, H., Yatogo, T., Okada, K., Nakamura, H., Shinozawa, T., (2002) Changes in body temperature pattern in vertebrates do not influnece the codon usages of alpha-globin genes, Genes Genet. System., 77, 197-207.
Kanaya, S. Yamada, Y., Kinouchi, M., Kudo, Y., Ikemura, T (2001) Codon usage and tRNA genes in eukaryotes: correlation of codon usage diversity with translation efficiency and with CG-dinucleotide usage as assessed by multivariate analysis, J.Mol.Evol., 53, 290-298.


生物間のコドン比較解析
生物の ゲノム における 遺伝子コドン使用の多様性は、それぞれのコドン使用特性をそれぞれのコドン使用頻度によりベクトルで表現し、 主成分分析 を行うことにより達成されました。近年、非常に多数の ゲノム 配列が決定されているなかで、非常に多数の生物種を対象とした比較 ゲノム 解析が必要とされています。 そこで、種々の方法を検討した結果、現在のところ 自己組織化地図法(Self-organizing Mapping; SOM) がこのニーズに耐えうる分解能を有することがわかりました。 そこで、比較ゲノム学研究室では、 自己組織化法を ゲノム解析あるいはポストゲノム解析に特化した形式に改良し、 新たにバッチラーニング SOM(BL-SOM) を開発しました(Kanaya et al., 2001)。 BL-SOM のアルゴリズムは、第13章 多変量解析 を参照願います。 BL-SOM のプログラムは、http://kanaya.aist-nara.ac.jp/SOM/より無償でダウンロードできます。
Fig. 7-6に SOM の概念図を示します。まずはじめに、各々の 遺伝子コドン使用頻度によりベクトルで表現します。それぞれのコドン使用頻度を変量とよびます。 いま、終止コドンを除く61種のコドンの使用頻度をベクトルで表現する場合、61種の変量が定義されることになります。 それぞれの 遺伝子 は、この61次元空間の中で一つの点で表されます(Fig. 7-6a)。 遺伝子 のことを図中では対象として記述されています。




つぎに、二次元格子状に配置あされた代表ベクトルをこの61次元空間の中に設定し、 遺伝子 (対象)の分布の様子を出来る限り反映するように、 代表ベクトルを配置します(Fig. 7-6b)。この代表ベクトルの設定法について、比較ゲノム学研究室では新たな方法を提案しました。 代表ベクトルが適切に配置された後、それぞれの対象のベクトルを最も近い代表ベクトルに分類します。 これがFig. 7-6cの二段目に対応します。いま、代表ベクトルは二次元格子状に配置されているので、この二次元格子状の配置にしたがって、 同じ格子点あるいは近くの格子点に分類された対象は、非常に類似性の高いコドン使用ベクトルを有していることになります。 そこで、対象の性質により色分けをすることにより、データの分布と対象の性質の関係が二次元的に視覚で理解することが可能になります (Fig. 7-6d;対象の分類による特徴地図)。対象を 遺伝子 、また、色分けをそれぞれの生物種と対応付けると、それぞれの生物の 遺伝子 の分布がクラスターを形成するのか、 あるいは、他の生物の 遺伝子 と非常に似た傾向にあるのかがこの地図を通して理解することが可能となります。 Fig. 7-6c右中央は代表ベクトルのそれぞれの変量の値が大きい場合を赤色、小さい場合を青色のようにして地図を作成しました(Fig. 7-6e;変量による特徴地図)。 例えば、対象の分類による特徴地図(Fig. 7-6d)におけるaに分類された 遺伝子 は、すべてオレンジ色の微生物由来である。

では、;変量による特徴地図においてaの分類された格子点の特徴をみると、第一番目の変量では赤、第2番目の変量は赤、 第3番目の変量は青、…となっています。すなわち、第1番目と第2番目の変量と対応するコドン使用頻度は低い、 第3番目の変量と対応するコドン使用頻度は高いというふうに対象の分布と変量と関連づけて説明することが可能となります。 また、変量間が類似性も変量による特徴地図を見比べれることにより可能となります。 Fig. 7-7とFig. 7-8はPCAとBL-SOMそれぞれの方法によりコドン使用頻度ベクトルにより 遺伝子 を分類し、 同じ生物種のみが分類される格子点を生物ごとに色分けした特徴地図を現しています。BL-SOMを用いた場合、生物種固有の領域を非常に明確に規定することが可能となります。 黒で塗りつぶされた領域は複数の生物の 遺伝子 が混在する領域をあらわしています。 真性細菌 ならび 古細菌遺伝子 は、それぞFig. 7-8の上側(緑色) ならびに下側(黄色)に分布する傾向にあります。また、高熱性真性細菌はこれらの中間に存在する傾向にあるという結果が得られました。 このように、 BL-SOM により、生物種固有の コドン 使用特性を体系的に理解することが可能となりました。また、地図上にそれぞれの生物の領域をもとに、 生物間での 遺伝子 の伝播の可能性についての手がかりを得ることが可能となりました(Fig. 7-9)。 コドン 使用頻度からオリゴヌクレオチド頻度による ゲノム に潜在する生物種固有の特徴解析については、 長浜バイオ大学の阿部先生ならびに池村先生のグループで積極的に進められています。



Kanaya, S., Kinouchi, M., Abe, T., Kudo, Y., Yamada, Y., Nishi, T., Mori, H., Ikemura, T., (2001) Analysis of codon usage diversity of bacterial genes with a self-organizing map (SOM): characterization of horizontally transferred genes with emphasis on the E. coli O157 genome, Gene, 276, 89-99.
Abe, T., Sugawara, H., Kinouchi, M., Kanaya, S., Ikemura, T., (2005) Novel phylogenetic studies of genomic sequence fragments derived from uncultured microbe mixtures in environmental and clinical samples, DNA Res., 12, 281-290.
Abe, T., Kanaya, S., Kinouchi, M., Ichiba, Y., Kozuki, T., Ikemura, T., (2006) Informatics for unveiling hidden genome signatures, Genome Res., 13, 693-702.
Abe, T., Sugawara, H., Kanaya, S., Ikemura, T., (2006) Sequences from almost all prokaryotic, eukaryotic, and viral genomes available could be classified according to genomes on a large-scale self-organizing map constructed with the earth simulator, J. Earth Simulator, 6, 17-23.
Abe, T., Sugawara, H., Kanaya, S., Kinouchi, M., Ikemura, T., (2006) Self-organizing map (SOM) unveils and visualizes hidden sequence characteristics of a wide range of eukaryote genomes, Gene, 365, 27-34.



ゲノムにおける非B型DNA構造の分布:ポリプリン,ポリピリミジン配列の特徴
ポリプリン/ポリピリミジン配列は、3重鎖に代表される特殊な立体構造を ゲノム 中でとることにより、 転写 や複製に影響を及ぼすことが示唆されています。 そこで、約250種以上のバクテリア、ヒト、マウスといった高等真核生物の ゲノム 配列もとにポリプリン/ポリピリミジン配列の出現頻度特性の解析を進めています。





Ohno, M., Tenzen, T., Watanabe, Y., Yamagata, T., Kanaya, S., Ikemura, T., (2000) Non-B DNA structures spatially and sequence-specifically associated with individual centromeres in the human interphase nucleus, Chromosomes Today, 13, 57-69.
Kanaya, S., Fukagawa, T., Ando, A., Inoko, H., Kudo, Y., Ikemura, T., (2000) Distribution of polypurine/polypyrimidin tract sequences in the human MHC region and their possible functions. Major Histocompatibility Complex: Evolution, Structure, and Function, pp.131-145.
田中宏幸 (2006) Polypurine/polypyrimidine配列の比較ゲノム解析(NAIST-IS-MT0451134)



制限酵素の切断配列のゲノム塩基配列における存在特性解析
さらに、バクテリアについて所有する 制限酵素 による認識部位が ゲノム 上で抑制されているか否かについての解析についても現在進行中です。




山倉健 (2007)制限酵素の認識配列におけるゲノム戦略(NAIST-IS-MT05551127)



パワースペクトル解析
上述では大量な ゲノム 配列が解読されたことに伴って判明してきた ゲノム の新しい性質の解説と、 それを生んだ分子進化過程を解明するための数理科学的研究の可能性を紹介した。 生命の起源や進化の問題を自己組織あるいは複雑系という立場から解明しようとする試みは、 スチュアート・カウフマンに代表される様々な分野の研究者による試みが有名であり、その一つの課題に ゲノム 配列内に潜む組織構造を理解する研究があげられる。 現在、微生物のみならず高等真核生物を含む生物の ゲノム 配列が解読されており、 現実の ゲノム 配列内に存在する周期構造や組織構造の実体を理解することが可能となりつつある。 以下に、DNAを構成する4種の塩基(A, T, G, C)の周期性の解析とヒトゲノムの組織的構造の分子生物学的な解釈についての研究の実例を紹介する。 ゲノム に対して、周期性など統計的性質に注目した解析法の一つにパワースペクトル解析、数字列を周波数空間に変換する方法があります。 このパワースペクトル法を塩基配列に適用するために、塩基配列を数字列に変換することが必要になる。 塩基配列を{s1, s2,……, sj, ……, sN}とする。sjがAであるときにxj =1、A以外の塩基であるときにxj =0とすることにより、 塩基Aについてビット列{x1, x2,……, xj, ……, xN}を得ることができる。このビット列に対するパワースペクトルは下式により表現できる

ここで、 i2=-1, fj=j/N (j=0, …,N-1)である。
数字列を2n個の部分配列に分割することにより得られたパワースペクトル を 平均することによりパワースペクトル を求める.平均パワースペクトルは次式に従って行った。



Fig. 7-10に微生物ならびに高等真核生物のパワースペクトル(n=1024)を示す。全ての微生物ゲノムにおいて3塩基周期(周波数f=1/3)が、 また、微生物 ゲノム の大半で、10-11塩基周期が得られる。前者は 遺伝暗号コドン )により説明でき、 また、後者はDNAのへリックス構造(10.55ア・.01 塩基)と関係づけれます。好高熱性真性細菌や 古細菌 では10塩基周期をもつが、 この周期は, 酵母(S. cerevisiae), 線虫(C. elegans),およびシロイズナズナ(A. thaliana)でも観測される。 一方, 真性細菌 では11塩基周期をもつ傾向にあります。 古細菌 および真核生物の ゲノムヒストン蛋白質 に巻き込まれて ヌクレオソーム構造 をとり、 また、 真性細菌ゲノム はこのような ヌクレオソーム構造 をとらないことが知られています。 このような細胞内での ゲノム の存在様式の違いが塩基配列の周期性の差として潜在的に反映されていることが示唆されます。
パワースペクトルにより得られるパワーの対数 (log S(f))を縦軸に、周波数の対数(log(f))を横軸にとることにより得られる傾き(D=log S(f)/log(f) )は 進化と関係した ゲノム の性質に基礎知識を与えることが可能です。いま,傾きD=0のときこのスペクトルはホワイトノイズであり、 傾きD=-・である場合にはランダムウォークの状態であり、進化学的に見るとランダム変異に対応する。 塩基配列にフラクタル性が潜んでいる場合には傾きDが-・に近づきます。このことは、部分的には進化における選択圧により説明できます。 ヒト染色体において,105塩基周期以上(f < 10-5)と104 から105 塩基周期の二つの領域で傾きが異なることがFig. 7-11に示されております。 これらの二つの領域のそれぞれに対して、スペクトルの傾きa、bを求め、 ゲノム G+C%と二つの傾き(aとb・の関係をFig. 7-11に示します。 傾きaはG+C%に関わりなく全ての染色体においてほぼ一定である、一方、傾きbは ゲノム G+C%と相関があることがわかります。
ゲノム 上における10-100 kbからなる構造体は、 遺伝子 の大きさに概略として対応する. G+C%が高いヒト染色体,例えば第19番と第22番染色体のG+C%はそれぞれ49%および48%であり、 遺伝子密度は1Mbあたり23および17 遺伝子 であり、一方、第4番と第13番染色体のGC%は38%であり、遺伝子密度はそれぞれ6および7 遺伝子 と低い。 このように ゲノム G+C%は遺伝子密度と関連する。G+C%が高い染色体ほど傾きbは-・に近づくことから、 遺伝子密度が ゲノム のフラクタル性に関連しているのではないかということが示唆されました。 この研究の詳細は、福島敦君の博士論文(Fukushima, 2003)に述べられています。


Fukushima, A., Ikemura, T., Kinouchi, M., Oshima, T., Kudo, Y., Mori, H., Kanaya, S., (2002), Periodicity in prokaryotic and eukaryotic genomes identified by power spectrum analysis, Gene, 300, 203-211.
Fukushima, A., Ikemura, T., Oshima, T., Mori, H., Kanaya, S., (2002), Detection of periodicity in eukaryotic genomes on the basis of power spectrum analysis, Genome Informatics, No. 13, 21-29.
Fukushima, A., Ikemura T., Kanaya, S., Comparative genome analysis focused on periodicity from prokaryote to higher eukaryotes genomes based on power spectrum, J. Comput. Chem. Jpn., 2, 95-110.
Fukushima, A., (2003) Periodicity in genome architecture from bacteria to humans. The Graduate School of Biological Sciences, NARA INSTITUTE of Science and Technology, (Doctor Dissertation)

目次