日本学術振興会

第39回国際生物学賞 受賞者について

リチャード・ダービン 博士 (Dr. Richard Durbin)

リチャード・ダービン 博士 (Dr. Richard Durbin)

略歴

1987年     ケンブリッジ大学MRC分子生物学研究所(Ph.D.) 
1986年 - 1988年 キングスカレッジ生物情報処理リサーチフェロー
1988年 - 1990年 スタンフォード大学心理学部門ルシル・P・マーキー客員研究員
1990年 - 1996年 MRC分子生物学研究所スタッフメンバー
1993年 - 2017年 ウェルカム・サンガー研究所シニアグループリーダー
2017年 - 現在   ケンブリッジ大学遺伝学部門アル・キンディー教授
2017年 - 現在   ウェルカム・サンガー研究所アソシエイトファカルティーメンバー

栄誉歴

1994年 英国王立協会ムラード賞
2004年 英国王立協会フェロー
2004年 英国科学技術基金(Foundation for Science and Technology)
    キルゲラン・ロイド卿賞(Lord Lloyd of Kilgerran Award)
2009年 欧州分子生物学機構メンバー
2011年 国際情報生物学会フェロー
2016年 国際スティーブン・ホーゲンダイク賞
2017年 英国王立協会ガボールメダル
2019年 米国芸術科学アカデミー国際名誉会員

研究業績

 リチャード・ダービン博士は、ゲノム生物学分野において革新的な技術を多数開発するとともに、数多くの国際研究プロジェクトを主導してきた。とりわけ、生物学と情報学の融合領域であるバイオインフォマティクス分野の先駆者の一人として、ゲノムデータに基づいた生物学研究に必須となる情報解析手法、データベース、フォーマットなどを次々に開発してきた。またこれと並行して、ダービン博士は、ゲノム生物学分野においてマイルストーンとなった数々のゲノム解析プロジェクトにおいて、30年以上にわたってリーダーシップを発揮してきた。
 ダービン博士のゲノム生物学における初期の重要な功績として、初めて明らかになった動物の完全ゲノム配列、すなわち線虫ゲノム配列の解析プロジェクトを、その基盤となるデータベースを開発するなどデータ解析・データ処理の観点からリードしたことが挙げられる。またダービン博士は、ゲノムデータの解析において現在でも極めて重要な、隠れマルコフモデルと呼ばれる情報解析手法に関わる一連の技術開発を行った。これらの研究成果のうち、例えばタンパク質ファミリードメインのPfamデータベースはゲノム生物学分野で現在でも広範に使われており、幅広い分子生物学研究の基盤となっている。これらの技術は、ゲノム生物学において最も重要な成果の一つであるヒトゲノム配列の解析においても活用され、重要な役割を果たした。ダービン博士は、ヒトゲノムプロジェクトにおいても、ゲノム中のタンパク質をコードする遺伝子を同定するグループを率いるなどの中心的な貢献を行なっている。さらには、本分野における重要な教科書の一つ『Biological Sequence Analysis(訳書名:バイオインフォマティクス-確率モデルによる遺伝子配列解析)』を出版し、教育に大きく貢献したことも特筆される。
 ヒトゲノム配列の決定後、ダービン博士は、ヒトなど単一の生物種内のゲノムの多様性を研究する集団ゲノム解析の重要性に早くから着目し、初期の酵母集団ゲノム解析研究を行うなど、一貫してゲノム生物学研究の方向性を先導してきた。また、超並列シーケンス技術がゲノム生物学に登場し、データ量が急激に増大した中で、ダービン博士は、この新技術によって生み出される膨大なデータを効率的にゲノム配列に対応づけて解析するための情報解析手法の研究に取り組み、現在もゲノム生物学分野において広く使われているbwaソフトウェアを開発した。ダービン博士はその後も、人類集団のゲノムの多様性を明らかにする1000人ゲノムプロジェクトやUK10Kプロジェクトを共同で主導してきた。
 これと並行してダービン博士は、ゲノム生物学分野におけるデータフォーマットとして標準となっているSAM/BAMやVCFフォーマットや、ゲノム配列上の変異や多型を効率的に同定するためのソフトウェアなど、ゲノム生物学における重要な情報解析手法を数多く開発してきた。さらに近年では、集団遺伝学の理論・手法開発にも貢献しており、限られたゲノムデータから集団の歴史を推測する強力な情報解析手法であるPSMC及びMSMCを開発した。この手法によって、非アフリカ系人類がアフリカを離れた約5万年前に、人類集団が集団サイズを減らすボトルネックと呼ばれる現象が起こったことが明らかになるなど、ダービン博士の功績は生物学の枠を越えて考古学などの領域へも大きな影響を与えている。さらに近年では、地球上に存在する多様な生物の網羅的なゲノム配列解析プロジェクトなどに取り組むなど、様々な国際研究プロジェクトにおいてリーダーシップを発揮しており、今後もさらなるゲノム生物学分野への貢献が期待される。

代表的な論文及び著書

  1. “Towards complete and error-free genome assemblies of all vertebrate species” Rhie A, [121 authors], Howe K*, Myers EW*, Durbin R*, Phillippy AM*, Jarvis ED*. Nature 592:737-746 (2021) 
  2. “Haplotype-aware graph indexes”, Sirén J, Garrison E, Novak AM, Paten B, Durbin R. Bioinformatics 36:400-407 (2020)
  3. “Variation graph toolkit improves read mapping by representing genetic variation in the reference”, Garrison E, Sirén J, Novak AM, Hickey G, Eizenga JM, Dawson ET, Jones W, Garg S, Markello C, Lin MF, Paten B, Durbin R. Nat Biotechnol. 36:875-879 (2018) 
  4. “Whole-genome sequences of Malawi cichlids reveal multiple radiations interconnected by gene flow”, Malinsky M, Svardal H, Tyers AM, Miska EA, Genner MJ, Turner GF, Durbin R. Nat Ecol Evol. 2:1940-1955 (2018)
  5. “Health and population effects of rare gene knockouts in adult humans with related parents”. Narasimhan VM, [33 authors], Durbin R*, van Heel DA*. Science 352:474-7 (2016)
  6. “The UK10K project identifies rare variants in health and disease”, UK10K Consortium, Walter K, Min JL, Huang J, Crooks L, Memari Y, McCarthy S, Perry JR, Xu C, Futema M, Lawson D, Iotchkova V, Schiffels S, Hendricks AE, Danecek P, Li R, Floyd J, Wain LV, Barroso I, Humphries SE, Hurles ME, Zeggini E, Barrett JC, Plagnol V, Richards JB, Greenwood CM, Timpson NJ, Durbin R*, Soranzo N*. Nature 526:82-90 (2015)
  7. “Efficient haplotype matching and storage using the positional Burrows-Wheeler transform (PBWT)”, Durbin R. Bioinformatics 30:1266-72 (2014) 
  8. “Insights into hominid evolution from the gorilla genome sequence”, Scally A, (67 others), Tyler-Smith C, Durbin R. Nature 483:169-175 (2012)
  9. “Inference of human population history from individual whole-genome sequences”, Li H, Durbin R, Nature 475:493-6 (2011)
  10. “Efficient construction of an assembly string graph using the FM-index”, Simpson JT, Durbin R.  Bioinformatics. 26:i367-73 (2010)
  11. “A map of human genome variation from population-scale sequencing”, 1000 Genomes Project Consortium (Durbin R corresponding author). Nature 467:1061-73 (2010)
  12. “The Sequence Alignment/Map (SAM) Format and SAMtools”, Li H, Handsacker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R, 1000 Genomes Data Processing Group Bioinformatics 25:2078-9 (2009)
  13. "Fast and accurate short read alignment with the Burrows-Wheeler transform", Li H and Durbin R. Bioinformatics 25:1754-1760 (2009)
  14. “Population genomics of domestic and wild yeasts”, Liti G*, Carter DM*, Moses AM, Warringer J, Parts L, James SA, Davey RP, Roberts IN, Burt A, Koufopanou V, Tsai IJ, Bergman CM, Bensasson D, O'Kelly MJ, van Oudenaarden A, Barton DB, Bailes E, Nguyen AN, Jones M, Quail MA, Goodhead I, Sims S, Smith F, Blomberg A, Durbin R*, Louis EJ*. Nature 458:337-341 (2009)
  15. "Initial sequencing and analysis of the human genome". International Human Genome Sequencing Consortium.  Nature 409:860-921 (2001) (lead author for section on protein coding genes)
  16. “Genome Sequence of the Nematode C. elegans: A Platform for Investigating Biology”, The C.elegans Sequencing Consortium.  Science 282:2012-2018 (1998) (lead author for the sequence analysis section)
  17. “Biological Sequence Analysis: probabilistic models of proteins and nucleic acids", R.Durbin, S.Eddy, A.Krogh, G.Mitchison.  Cambridge University Press pp1-344 (1998).
  18. "Pfam: A Comprehensive Database of Protein Families Based on Seed Alignments", E.L.L. Sonnhammer, S.R. Eddy, R. Durbin, Proteins 28:405-420, (1997)
  19. “The ACEDB genome database”, R Durbin and J Thierry-Mieg, pp 45-56 in “Computational Methods in Genome Research”, ed S Suhai, Plenum (1994)
  20. “RNA sequence analysis using covariance models”, SR Eddy and R Durbin, Nucleic Acids Research 22:2079-2088 (1994)