平成12年度未来開拓学術研究推進事業研究成果報告書概要



1.研究機関名 東京大学
 
2.研究領域 理工
 
3.研究分野 マルチメディア高度情報通信システム
 
4.研究期間 平成8年度〜平成12年度
 
5.研究プロジェクト番号 96P00605
 
6.研究プロジェクト名 マルチメディア通信システムにおける多国語処理の研究

7.プロジェクト・リーダー
プロジェクト・リーダー名 フリガナ 所属部局名 職名
田村 毅 タムラ タケシ 大学院人文社会系研究科 教授

8.コア・メンバー

コア・メンバー名 フリガナ 所属研究機関名・所属部局名 職名
山口 明穂 ヤマグチ アキホ 中央大学・文学部 教授
青柳 正規 アオヤギ マサノリ 東京大学・大学院人文社会系研究科 教授
片山 英男 カタヤマ ヒデオ 東京大学・大学院人文社会系研究科 教授

9.研究協力者

研究協力者名 フリガナ 所属研究機関名・所属部局名 職名
長島 弘明 ナガシマ ヒロアキ 東京大学・大学院人文社会系研究科 教授
大木 康 オオキ ヤスシ 東京大学・大学院人文社会系研究科 助教授
越塚 登 コシヅカ ノボル 東京大学・情報基盤センター 助教授

10.研究成果の概要

本研究プロジェクトの当面の目標は日本語でかつて使用された総ての漢字を同定し、整理番号を振ることであった。この目標は汎用性のあるTrueType形式による「GT書体2000」フォント・セットとして74,086字の漢字フォントを制作し公開することでひとまず達成された。「GT書体2000」フォント・セットの公開にあたっては、漢字検索の便宜のために属性データ(通し番号、音訓、画数、部首、構成要素、JISコード、UNICODE、大漢和番号)を網羅した検索用漢字データベースを同時に発表した。さらに、漢字構成要素として文字そのものとは別個に10,486点のエレメントを制作発表し、漢字検索と漢字入力の便を図った。
 本研究プロジェクトは、これらの基盤の上に多国語文字資料を電子化することを最終目標としていたが、この目標についても、高精細画像データと低精度文字変換データをリンクするデータベース形式を案出し、まず大部のフランス語によるラルース『19世紀大辞典』を全文検索可能なデータベースとして東京大学文学部サーバー上で試験運用した後に、あらゆる漢字辞典の規準である『康煕字典』の印影画像を「GT書体2000」フォントの漢字を用いて索引付けしたデータベースを制作発表した。
 研究成果としてのこれらのフォント及びデータベースはWWW上に公開されているが、一部は商業出版物としても公刊されている。本研究プロジェクトのメンバーは研究プロジェクトの終了後も、これらのデータの修正と維持を継続する所存である。

11.キーワード

(1)多国語、(2)漢字、(3)フォント
(4)テクストデータ、(5)画像データ、(6)全文検索
(7)文字読み取り、(8)データバンク、(9)通信システム

12.研究発表(印刷中も含む)

[雑誌論文]
著者名 論文標題
田村 毅 活字から電子文字へ-まずは漢字6万字の電子化を目指して-
雑誌名 発行年 ページ
坂村健(編)『デジタルミュージアム 電脳博物館-博物館の未来』   1997 36

著者名 論文標題
田村 毅 漢字六万四千字フォントセット公開に向けて
雑誌名 発行年 ページ
平凡社編『電脳文化と漢字のゆくえ』   1998 188-200

著者名 論文標題
長島 弘明 清書できないワープロ、劣化したデジタル資料
雑誌名 発行年 ページ
平凡社編『電脳文化と漢字のゆくえ』   1998 145-156

著者名 論文標題
山口 明穂 文字と文化 -マルチメディア通信システムにおける多国語処理プロジェクトの紹介
雑誌名 発行年 ページ
日本学術振興会編『学術月報』 657 1998 17-21

著者名 論文標題
大木 康 漢籍の国際的連合目録
雑誌名 発行年 ページ
日本学術振興会編『学術月報』 657 1998 54-57

[図書]
著者名 出版者
山口 明穂(監修) 小学館
書名 発行年 総ページ数
新撰漢字総覧 2001 715+779

著者名 出版者
日本学術振興会 システムソフト
書名 発行年 総ページ数
19世紀ラルース大辞典(DVD-ROM) 2001  


戻る