| 1.研究機関名 | 東京大学 | |
| 2.研究領域 | 理工 | |
| 3.研究分野 | 知能情報・高度情報処理 | |
| 4.研究期間 | 平成8年度〜平成12年度 | |
| 5.研究プロジェクト番号 | 96P00502 | |
| 6.研究プロジェクト名 | 自然言語の処理と理解に関する研究 |
| プロジェクト・リーダー名 | フリガナ | 所属部局名 | 職名 |
| 辻井 潤一 | ツジイ ジュンイチ | 大学院理学系研究科 | 教授 |
8.コア・メンバー
| コア・メンバー名 | フリガナ | 所属研究機関名・所属部局名 | 職名 |
| 大江 和彦 | オオエ カズヒコ | 東京大学・大学院医学系研究科 | 教授 |
| 黒橋 禎夫 | クロハシ サダオ | 京都大学・大学院情報学研究科 | 講師 |
| 徳永 健伸 | トクナガ タケノブ | 東京工業大学・大学院情報理工学研究科 | 助教授 |
9.研究協力者
| 研究協力者名 | フリガナ | 所属研究機関名・所属部局名 | 職名 |
| 白井 清昭 | シライ キヨアキ | 東京工業大学・大学院工学系研究科 | 助手 |
| 建石 由佳 | タテイシ ユカ | 東京大学・大学院理学系研究科 | ポスドク |
| 美馬 秀樹 | ミマ ヒデキ | 東京大学・大学院理学系研究科 | ポスドク |
10.研究成果の概要
|
ネットワーク時代における情報収集の効果的な手法を確立することを目指し、言語処理・理解の基盤的な手法、および、知的情報検索・抽出の研究を行った。言語処理の要素技術としては、(1)言語処理の要素技術として、米国・ドイツ・英国の研究グループと共同し、言語学的に洗練された文法フォーマリズムHPSGを使った高速・高効率の文解析手法を開発、現時点で世界で最高速度の処理効率を達成した。(2)この処理手法によって文解析を行うための大規模文法を構築する手法として、文法の等価変換の手法を考案し、大規模LTAG文法のHPSGへの変換を行い、英語大規模文法を開発した。(3)Underspecifiedな文法記述というアイデアを日本語文法に適用し、高耐性の文法SLUNG、および、各種の発見的手法を活用するKNPという2つの文法を作成した。KNPは、現時点で最高の精度を持つ日本語解析文法となっている。 また、これら要素技術を系統的に開発するために、構造付きの言語コーパス(京大コーパス)の作成、タグ付与のためのソフトウェアの開発(TMIS)を行い、一般に公開した。これらの言語資源は、現在多くの研究グループに活用されている。 プロジェクト後半には、要素技術を統合した応用システムの研究を行い、上記で開発した文解析方式が有効なことをゲノムサイエンス分野からの情報抽出システムを構築することで実証した。また、文構造の解析をもとに検索語選定を行う知的情報検索システム、テキストデータベースを知識源とする対話システム(計算機システムのコンサルテーション・システム)を構築し、言語処理技術がネットワーク時代の有効な情報収手段を提供することを実証した。 |
11.キーワード
(1)情報検索、(2)情報抽出、(3)知識獲得
(4)専門用語抽出、(5)意味情報付コーパス、(6)オントロジー獲得
(7)知的検索システム、(8)間テキスト的文脈処理、(9)バイオインフォマティックス
12.研究発表(印刷中も含む)
| 著者名 | 論文標題 | |||
| Jun-ichi Tsujii | Generic NLP Technologies: Language, Knowledge and Information Extraction | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| The 38th Annual Meeting of the ACL | 2000 | |||
| 著者名 | 論文標題 | |||
| Katerina. T. Frantzi, Sophia Ananiadou and Hideki Mima | Automatic Recognition of Multi-Word Terms: the C-value/NC-value method | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| International Journal on Digital Libraries | 3-2 | 2000 | pp.115-130 | |
| 著者名 | 論文標題 | |||
| Yusuke Miyao, Takaki Makino, Kentaro Torisawa and Jun'ichi Tsujii | The LiLFeS abstract machine and its evaluation with the LinGO grammar | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| Journal of Natural Language Engineering, Cambridge University Press | 6(1) | 2000 | pp.47-62 | |
| 著者名 | 論文標題 | |||
| Kentaro Torisawa, Kenji Nishida, Yusuke Miyao and Jun'ichi Tsujii | An HPSG parser with CFG Filtering | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| Journal of Natural Language Engineering, Cambridge University Press | 6(1) | 2000 | pp.63-80 | |
| 著者名 | 論文標題 | |||
| Nigel Collier, Chikashi Nobata and Jun-ichi Tsujii | Extracting the Names of Genes and Gene Products with a Hidden Markov Model | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| 18th COLING | 2000 | pp.201-207 | ||
| 著者名 | 論文標題 | |||
| Akane Yakushiji, Yuka Tateisi, Yusuke Miyao and Jun-ichi Tsujii | Event Extraction From Biomedical Papers Using A Full Parser | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| Pacific Symposium on Biocomputing2001 | 2001 | pp.408-419 | ||
| 著者名 | 論文標題 | |||
| Daisuke Kawahara and Sadao Kurohashi | Japanese Case Frame Construction by Coupling the Verb and its Closest Case Component | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| Human Language Technology Conference(HLT 2001), | 2001 | |||
| 著者名 | 論文標題 | |||
| Sadao Kurohashi and Manabu Ori | Nonlocal Language Modeling based on Context Co-occurrence Vectors | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| The 2000 Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora | 2000 | pp.80-86 | ||
| 著者名 | 論文標題 | |||
| Sadao Kurohashi and Wataru Higasa | Dialogue Helpsystem based on Flexible Matching of User Query with Natural Language Knowledge Base | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| 1st ACL SIGdial Workshop on Discourse and Dialogue | 2000 | pp.141-149 | ||
| 著者名 | 論文標題 | |||
| Sadao Kurohashi, and Yasuyuki Sakai | Semantic Analysis of Japanese Noun Phrased : A New Approach to Dictionary-Based Understanding | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| 37th Annual Meeting of the Association for Computational Linguistics (ACL99) | 1999 | pp.481-488 | ||
| 著者名 | 論文標題 | |||
| Sadao Kurohashi and Makoto Nagao | Building a Japanese Parsed Corpus while Improving the Parsing System | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| The First International Conference on Language Resources & Evaluation | 1998 | pp.719-724 | ||
| 著者名 | 論文標題 | |||
| Rila Mandala, Takenobu Tokunaga and Hozumi Tanaka | The exploration and analysis of using multiple thesaurus types for query expansion in information retrieval | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| Journal of Natural Language Processing | 7-2 | 2000 | pp.117-140 | |
| 著者名 | 論文標題 | |||
| Rila Mandala, Takenobu Tokunaga and Hozumi Tanaka | Query expansion using heterogeneous thesauri | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| Information Processing and Management | 36-3 | 2000 | pp.361-378 | |
| 著者名 | 論文標題 | |||
| Takenobu Tokunaga, Hironori Ogibayashi and Hozumi Tanaka | Effectiveness of complex index terms in information retrieval | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| The 6th RIAO Conference(RIAO 2000) | 2000 | pp.1322-1331 | ||
| 著者名 | 論文標題 | |||
| 岩山 真、徳永 健伸 | 確率モデルに基づくパッセージ分類とその応用 | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| 自然言語処理 | 6(3) | 1999 | 181-198 | |
| 著者名 | 論文標題 | |||
| 岩山 真、徳永 健伸 | 確率的クラスタリングを用いた文書連想検索 | |||
| 雑誌名 | 巻 | 発行年 | ページ | |
| 自然言語処理 | 5(1) | 1998 | 101-118 | |
| 著者名 | 出版者 | ||
| 徳永 健伸 | 東大出版 | ||
| 書名 | 発行年 | 総ページ数 | |
| 情報検索と言語処理 | 1999 | 234 | |