平成12年度未来開拓学術研究推進事業研究成果報告書概要



1.研究機関名 東京大学
 
2.研究領域 理工
 
3.研究分野 知能情報・高度情報処理
 
4.研究期間 平成8年度〜平成12年度
 
5.研究プロジェクト番号 96P00502
 
6.研究プロジェクト名 自然言語の処理と理解に関する研究

7.プロジェクト・リーダー
プロジェクト・リーダー名 フリガナ 所属部局名 職名
辻井 潤一 ツジイ ジュンイチ 大学院理学系研究科 教授

8.コア・メンバー

コア・メンバー名 フリガナ 所属研究機関名・所属部局名 職名
大江 和彦 オオエ カズヒコ 東京大学・大学院医学系研究科 教授
黒橋 禎夫 クロハシ サダオ 京都大学・大学院情報学研究科 講師
徳永 健伸 トクナガ タケノブ 東京工業大学・大学院情報理工学研究科 助教授

9.研究協力者

研究協力者名 フリガナ 所属研究機関名・所属部局名 職名
白井 清昭 シライ キヨアキ 東京工業大学・大学院工学系研究科 助手
建石 由佳 タテイシ ユカ 東京大学・大学院理学系研究科 ポスドク
美馬 秀樹 ミマ ヒデキ 東京大学・大学院理学系研究科 ポスドク

10.研究成果の概要

ネットワーク時代における情報収集の効果的な手法を確立することを目指し、言語処理・理解の基盤的な手法、および、知的情報検索・抽出の研究を行った。言語処理の要素技術としては、(1)言語処理の要素技術として、米国・ドイツ・英国の研究グループと共同し、言語学的に洗練された文法フォーマリズムHPSGを使った高速・高効率の文解析手法を開発、現時点で世界で最高速度の処理効率を達成した。(2)この処理手法によって文解析を行うための大規模文法を構築する手法として、文法の等価変換の手法を考案し、大規模LTAG文法のHPSGへの変換を行い、英語大規模文法を開発した。(3)Underspecifiedな文法記述というアイデアを日本語文法に適用し、高耐性の文法SLUNG、および、各種の発見的手法を活用するKNPという2つの文法を作成した。KNPは、現時点で最高の精度を持つ日本語解析文法となっている。
 また、これら要素技術を系統的に開発するために、構造付きの言語コーパス(京大コーパス)の作成、タグ付与のためのソフトウェアの開発(TMIS)を行い、一般に公開した。これらの言語資源は、現在多くの研究グループに活用されている。
 プロジェクト後半には、要素技術を統合した応用システムの研究を行い、上記で開発した文解析方式が有効なことをゲノムサイエンス分野からの情報抽出システムを構築することで実証した。また、文構造の解析をもとに検索語選定を行う知的情報検索システム、テキストデータベースを知識源とする対話システム(計算機システムのコンサルテーション・システム)を構築し、言語処理技術がネットワーク時代の有効な情報収手段を提供することを実証した。

11.キーワード

(1)情報検索、(2)情報抽出、(3)知識獲得
(4)専門用語抽出、(5)意味情報付コーパス、(6)オントロジー獲得
(7)知的検索システム、(8)間テキスト的文脈処理、(9)バイオインフォマティックス

12.研究発表(印刷中も含む)

[雑誌論文]
著者名 論文標題
Jun-ichi Tsujii Generic NLP Technologies: Language, Knowledge and Information Extraction
雑誌名 発行年 ページ
The 38th Annual Meeting of the ACL   2000  

著者名 論文標題
Katerina. T. Frantzi, Sophia Ananiadou and Hideki Mima Automatic Recognition of Multi-Word Terms: the C-value/NC-value method
雑誌名 発行年 ページ
International Journal on Digital Libraries 3-2 2000 pp.115-130

著者名 論文標題
Yusuke Miyao, Takaki Makino, Kentaro Torisawa and Jun'ichi Tsujii The LiLFeS abstract machine and its evaluation with the LinGO grammar
雑誌名 発行年 ページ
Journal of Natural Language Engineering, Cambridge University Press 6(1) 2000 pp.47-62

著者名 論文標題
Kentaro Torisawa, Kenji Nishida, Yusuke Miyao and Jun'ichi Tsujii An HPSG parser with CFG Filtering
雑誌名 発行年 ページ
Journal of Natural Language Engineering, Cambridge University Press 6(1) 2000 pp.63-80

著者名 論文標題
Nigel Collier, Chikashi Nobata and Jun-ichi Tsujii Extracting the Names of Genes and Gene Products with a Hidden Markov Model
雑誌名 発行年 ページ
18th COLING   2000 pp.201-207

著者名 論文標題
Akane Yakushiji, Yuka Tateisi, Yusuke Miyao and Jun-ichi Tsujii Event Extraction From Biomedical Papers Using A Full Parser
雑誌名 発行年 ページ
Pacific Symposium on Biocomputing2001   2001 pp.408-419

著者名 論文標題
Daisuke Kawahara and Sadao Kurohashi Japanese Case Frame Construction by Coupling the Verb and its Closest Case Component
雑誌名 発行年 ページ
Human Language Technology Conference(HLT 2001),   2001  

著者名 論文標題
Sadao Kurohashi and Manabu Ori Nonlocal Language Modeling based on Context Co-occurrence Vectors
雑誌名 発行年 ページ
The 2000 Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora   2000 pp.80-86

著者名 論文標題
Sadao Kurohashi and Wataru Higasa Dialogue Helpsystem based on Flexible Matching of User Query with Natural Language Knowledge Base
雑誌名 発行年 ページ
1st ACL SIGdial Workshop on Discourse and Dialogue   2000 pp.141-149

著者名 論文標題
Sadao Kurohashi, and Yasuyuki Sakai Semantic Analysis of Japanese Noun Phrased : A New Approach to Dictionary-Based Understanding
雑誌名 発行年 ページ
37th Annual Meeting of the Association for Computational Linguistics (ACL99)   1999 pp.481-488

著者名 論文標題
Sadao Kurohashi and Makoto Nagao Building a Japanese Parsed Corpus while Improving the Parsing System
雑誌名 発行年 ページ
The First International Conference on Language Resources & Evaluation   1998 pp.719-724

著者名 論文標題
Rila Mandala, Takenobu Tokunaga and Hozumi Tanaka The exploration and analysis of using multiple thesaurus types for query expansion in information retrieval
雑誌名 発行年 ページ
Journal of Natural Language Processing 7-2 2000 pp.117-140

著者名 論文標題
Rila Mandala, Takenobu Tokunaga and Hozumi Tanaka Query expansion using heterogeneous thesauri
雑誌名 発行年 ページ
Information Processing and Management 36-3 2000 pp.361-378

著者名 論文標題
Takenobu Tokunaga, Hironori Ogibayashi and Hozumi Tanaka Effectiveness of complex index terms in information retrieval
雑誌名 発行年 ページ
The 6th RIAO Conference(RIAO 2000)   2000 pp.1322-1331

著者名 論文標題
岩山 真、徳永 健伸 確率モデルに基づくパッセージ分類とその応用
雑誌名 発行年 ページ
自然言語処理 6(3) 1999 181-198

著者名 論文標題
岩山 真、徳永 健伸 確率的クラスタリングを用いた文書連想検索
雑誌名 発行年 ページ
自然言語処理 5(1) 1998 101-118

[図書]
著者名 出版者
徳永 健伸 東大出版
書名 発行年 総ページ数
情報検索と言語処理 1999 234


戻る