 |
|
Prof. Bo Xu |
National Lab of Pattern Recognition, Institute of Automation, Chinese Academy of
Sciences |
Eメール:xubo@nlpr.ia.ac.cn |
 |
履歴:
1988年に浙江大学で学士号を取得した。その後、国立パターン認識研究所(NLPR)の音声認識の研究に携わり、この分野で1992年に修士号を、1997年に博士号を取得した。
音声認識、音声対話、音声翻訳、自然言語処理などに関する研究活動を行っている。これまで数多くの国家科学プロジェクトに主要研究者として参加し、貢献してきた。国家レベルの賞をいくつか獲得している。
現在は、NLPRの副所長(deputy director)であり、音声インタラクション・処理研究グループのリーダーである。また、清華大学の教授の地位にあり、中国国家科学基金の諮問委員会のメンバーでもある。音声インタラクション、統計的翻訳、音声コーパス検索などの研究に従事している30人のグループのリーダーである。 |
|
|
国立パターン認識研究所(NLPR)の音声言語処理における研究開発活動と実績 |

発表資料 |
|
 |
音声言語は、人間のコミュニケーションのための自然で、柔軟で、効率的な手段である。我々は主に、人間と機械、人間と人間が多様な音響環境の下で基本的には語彙や話し手を制約されることなくコミュニケーションできるようにするための音声言語処理の実現に重点を置いて研究活動を行っている。音声認識を研究の中心課題としているNLPRは、音声認識の研究と開発においては長い歴史があり、高い評価を得ている。音声認識のための統計的Nグラムモデル構築における研究に加えて、1996年からは音声理解と音声翻訳のための自然言語処理の研究を開始した。我々は主に以下の研究に焦点を当てている。 |
(1)音声コーパスの作成と解析。単一言語理解および二ヶ国語翻訳のために様々な音声コーパスを現在、構築中である。いくつかの音声現象を詳細に解析する。
(2)単語セグメンテーション、タグ付け、構文解析。音声認識におけるデータ処理、モデル構築、検索の経験を生かして、単語と品詞3−グラムモデルを組み合わせ、単語のセグメンテーションとタグ付けを統合して最適化することにより、最高レベルにまで精度を高める。
(3)IFインタフェース翻訳やテキストインタフェース統計的翻訳をはじめとするマルチエンジン音声翻訳。格文法によりテキストコーパスにラベル付与し、HMMによって文脈制約を学習することにより、ドメインポータブルな理解エンジンが利用可能である。統計的学習では、パラメータとモデル最適化を可能にする翻訳結果の自動評価を含め、音声認識からのいくつかのアイデアを紹介する。さらに、チャンクレベルでのアラインメントについての研究も行っている。
(4)音声コーパス検索:ノイズ、背景、音楽、話者トラッキング、音声認識を分類することにより、音声コーパスに自動的にラベルが付与される。ファジイ・マッチングに基づく情報検索を利用するこの技術を用いて研究することにより、音声コーパス検索がテキストコーパスと同じくらい容易になる。上述の分野における業績を再考した後に、最近の研究とその進展に焦点を当てて話をし、意見交換や議論を行う。 |
|
 |
音声翻訳、音声対話、統計的翻訳、音声インタラクション、情報検索、音声コーパス検索 |