 |
|
Dr. Ming Zhou |
Microsoft Research China |
Eメール:mingzhou@microsoft.com |
 |
履歴:
Dr. Ming Zhouは、機械翻訳と自然言語処理の分野の専門家であり、マイクロソフト・リサーチ・チャイナの研究員である。マイクロソフトの研究員となる前は、清華大学の計算機科学部の准教授であった。日本でも有名な中日・日中機械翻訳ソフトウェア製品を設計した。また、中国本土で中英機械翻訳の初めての試みであったCEMT-I機械翻訳システムも氏の設計である。現在は哈爾濱工業大学および天津大学の客員教授である。
機械翻訳の研究により中国航空宇宙部から3つの科学技術推進賞を受賞している。また、中国語スペルチェックシステムで中国のソフトウェア特許を取得している。1986年から、中国自然科学基金と中国航空宇宙部が出資している機械翻訳、中国語スペルチェック、中国語統語解析の分野におけるいくつかのプロジェクトで指導的立場にある。さらに米国、日本、香港、韓国の大学や企業と共同で実施している、英中翻訳支援システム、日中機械翻訳、中国語スペルチェック、中国語テキスト情報検索、韓中機械翻訳などのプロジェクトにも携わっている。 |
中国と日本における"DEAR"翻訳機のワークステーション、"WinChar"中国語スペルチェッカー、"J-Beijing"中日機械翻訳システムなど3つの商用機械翻訳ソフトウェア製品の開発責任者でもある。ACL-2000のアジア言語処理セッションの共同議長を務めるなど、自然言語処理に関するいくつかの国際会議のプログラム委員会のメンバーでもある。
1985年に重慶大学からコンピュータ工学で理学士の学位を取得し、コンピュータ科学の分野で哈爾濱工業大学から1988年に修士号を、そして1991年には博士号を取得した。博士号取得後に1991年から1993年まで清華大学で研究員となり、1993年に同大学の准教授に就任した。1985年には香港中文大学で準研究員となり、1986年には香港城市大学の特別研究員として過ごした。1996年11月から1999年3月まで、中日機械翻訳プロジェクトのプロジェクトリーダーとして日本の高電社で働いた。このプロジェクトにより1998年に商用ソフトウェア"J-Beijing"が誕生した。1999年4月から8月までは、清華大学計算機科学部のNLP研究グループのリーダーを務めた。1999年9月にマイクロソフト・リサーチ・チャイナに参加した。現在、マイクロソフト・リサーチの自然言語処理グループのリーダーである。 |
|
|
マイクロソフト・リサーチの自然言語処理グループの概要 |

発表資料 |
|
 |
情報時代の到来により、膨大な量のディジタル化テキストが世界中至る所で日々、生成され、インターネットを通して広がり、交換され、保存され、アクセスされている。当然のことながら、こうした動向は情報獲得を一層難しいものにし、言語の壁はますます深刻化しつつある。
これらの問題を克服するために、マイクロソフト・リサーチ・チャイナの自然言語処理グループ(NLC)は、伝統的なNLPと統計に基づくNLP、機械翻訳、情報検索、多言語間情報検索、中国語処理、日本語処理、機械学習、その他関連分野における研究に携わっている。我々は言語知識を獲得するために統計的学習アプローチを採用した。知識の獲得と評価を支援するために大規模テキストコーパス(単一言語および二言語)を様々なタグ付け情報と機械辞書を使って作成した。さらに、パワフルな中国語単語セグメンテーション、ロバストな中国語構文解析機能、英語を基にした効率的な名詞句パーザ、統計的言語モデルツールキットを含む強力な言語処理システムを作った。 |
これらの資源と処理ツールは、我々の一連の言語研究プロジェクトを支援し、成果を挙げている。現在までに我々が完成したデモは、英語生成支援システムや英語精読支援システム、中国語スペルチェッカー、中国語ピンイン(中国式表音ローマ字)-漢字変換システム、日本語かな漢字変換システムを含む、中日IME、機械翻訳アプリケーション、中国語スペルチェックに関するものである。これらの技術は研究界に大きな衝撃をもたらし、関連するマイクロソフト製品に技術移転して成果を挙げてきた。
我々のグループの使命は、NLP研究の新しい趨勢を主導し、先進的NLP技術を生み出し、それらを優れた用途に応用できるようにすることである。我々の努力により、世界各地のユーザーにとってインターネット時代の情報の壁や言葉の壁を克服するための満足のいく解決策が生まれることを期待する。現在、我々はアジアの言語処理、機械翻訳、情報検索、質疑応答の分野に焦点を当てているが、なかでも中国語関連のプロジェクトには特に力を入れている。
我々の研究方法は、データ駆動型の手法である。言語知識や翻訳知識を獲得するために大規模な単一言語/二言語コーパスと辞書を作成する。獲得した知識は、我々の研究プロジェクトを支援するものとして使用する。現在、我々は以下の研究テーマに重点を置いている。
- コーパスの作成、分類、情報付与
- 統計的言語モデルとそのアプリケーション
- 翻訳支援システム
- 情報検索
- 統計的言語学習
|
|