Prof. Benjamin K Tsou
Language Information Sciences Research Centre, City University of Hong Kong
Eメール:rlbtsou@uxmail.cityu.edu.hk
履歴:
 香港に生まれ、初等レベルの教育は上海、香港、シンガポールで受けた。数学と物理を専攻した後、言語学に転じ、ハーバード大学(言語学で修士号を取得)、マサチューセッツ工科大学(MIT)、カルフォルニア大学(UC)バークレー校(言語学で博士号を取得)で学んだ。
 中国語の同期コーパスプロジェクト(LIVAC)のリーダーであり、中国語コンピューティングと中国語自然言語処理の研究に積極的に取り組み、この分野ならびに言語学の分野で論文など100点にのぼる研究成果を発表している。MITの電子工学研究所では機械翻訳を研究し、UCバークレー校では中英機械翻訳プロジェクトの研究ディレクターであった。数多くの自然言語処理会議で議長や共同議長を務め、また、アジア言語の情報検索国際ワークショップ(IRAL)、環太平洋自然言語処理シンポジウム(NLPRS)、国際中国語学学会(IACL)などいくつかの会議では基調講演も行っている。さらに、Zhongguo Yuwen、Yuyanyanjiu、International Review of Chinese Linguistics(IRCL)、International Journal of Computer Processing of Oriental Languages(IJCPOL、シンガポール)、Natural Language Processing(NLP、日本)、International Journal of Computational Linguistics and Chinese Language Processing(IJCLCLP、台北)など数多くの学術誌の編集委員会でも活躍している。中国語計算機学会の副会長でもある。
 パリのEHSS、キャンベラのANU、UCバークレー、ブリティッシュコロンビア大学、バンコクのチュラロンコン大学、上海の復旦大学、瀋陽の東北大学、シンガポールのNTUなど多くの大学で客員教授や名誉教授の肩書を得ている。1999年には香港行政特別区政府からブロンズ・バウヒニア・スター・メダル(Bronze Bauhinia Star Medal)を受賞した。

中国語の同期コーパスの開発とその応用分野
発表資料
 1995年から香港城市大学の言語情報科学研究センターは、中国語の同期コーパスを開発してきた。このコーパスは、北京、香港、マカオ、上海、シンガポール、台湾の報道機関から4日ごとに同時にテキストデータを引き出すものである。このコーパスは、それぞれの地域特有の中国言語に関して科学的でユニークなWINDOWアプローチを可能にするものであり、情報検索(IR)や自然言語処理(NLP)を行う上でますます重要になりつつある中国語の興味深く、重大な差異を明らかにするものである。
 このコーパスは、2001年6月現在で8,000万に及ぶ文字と49,000種類を超える基本単語の辞書を含むデータベースとなっている。今回のプレゼンテーションでは、このユニークなデータベースの概念と設計、得られた結果について説明し、さらにこのデータベースがモバイル・コンピューティング、検索エンジンの開発、セグメンテーション、構文解析など多くの分野でいかに応用できるかについて考察する。