『コーパスに基づく言語研究 文法化を中心に』(ひつじ書房)

特に第5章に注目。XMLを使って面白いことできるといいのだけれど。また、近藤教授の「情報技術は文学研究をいかに変えるか」要旨(全国大学国語国文学会夏季大会シンポジウム 2001年6月2日)も参照。『日本語記述文法の理論』[目次](ひつじ書房、2000年、ISBN:489476122X)は高いな。。。

第5章 日本語コーパス言語学とコンピュータ処理(近藤泰弘)
1. 序
2. コーパス言語学プログラミング言語
 2.1 バイオインフォマティクスの現状との類似性
 2.2 プログラミング言語Perl
3. コーパス言語学Perlの特性
 3.1 ファイル/3.2 テキストデータとリスト・配列
 3.3 データベースとハッシュ/3.4 正規文法と正規表現
 3.5 日本語文字コードUNICODE
 3.6 コーパス言語学とプログラム
4. コーパス言語学と構造化テキスト
 4.1 情報化とタグ/4.2 タグの種類
 4.3 XMLによるマークアップの問題点
5. コーパス言語学の今後

【関連リンク】A generic approach to software support for linguistic annotation using XML