『コーパスに基づく言語研究 文法化を中心に』(ひつじ書房)
特に第5章に注目。XMLを使って面白いことできるといいのだけれど。また、近藤教授の「情報技術は文学研究をいかに変えるか」要旨(全国大学国語国文学会夏季大会シンポジウム 2001年6月2日)も参照。『日本語記述文法の理論』[目次](ひつじ書房、2000年、ISBN:489476122X)は高いな。。。
第5章 日本語コーパス言語学とコンピュータ処理(近藤泰弘) 1. 序 2. コーパス言語学とプログラミング言語 2.1 バイオインフォマティクスの現状との類似性 2.2 プログラミング言語Perl 3. コーパス言語学とPerlの特性 3.1 ファイル/3.2 テキストデータとリスト・配列 3.3 データベースとハッシュ/3.4 正規文法と正規表現 3.5 日本語文字コードとUNICODE 3.6 コーパス言語学とプログラム 4. コーパス言語学と構造化テキスト 4.1 情報化とタグ/4.2 タグの種類 4.3 XMLによるマークアップの問題点 5. コーパス言語学の今後
【関連リンク】A generic approach to software support for linguistic annotation using XML