murawaki の雑記

はてなグループから移転してきました

2009-08-01から1ヶ月間の記事一覧

Non-Parametric Bayesian Areal Linguistics

NLP

Hal Daumé III: Non-Parametric Bayesian Areal Linguistics , NAACL 2009. (PDF)Areal Linguistics というか linguistic area とは、普通に言う Sprachbund (言語連合) のこと。これを non-parametric Bayes で推定しようと言うのだから正気の沙汰ではない…

Cia-Cia 語のハングル表記がひどい

インドネシアのチアチア (Cia-Cia) 語の表記にハングルが採用されたというニュースが韓国で話題になっていて、AFP にも記事が出ていた。Cia-Cia 語がどんな特徴を持つ言語なのか気になるところだが、韓国のニュースは調べた限りでは全然言及がない。どうやら…

The Empire of the Qara Khitai in Eurasian History

"The Empire of the Qara Khitai in Eurasian History" by Michal Biran気の利いた感想を書くには新情報が多すぎた。契丹の歴史も詳しくないし、ペルシャ語圏はもっと知らない。Juwaynī とかも名前しか把握していない。地名については、Oxus, Jaxartes, Tran…

Unsupervised Morphological Segmentation with Log-Linear Models

NLP

Hoifung Poon, Colin Cherry, and Kristina Toutanova: Unsupervised Morphological Segmentation with Log-Linear Models, NAACL2009. (PDF)NAACL2009 の best paper。また unsupervised word segmentation の論文。表題にあるように、log-linear models を…