murawaki の雑記

はてなグループから移転してきました

2009-06-01から1ヶ月間の記事一覧

Mozilla の add-on で IME を作る

Mozilla の add-on による ime の実装。別に自分で作ったわけではなく、indicime という add-on を調べてわかったこと。indicime はインド系言語を入力するためのパッケージ。といっても文字処理をやるだけ。日本語と違って入力に言語的な知識は必要ないから…

A Bayesian Framework for Word Segmentation: Exploring the Effects of Context

NLP

Sharon Goldwater, Thomas L. Griffiths, and Mark Johnson: A Bayesian framework for word segmentation: Exploring the effects of context, Cognition, 112(1), pp. 21-54. 2009. (PDF)unsupervised word segmentation の論文。unsupervised word segmen…

親子と言ったあなたは誰

締め切りが近付いてくると、現実逃避で妙なことを考えてしまう。今回はそんな話。親子と言ったあなたは誰か。視点はどこにあるのか。「父と母」なら問題ない。ある子供から見て、父であり母である。では「親と子」はどうか。一つの解釈は、自分を視点とした…

隠語を使うならひらがなで短く

NLP

「違法・有害情報の検出技術」の話題。以前専門外の人から質問されたときにうまく答えられなくて、ずっと頭に残っていた。頭の中が整理できていないので、思うところをぽつぽつと書いてみるテスト。どこから始めたものか迷うが、具体例があると議論しやすい…

Perl で dynamic_use

Perl で module をロードするときには、普通 use を使う。use は BEGIN { require Module; Module->import( LIST ); } と等価である。つまり、コードのどこに書いても compile 時に実行される。たとえ if の内側に書いていようが関係なく。普段は use のこの…