murawaki の雑記

はてなグループから移転してきました

2009-04-01から1ヶ月間の記事一覧

Reduplication Meduplication in Khalkha Mongolian

久保智之, 言語研究 112 (1997).モンゴル語では reduplication が生産的に用いられる。この論文はその性質を詳細に調べている。語学の教科書とかだと、そういう現象があるというぐらいしか説明がない。言語学だから、出てくる例文は周辺的というか典型的では…

Mecab の出力を Juman.pm に食わせる

NLP

形態素解析器 MeCab の出力を JUMAN の Perl モジュールに食わせてみるテスト。ちょっとした実験が目的で作ったが、ぱっとしない結果だったので、やっつけ処理のまま放置されてるコード。意味もなくさらしてみる。 use JMecab; my $jmecab = JMecab->new(dic…

Mongol Elements in Manchu

Mongol Elements in Manchu: A Study of Mongol Correspondences to Manchu Lexicon by William Rozycki.書評のまねごと。金にならないことが明らかすぎるからアフィリエイトはやらない。満洲語とモンゴル語を少し調べてみると、両者が似ているとわかる。明…

Valgrind をさわってみた

常駐型サーバーのデバッグ手法という記事を読んで知ったこと。Valgrind がメモリリークの発見に使えるツールだってことぐらいは知っていたけど、デバッグオプションをつけてコンパイルしなくても動くし、スクリプト言語に対してでも動くというのは驚き。もち…

OUKA の使い勝手が悪すぎる件

こちらのブログで言及されているように、『内陸アジア言語の研究』が阪大のレポジトリ OUKA で公開されている。論文の表題一覧を眺めていると少し昔を思い出す。例えば宮紀子の「モンゴルが遺した「翻訳」言語」は、2003年に「上」を読んで衝撃を受けて、一…

はてなダイアリーの使用感

はてなダイアリーを使ってみた感想。調べれば多分誰かがどこかで言っていることなのだろうけど気にしない。下書き機能を使っていて陥る罠。割と下書き機能を使った。一気に文章をまとめる時間や気力がないときなどに、とりあえず下書きにメモっておく。その…

はてなグループに移転

ダイアリーからグループに引っ越し。理由は単に EUC-JP じゃ不便だから。ダイアリーは EUC-JP でグループは UTF-8 というのが謎。しかし、グループはダイアリーに比べてインターフェースがひどすぎる気がする。

YouTube でシラ・ユグル語

YouTube ネタの続き。若いにいちゃんがシラ・ユグル語の単語をしゃべっている。 聞けば、とりあえずシラ・ユグル語がモンゴル系の言語だってことはわかる。とはいえモンゴル語の音声が身についてないから、ハルハ語とどこが違うのかと聞かれても的確に答えら…

The Sibe language on YouTube

シボ語の動画がいくつか YouTube にあがっている。例えばこれ。 しかし全然何言ってるかわからない。他にもニュースや歌もある。ニュースは ilan minggan といった数字が断片的に聞き取れるぐらい。声調がついている感じで違和感がある。歌はアクセントなど…

Perl の switch は遅いのではないかという疑惑

Perl で Switch を使っていたら遅かったので hashref + anon sub に書き変えた。そもそも普段は、プログラムの速度をそんなに気にしない。たまたま研究室で Devel::NYTProf が話題になっていたので、何となくこのプロファイラを走らせてみた。そうすると Swi…