murawaki の雑記

はてなグループから移転してきました

2009-05-01から1ヶ月間の記事一覧

清朝の蒙古旗人

清朝の蒙古旗人 その実像と帝国統治における役割 by 村上 信明 (2007).八旗蒙古に属す蒙古旗人を17世紀後半から18世紀後半までの期間を対象に考察した本。著者は前々から外藩関係の官制について何本か論文を書いている。本書は一般向けの digest になってい…

テキストじゃ書き順が分かりにくい

テキストという媒体には様々な制約がある。その制約ゆえに、言語系の論文とか語学の本を読んでいると不便に感じることがある。一番困るのが発音がよく分からないことだけど、意外と書き順も分かりにくいという話。先に発音について。テキストには音声そのも…

ssh-agent と screen と ForwardAgent

ssh-agentをscreenの中から使う方法(NFS,二重ログイン対応版)を使ってきたが、問題があったのでさらに改造。何とも言えないバッドノウハウ。Steps to reproduce: 計算機 A1 で ssh-agent を仕込み、ForwardAgent を yes にして B にログイン。すると $HOME/.…

複合語の扱い

NLP

NAIST Japanese Dictionary の複合語情報が付与されたバージョンが公開されているというので、少し調べてみる。以前からプロジェクトの説明には 形態素解析用辞書 IPADIC の ICOT 条項をクリアするとともに表記ゆれ情報、複合語情報を付与した辞書の公開 と…

「はてな」は「果てな」か

NLP

せっかくはてなを使っているのだから、研究ネタで「はてな」について語ることにする。やっていることは、生のテキストから形態素を獲得して辞書に突っ込むという処理を計算機によって自動化すること。形態素という言葉は、言葉の最小単位という意味で使って…

閉鎖空間に飲み込まれたくない

連休中にウルムチとカシュガルを経由して、その先の某所に行って帰ってきた。*1その時思ったことのメモ。興味があるのはこの地域の言語状態。しかし判断材料が少なくて偏っている。具体的には、実際に会話した人、町の看板、それに本屋の書籍。まずはこれら…

U+0649 の表示

はじめてウイグル語を書いてみたわけだが、手元の環境では表示が正しくない。いろいろ調べたのでメモ。問題は i。initial form や medial form が選択されるべきところで isolated form が表示される。ウイグル語の i に対しては U+0649 ARABIC LETTER ALEF …

Introduction to Modern Uighur

by Hamit A. Zakir, Xinjiang University Press, 2007. ھازىرقى زامان ئۇيغۇر تىلىウルムチの本屋で見つけた語学の本。30元。ウイグル語を英語で説明。この本については、ググってもほとんど情報がない。そもそも Amazon が何も返さない。アフィりたくてもア…

私が老害になるとき

「老害死ね」と心の中でつぶやくとき、自分もそのうち老害扱いされるのだろうと考えたりする。問題は何をもって老害になるかだが、ずっと頭にあるものの一つは携帯世代の存在。具体的な懸念材料もいろいろある。例えば、2ちゃんねるが高年齢化しているとい…