murawaki の雑記

はてなグループから移転してきました

2010-12-31から1日間の記事一覧

Parsing Wikitext

NLP

Wikipedia のデータを自然言語処理で使う。そのために wiki format のテキストを整形して、用途に応じたデータを抽出する方法。2012年2月18日追記: この情報は古くなっています。今風のスマートなやり方については、こちらのブログ記事を参照してください。…