Apr 11, 2011

青空文庫形式テキストのパーサが欲しい!

連日ちまちま作っているぽちたてですけども、単純なテキスト縦書きビューワーとしては、だんだんとそれなりの物になって来ています。昨日も圧縮されたテキストファイルをそのまま読み込めるようにしました。こうなって来ると、青空文庫のテキストを読む時に青空文庫形式テキストをただそのまま素の縦書き表示するだけでなく、青空文庫形式テキストの注記を解釈してルビやレイアウトなどに反映させた縦書き表示をしたくなって来ます。その為に必要になるのが青空文庫形式テキストのパーサです。

ぽちたてを青空文庫ビューワー化させるには、まずこの青空文庫パーサを書かないといけません。ぽちの乏しい知識と泥臭いセンスからすると、安直に Perl正規表現で書く事になると思います。本当は誰か Perl の凄いひとが、AozoraBunko::Parser(仮名)みたいな名前で Perlモジュールを書いてくれたら良いんだけどなあ…。

とりあえず今後の為に、参考になりそうなサイトをメモしておきます。

なんだか、本当にぽちたての青空文庫ビューワー化が出来るのか不安になって来てしまいました。

Posted at 00:38 in ぽちたて | Comments/Trackbacks ()
Comments/Trackbacks
TrackBack ping me at
http://pochi.usamimi.info/blog/pochitate/aozorabunko_parser_ga_hoshii.
Post a comment

writeback message: