もばりぶ入庫作業 その2

■書籍データのダウンロードと展開

◆青空文庫のデータ形式ともばりぶのデータ形式

もばりぶの場合、書籍データはエキスパンドブック形式の(EBK)とテキストデータ(TXT/ZBK)で配布しています。

青空文庫ではエキスパンドブックは無圧縮状態でそのまま提供されていますが、テキストデータはZIP形式での圧縮となっています。

そのため、もばりぶで公開するために展開作業が必要となります。

本来このあたりも自動化したいところですが、今のところ手作業でも何とかなっています。

img-bluesky-file.gif (13698 バイト)

青空文庫の図書ページ

このページから書籍データがダウンロードできます。

現在は月刊ASCII10月号付録のCD-ROMを使ったファイル上でのダウンロード作業ですが、それが終了した段階でインターネット上の青空文庫からダウンロードすることになります。

img-download-filelist.gif (6122 バイト) ダウンロードされたファイル

図書カードからダウンロードしたファイルはエキスパンド形式のEBKと圧縮されたテキストファイルであるZIP形式があります。

img-text-filelist.gif (7426 バイト) 展開済みのファイルリスト

LHASAを使いZIP形式のファイルを展開しテキストデータにします。

ザウルス上でZIPを展開するツールとしてharamasaさんのZGZがあるのですが、ダウンロード即利用可能なデータとするためテキストデータは展開した状態で提供しています。

img-fp98-datalist.gif (16979 バイト) FrontPageにコピー

FrontPage上に展開済みテキストデータをコピーします。

書庫は著者別にフォルダが用意してありますが、一旦"work"という作業用フォルダにコピーします。


入庫作業−3へ