■ファーストリリース(99/11/01)

11月1日というのは午前0時からはじまるのですが、それまでにはなんとか格好をつけることができました。 でも、書庫は空っぽに近い状態でのオープンです。 これは書籍データの割り付け作業が難航したためと、テレホーダイタイム(23:00)直後からアップロード作業をしてもWeb用FTPサーバの反応が悪くアップロードエラーが続発したためです。

結局入庫が終わったのは11/01 3:00頃となり、テストしてみるとダウンロードエラーが発生するものが散見されたため、再度全チェックしなおし、オープンとなりました。

その後、ざうまがでオープン告知を行いめでたくもばりぶファーストリリースとなったのです。

この後は書庫整備、マニュアル整備と単純作業が延々と続くわけですが、持続できるかどうかが最大の難関です。 私は飽きっぽいからね〜(^^)/


■痛恨のミス

もばりぶリクエスト会議室で発言があって気付いたのですが、L.Forceさんのログブラウザは拡張子"TXT"のデータに関して、内部メモリ側に登録されている場合は開けません。 メモリカード側はTXTでもOKだったのでチェック漏れでした(^^;

お勧め読書ツールとしながらせっかくダウンロードしたデータが読めないとは、利用してくださった皆さんに申し訳ないm(_ _)m

この件をきっかけにザウルス用テキストとして配布するデータの拡張子を"ZBK"にすることを検討しています。

ZBKは現在シャープスペースタウンでザウルス文庫として配布されているデータの拡張子です。これにするメリットは余り無いのですが、ザウルス等の「パソコンデータ」画面でリストアップされないという利点があります。TXTの場合はパソコンデータ画面に表示されるため、ちょっと邪魔です。

・TXTかZBKか?

ザウルスユーザーにとってスペースタウンはデフォルトWebなので、そこで公開されているものを一つの基準と考えれば"ZBK"にしておく方が今後のためかなとも考えています。

しかし、ZBKだと今度はmabさんの「たて読みさん」がこの拡張子をサポートしていないという問題があります。

そこで、mabさんに泣きついてZBKサポートをお願いしました。 サポートが実現するならテキストはZBKを標準拡張子にしたいと考えています。

また、SZABサポートWebなどでもテキストデータのファイルタイプとしてZBKをサポートするように依頼する発言を行いました。

ザウルス用テキストデータをZBKにすることにはもう一つメリットがあり、将来的に他のPDAをサポートする際に今のMIME TYPEを各機種向けにすることを考えると application/x-zaurus-txt にしていると問題が発生する可能性があります。

それであれば、ザウルス用テキストは application/x-zaurus-zbk として設定できた方が良いはずです。

暫定Web上では両方をサポートすべく、将来的なZIP用に確保してあったエリアをZBK用として確保しました。 

ラッキーだったのがCGI送り出し方式としてあるため、同じテキストファイルなのにCGIで付加するMIME TYPEをZBKとすればザウルス側はZBKで保存してくれます。

ただし、本番用ではテキストファイルの拡張子を"ZBK"に変更する手間がありそうです。 これも大変なんだな〜(^^;


■1バイトの闘い

現在入庫作業を進めるとともに、蔵書目録も整備を急いでいます。

「あ」のつく書籍リストを作っていて問題を感じたのが、想像以上に大きいファイルサイズになるという点です。

ザウルスの場合1ページあたりのサイズに関して64KB(実質60KB)の壁があって、これを超えるとそれ以上の部分が読み込めません。

最初に作った「あ」のページは37タイトルに対して30KBを超えていました。1データに付き800バイト程度使っていることになります。

表の列を文字数で考えると全角60文字程度なので多くても200バイト、その差の600バイト近くあります。 HTMLを眺めてみると表組みデータ、セルの書式データ、リンクに要するデータ、色指定データでかなりのサイズを占めていることがわかります。

これまで真剣にザウルス向けページに関して研究してこなかったツケが回ってきたようなものですが、容量削減に向けてあれこれと工夫を始めました。

1.画像ファイル名の短縮(約1KB)

画像に関しては1つの画像を使っているため除外しても容量削減に繋がりません。 また、文字に置き換えた場合色指定すればそのほうが容量増に繋がる場合があります。 そこで画像icon-ddz.gif (452 バイト)はそれまで"icon-ddz.gif"にしていたのですが、"d.gif"などのように1文字にしてしまいます。 これで7バイト減り、データ数から250バイト削減となります。 また、原本出典を現すicon-blue.gif (192 バイト)も"icon-blue.gif"を"b.gif"にして300バイト、図書カードicon-bookcard.gif (254 バイト)も"icon-bookcard.gif"を"c.gif"とすることで450バイト程度削減に成功しました。

本当は画像サイズを指定するWIDTH/HEIGHTも削除したいのですが、現在使っているホームページ作成ツールのFrontPage98ではこれを外すのは面倒です。 また、削除すると画面表示が遅くなる(リドロウが多発する)ため、残すことにしました。

2.文字位置などの情報削減(約7KB)

次にセル無いデータのアライメント(文字位置)を中央にしていたのですが、これを指定すると各セルにalign="center"というタグが入ります。 また、タイトルが複数行になってザウルスの画面上に表示できる書籍データ情報量が増えるのを嫌って"nowrap"で折り返し禁止していたのですが、これも必要最小限の個所に入れることで削減、これらが9セルx行数分入るため、20x9x37で6600バイト程度使っていることになります。 

なんて無駄な部分だったのでしょう(^^; 多少見栄えは悪くなりますが、ばっさりカットです。

3.リンク情報の短縮(約2KB)

その次は書籍データとのリンク部分の改善で、それまでは目録データと書籍データは別ディレクトリに配置していたのですが、これだと相対参照のために"../../books-lib/all/txxxxxx.txt"のように余分な部分"../../"がついてしまいます。

これを削減するために目録データを書籍データと同じディレクトリ上に配置しました。 長い目で見るとこの方法は混乱する可能性がるのですが、当面は大丈夫でしょう。 

この措置により書籍データの種類にもよりますが、3.5種類平均x6バイトx37データで800バイト近く削減です。

もう一つ、出典を示すicon-blue.gif (192 バイト)には青空文庫のURLを付けていたのですが、全てのものにつけると<a href = "http://aozora.gr.jp">というリンクで33バイトにもなります。

図書カードなどで青空文庫へリンクしていることを考えるとここにリンクをつける意味がありませんし、間違ってタッチしたときのロスタイムを考えるとつけないほうが無難と考え、出典に関しては表の一番下で説明&リンクをつけることにしました。

これで1200バイト削減です。

4.削れるものは削る(約5KB)

更に熟考しicon-blue.gif (192 バイト)を外しました。 これは画像データが<img src="b.gif" alt="青空" border="0" WIDTH="18" HEIGHT="18">のように62バイトも使ってしまうことを考慮したためです。 出典は各データの最下行に文字情報として記述することにしました。

d.gif (452 バイト)c.gif (254 バイト)も外せば削減可能ですが、....しばし考える...う〜ん、d.gif (452 バイト)に関しては無くても困らないよな〜、えいっ取っちゃえ! 

これらの措置で4500バイト近い削減です。

細かいところでは書籍データに"『』"が付いていたのですが、これも削除。

5.トータルで半分に

どうにか、こうにかで当初の30KBが15KBを割るところまで圧縮できました(^^)/ 半分に痩せました。 これが私の体重だったらどれほど良かったことか(^^;

本番用WEBでは更に"txt.cgi"などの送り出しCGIを指定する部分がなくなり、更にザウルスに優しいページとなるでしょう。

普通のHPならここまで考えずに作ってしまうのですが、真剣にザウルスのことを考えると1バイトとの闘いになるのです。


■ベースフォーマット作り(11/02)

やはり公開してみると色々問題が出てくるもので、著者/書籍ともにジャンプ用インデックスなど付けたほうが良いことが分かりその作業をしています。

目録

これを入れることで、一つの目録中における上下移動が楽になりました。

色合いがパソコンで見るとちょっとキツメですが、ザウルスで見るとちょうど良いのです。

この作業もリトライがあって、当初はフォントサイズ標準にしていました。 この状態ならカラーのザウルスで問題無く識別できます。

ちょっと文字が小さいかなと思いつつ、タッチできる大きさなので作業を続行、ある程度かんせいしたところでふと白黒のザウルスはどう見えるのか? と試してみたらちょっと文字が小さすぎてみにくく感じます。

サイズを<h1>〜<h3>あたりまで変えて、<h3>ならちょうど良い大きさになるのですが、この指定をした場合、ザウルス上では3行分の場所を取ってしまいます。 これではただでさえ狭いザウルスの画面上に表示できる目録の行数が減ってしまいます。

やはりサイズは標準が良いかな?とあれこれやってみて、結局文字になってしまいました(^^;

表組みして色遣いなども検討した結果、このスタイルに決定

【あ/い/う/え/お/目録】03/10/14更新

EBK:エキスパンドブック TXT/ZBK:テキスト ルビ:ルビ付きテキスト
数字はファイルサイズ(KB) クリック/タッチするとダウンロードできます
図:情報は青空文庫上の書籍情報ページにリンク 

結果的にこのほうがサイズも小さくなるためザウルスに優しいページとなります。

結局著者「あ」「か」と書籍「あ」まで作業をすすめた部分がやり直しとなります(^^;


唐突にもばりぶ創刊号を配信。 本当なら11月1日にすればよかったのですが、まぐまぐに申し込んだのが26日頃とぎりぎりのタイミングで発行時期を逸していました。


■登録作業とベースフォーマット変更(11/03)

本当は休みの間に一気に登録してテレホーダイタイムでアップロード完了を目指していたのですが、結局またベースフォーマットの見直しが(^^;

これまではパソコンのことを考えて多少手心を加えていたのですが、ザウルスで見やすいことを最優先にした色遣いと画面構成に大変更。

EBK:エキスパンドブック TXT/ZBK:テキスト ルビ:ルビ付きテキスト
数字はファイルサイズ(KB) クリック/タッチするとダウンロードできます
図:情報は青空文庫上の書籍情報ページにリンク   03/10/14更新

【か】/////目録

タイトル 著者 EBK TXT ZBK ルビ 情報
銀河鉄道の夜 宮沢賢治 155 73 73 83 図書カード

結局このようになりました。

あとは全力で登録作業をすすめ、「あ」行に関する書籍データを設定し終わりました。

・サポートツール

現在私のパソコンはWindows NT4.0WSで動いており、この上にWebサーバであるInternet Infomation Server(IIS4.0)などを載せてリモートアクセス利用による仮想プロバイダ環境を構築しています。

これは非常に便利な環境でインターネットに接続しなくても、もばりぶのページがザウルスでどのように見えるかをチェックすることができます。

ASCIIに添付されていたCD-ROM版青空文庫もこの仮想サーバに載せて、図書カードを参照しながらデータをもばりぶ用に変換しています。

一つだけ問題があって、もばりぶでは自前の図書カードをおかず、青空文庫へのリンクとしているのですが、そのURLは自前のローカルサーバが"http://maruto"

で始まるのに対し、青空文庫は"http://www.aozora.gr.jp/"で始まります。

そのため、図書カードのURLもこれに準じて書き換える必要があるのですが、手作業で行うには手間がかかりすぎて死んでしまいます(^^;

そこで、VisualBasicを使ってローカルサーバのULRがクリップボードにコピーされたら青空文庫のURLに変換するというプログラムを作りました。

作業効率は500%以上はアップしてめでたかったです(^^)/

本当ならCD-ROMからダイレクトに変換できるシステムにしたいのですが、まだまだ変更要素がありそうなので、こちらは本番用サーバに向けての課題とします。

・細かな調整

ザウルスのブラウザにはクセがあり、表組みをこちらの意図どおりにするには実際にザウルスで表示してみて、nowrapなどのタグで調整する必要があります。

これが結構面倒な作業で、見ては直しの繰り返しです。

・危険性

「あ」行を全部入力し終わって思ったのは目録表示に意外と時間がかかることで、これは主に表が大きくなることによるファイルサイズ増加の問題なのですが、もし、もっと大きくなるなら「あ」ではなく「あ」「い」「う」...のようにしたほうが良いのかもしれません。

もう少し様子を見ながら切り替えを考えます。

・11/3現在の登録数

総数121、うちザウルス系でダウンロード可能なのは99冊。


■またまたミス(^^ ; 99/11/04

もばりぶニュース2号配信。

ザウルスで一括ダウンロードできる蔵書目録(MPFデータ)を公開しましたよ〜と高らかに宣言したのですが、実はダウンロードできない状態になっていました。

もばりぶ会議室で指摘されてはじめて気付く有様です(^^;

ローカルサーバでは何度もテストしていたし、このファイルはX-MPF指定しなくてもダウンロードできる場合があったので何の対策もしていなかったのですが、FreeWebでは必要なようです。

すぐに直しましたが、ご迷惑をおかけいたしましたこと、お詫びいたします。


もう容量が一杯

FreeWebは無料系Webとしては珍しく20MBもの容量を使わせてくれるのですが、書籍データは1本で見ると少ない容量(EBKで150KB平均、テキストで50KB平均程度)なのですが、数が多いので「あ」行と少しのデータだけで20MBを使っています。 現在一つの書籍で平均200KBなので100作品も入れたら満杯なのは自明の理。

このままのペースだとパンクするので、一旦EBK版の公開を中止しようかと検討中です。

後から追加するのも非常に労力が必要なので困る気もするのですが、蔵書を増やす方が先なので暫定的には仕方がありません(^^;

既に容量無制限WEBも確保準備が進んでおり、そちらの利用が可能になり次第移行を進めたいと考えています。


■大容量サーバ確保! 99/11/06

もばりぶを建設している「まると@ざうまが編集部」はもばりぶ以外にも、ざうまがWeb、ザウルスなんでも会議室、何でも掲示板といったWebの運営とメールマガジン「ざうまが」「コミパルパラダイス」「もばりぶニュース」の発行をしています。 

ざうまがWebは外国の無料サーバ XOOM.上、なんでも会議室はもばりぶと同様にFreeWeb、何でも掲示板はジオシティ−ズ、メールマガジンはまぐまぐと各地に分散しています。

特にWeb系は容量が不足するたびに新天地を求めてさまよっている状況でしたが、今回容量無制限のサーバを確保することができ、順次移行作業を開始しています。

もばりぶの場合も既に容量限界の20MBに達しつつあることと、現在の書籍データの送り出しにcgiを使っているためサーバ側の処理が大きくなることと、この設定をするのが手間だったということもあり、新サーバにとっとと移行したいところです。

ただし、新サーバも無料なためいつ止まるか分からないし、プログラム開発者向けサーバのためかなり危険な状況と思われます。 次の目標はバックアップサーバの確保です。

11/15目指してリニューアル準備中です。

現行サーバは容量限界まで蔵書を増やして以後は更新停止、新サーバへの誘導を始めます。

・モバイルで読書ページの増設

ザウルスで読書ページも一部直しているところですが、モバイル機器で読書する人に向けて「モバイルで読書」というページを増設することにしました。


■書名・頭文字「か」のデータ公開 99/11/07

1日1文字の誓いも守れず(^^; ですが、地道に登録/公開してます。

作業で一番面倒なのが、青空文庫ではZIP形式で提供されているテキスト形式データを展開して該当リンクに貼り付けることと、現在のデータ送り出し方式であるCGIを割り振る作業です。

これが全作業の7割を占めています。

CGIに関しては間もなく利用を開始する新サーバでは設定不要なため、作業効率があがりますが、ZIP展開と割り付けに関しては効率化は無理でしょう(^^;

今日現在のダウンロード可能書籍数 137冊!


■著者名目録もMPF化 99/11/07

書籍名の方はMPFファイルによるデータの一括提供を既に実現していますが、著者名目録もMPF化しました。

蔵書目録関係は充実しています。


■書名「か」行のデータ公開 99/11/08

作業が比較的早く進んだので「か」行のデータを公開。

ただ、EBKデータを省いてもこれが容量限界と思われるため、新サーバ移行を急ぐことにします。


■MPFツールの作成 99/11/09

もばりぶのザウルス系専用蔵書目録はMPFという形式で配布しているのですが、現在これは半手作業で作っています。

蔵書が増えると作業量が増えることが予想されるので自動化を進めているところですが、通常のHTMLからMPF化するツールの目処は立っているもののMPFからHTMLを逆生成するツールに関してはリンクと画像をどう処理するかに問題を残しているために難航しているところです。

これに数日の間没頭しているため、蔵書が増えません。


■新サーバへの移行 99/11/10

念願の容量無制限/ザウルスやPDA向け設定の可能なWebサーバを確保しました(^^)/

11/15に移行を予定していましたが、今後の登録作業を考えると新サーバで行った方が良いので急遽移設作業を進めているところです。

これまでのように不要なバナーが表示されることもなく快適なWebが実現できそうです。

★e-shotへの対応

NTTドコモが間もなく始めるe-shotというサービスにもばりぶは参加する予定です。

非ザウルス系PDAでポケットボードなどのWebを見ることができないメール専用端末などではメールで書籍データを受け取ることによって読書可能となります。

当初、このシステムを自作する必要があるだろうと考えていたのですが、e-shotdはほぼ同様のことができるらしいので、e-shotサービスに乗ることにしました。

Web的にはプレーンテキストによるデータ提供の方が良いらしいので専用ページを用意することこになりそうです。


■またまたベースフォーマット変更 99/11/11

新Webサーバは面倒なCGI送り出しの必要がないため拡張子"TXT"のものを"ZBK"に入れ替えてしまうことができます。

これによって書籍目録から書籍データまでのリンク作業が楽になっています。

旧サーバからの移行でリンク修正が発生するのを機に、ベースフォーマットの見直しを行いました。

TXT形式データは利用を放棄してZBKのみ対応としました。 ザウルスユーザーが使っているテキスト読み出しツールはZBK対応のため問題は無いはずです。

パソコン等でダウンロードする場もEBK,テキスト(ZBK)ともこれまでとは違い正しいファイル名でダウンロードできるはずです。

著者 タイトル EBK ZBK ル ビ 情報 連番

新しいフォーマットはデータ3種、青空文庫への情報リンク1個と新たに連番を用意しました。

これは将来的にe-shotでデータを入手しやすくするためと、メール等でのリクエストを迅速に処理するための布石です。


■遅れる公開 99/11/12

既に新Webにデータをアップロードしてあるのに、告知までに至りません(^^;

これは書籍目録作成が難航しているためです。 従来利用していたオフライン取り込みに障害が発生し目録作成に失敗するという問題が出ており、その解決のために丸1日を使っています。

原因は不明で解決できていませんが、とりあえず一旦インターネット上のWebにアップロードしてからオートサーフィン取り込みという原始的な方法で対応することにしました。


■新Webオープン 99/11/13

やっとザウルス版蔵書目録も完成し、アップロードも完了/公開を開始しました。

現時点では"free01.plala.or.jp/"サーバが高速/快適に使えるためダウンロード等もストレス無く利用できます。

もばりぶニュース4号も配信完了。


■蔵書目録作成システムの開発 99/11/14

これまでもばりぶ蔵書リストの作成は全て手作業でおこなっており、相当の作業負荷となっていました。

「さ」まで来ているのでこのまま全部手作業でも良いのですが、将来的なことを考えるとこのあたりで自動で書庫リストを生成できるプログラム開発を進める必要がありそうです。

このシステムは将来的にはザウルス以外の機種に対応したデータの生成と青空文庫以外のデータも管理することを視野に入れたものとして考えています。

作品-著者-EBK-ZIP1-ZIP2-TXT1-TXT2-図書カードを基本レコードとしてデータベース上に持ち、このデータからHTMLと各種データファイルを生成するというシステムを狙っているのですが、開発工数が多くなることが予想され、その間の入庫をどうするか? 本当に完成するのかなどやってみないと分からない状況です。

でも、ここでやっておけば将来的に書籍データWebを作る人の役にも立つのでやっておいた方が良いのでしょう。


■e-shot対応への取り組み 99/11/16

e-shotサービスセンターからホームページ利用許諾書類が届きました。

これはe-shotで利用しても良いよというページを登録申請するもので、もばりぶでもe-shot向けページを立ち上げてそこを登録する予定です。

ただし、e-shotサービスの全貌がまだ分からないため、どのような形式でデータ提供するのが一番良いのかが決まりません。

ザウルスのメールソフト画面を基本として、10円メールの1通で取り込める範囲である文字数(2000文字ぐらいかな?)で書籍データを切り分けるなどして対応してみたいと考えています。

でも、書籍データを機械的に切り分けるわけには行かないので相当手間がかかりますが、全て手作業でするしか無いのかな〜(^^;


■「た」行データ公開 99/11/17

公開速度としては順調なので「た」行まで達しました。

ただし、蔵書目録システムが無いため目録ページは相変わらず手作業です。

これさえなければ(^^;と思うぐらいの作業量とたびたび構造を変えるすベースフォーマットにより毎回書籍目録を作り直しているような状況です。

「た」行は比較的蔵書数が少なかったため懸案だった「モバイルで読書」のページを用意しました。

私(まると)は常日頃ザウルスのことしかチェックを入れていないため他のPDA状況に疎いところがあるのですが、モバイルで読書の実現にはまだまだ越えなければならないハードルがいくつも存在するようです。

ザウルス系PDA(ザウルス・コミパル・ブラボー)/PalmPilog(WorkPad)/Windows CEといったオリジナルプログラム実行機能があるモバイル機器なら読書ツールの利用ができるのですが、ポケットボード/文字電話といったメール端末系モバイル機器にはこういったオリジナルソフト実行機能が無いためメールを読む画面で読書する必要があります。

メール端末の仕様については各社Webで公開されていますが、読みとれない点として電源を切ったら次に電源を入れた場合にどうなるか?と言うものがあります。

多くのメール端末では電源を切ると次に電源を入れたときにはメニュー画面からスタートするようです。

また、メール画面に切り替えても各メールの先頭から表示となるようです。

こういった仕様は読書にとっては不向きで、長文テキストの場合は毎回相当数スクロール操作をする必要が生じそうです。

e-shotシステムの利用においてはこれが問題となるはずなので、対応ページについてはやはり細切れで提供した方が良いかな?と考えています。


■「な」行データ公開 99/11/18

信じられないことに1日で1行の登録が完了しました(^^)/

今日は雨だな(^^;

これというのも新型ザウルスがまもなく発表されるという噂が流れており、それに対応するために今のうちにできることはやってしまおうと考えたからです。

新型が発表されてから1週間はもばりぶの増強やメンテはできないのでそれまでの間頑張って登録したいと考えています。

蔵書目録作成の速度もかなり上がっており、効率よい登録ができているため進捗状況としては満足できるものです。

あとはリンクの増強や解説ページなどの充実が必要なのですが、こちらも手間がかかるのでボチボチと手を入れています。


■パワザウ3発表後 99/11/19

もばりぶを運営しているざうまがはザウルス系専門メールマガジンです。

ザウルス情報の速報や使いこなしなどのほかに新製品速報も行っています。

11/19に新型ザウルス「MI-C1」が発表され、その取材や各種調査、ざうまが発行、Web更新と目の回るような忙しさになっています(^^;

当面もばりぶに蔵書追加はできません。

このあたりが現在のもばりぶにおける問題点なのです。

ザウルスとは切っても切れないもばりぶですが、切り離さないと先が続かないかも(^^?


■「は」行データ公開 99/11/28

新型ザウルス関連の各種作業も概ね落ち着いたのでもばりぶの増強を再開しました。

10日ぶりに蔵書データの追加が完了、やれやれ(^^;

目標の12月中に青空文庫収録分を登録するという作業は1週間程度遅れそうですが、できるだけ速く立ち上げたいところです。

2000年1月には1999年で著作権が切れる作者の書籍データが大量に青空文庫で公開される予定なので、それまでにはもばりぶも体制を整えないと更新遅延が出てしまうかも。

新型ザウルスは読書にも使えますが、これはカラーで価格も高いのでお勧めできません。

ザウルス系ならブラウザボードが一番良いかも。 かなり安くなってます。


■「ま」「やらわ」行公開 99/11/29

11月中の作業を締めくくるASCII CD-ROM収録分書籍データ登録&公開完了です。

1ヶ月で終わってやれやれと言ったところですが、この後もっと大変な作業が待っているので気を引き締めないと(^^)/

この後青空文庫Web蔵書を順次落としていくことになりますが、現時点で3ヶ月分(ASCII CD-ROM収録分は8月末まで)の遅れがあり、これを2週間ぐらいで取り戻せるかどうかが鍵かな?

2000年初頭には1999年末で著作権が切れる作者の書籍データが一気に公開されるため、これの受け入れ態勢も考えなければならないところです。

思い立ってもばりぶ建設の流れなど作ってみました。


もばりぶただいま建設中に戻る