雑誌の整理

パソコン関連の雑誌を見るのが好きである。特に、手持ち無沙汰の帰りの電車では、これは必須アイテムである。ただし、朝は見ない。何故か分からないが朝からは見る気がしない。朝は文庫本かたまに新聞である。

さて、この雑誌。貧乏性なのか、農耕民族の証なのか、家に持って帰るとなかなか捨てられない。従ってどんどん貯まる(溜まる?)。特に中身の半分が広告という雑誌などは非常に場所を取るし、薄いものも本立てにきちんと詰めて立てておかないとグニャと変形してしまう。

しかし、保管場所の話も狭い我が部屋では深刻な問題であるが、それより問題なのは見たい記事がなかなか見付からないことである。1ヶ月以内の記事は記憶も残っているし、その辺に平積みになっているのでいいが、それより以前となると、これはなかなか見付からない。どの雑誌だったか、いつ頃だったかも分からない場合などは、もうそこら中をひっくり返してイライラすることになる。

たまに気が向けば、雑誌から再び見たい記事を切り取り、クリアファイルへ入れたりもするが、これも量が増えるとファイルが場所を取るし、見たいものが直ぐ出ないこともある。

そこでやってみようと思うのが、電子ファイリングの真似事である。紙のまま必要なページだけを切り取り、クリアファイルへ入れておく方が手っ取り早いのは明らかである。しかし、パソコン好きというのは、かえって時間がかかると分かっていても、せっかくのパソコンを生かしたいと思ってしまう。既にスキャナは持っているし、画像管理ソフトなんてのも最近色々あるらしいし、などと言いながら。

その方法

電子ファイル化にはおそらく色々な方法があるだろう。中には専用のハードやソフトもあるだろうが、これからやるのはあくまで汎用のハードと個人向けソフトを使う方法である。

大雑把なストーリーとしては、まずスキャナでページを読み取り、これを画像ファイルで保存し、あとは画像管理ソフトで管理するという感じである。併せてOCR(光学文字認識ソフト)も有用であれば併用する。

雑誌の記事でもこのような方法は紹介されているので、目新しいことは全然無い。ただ、雑誌の記事はスゴ〜ク上手くいって、涙が出る程感動的な出来上がりが多いが、実際は?である。各論の問題などは実際に自分で試してみるしかない。雑誌ではそう細かいことは書いてられないし、ユーザのマシン環境にも差があるし、だいいち、そんな悲観的な記事じゃ誰も読まないもんね。

スキャン

で、まずは雑誌のスキャンである。雑誌の大きさというのを改めて見ると、変なサイズだと分かる。短辺はA4とほぼ同じ長さであるが、長辺はA4より2cmほど短いのである。何故かは知らないし、別に知る必要もないが。

さてここで、チョイと面倒なのは、フラットベッド型のスキャナでスキャンする時、当然雑誌は冊子に綴じてあるので、そのままではスキャンし辛いのである。薄い雑誌であれば、よく開いておけばページ全面をスキャン出来るが、それも片手で雑誌を押さえながら、もう一方の手でスキャナのスタートボタンを押さなくてはならない。さらに背表紙付きの厚い雑誌ではこれも無理で、バラさないとスキャンすることも出来ない。

OCR

次に決めるのは画像の解像度とファイル形式であるが、その前にOCRとの関連を調べてみた。使用予定のソフト「e.Typist」のマニュアルによると、予め読み込んだファイルを認識させる場合の条件は次のように記述されている。

つまり、(パーソナルレベルでは)比較的高解像度である300dpi前後で読み込んだBMP形式というと、ファイルサイズが凄いことになると思ってしまうが、白黒2値である。従って、画像を見る時はカラーの別のファイルで、OCRをする時はこの条件に合う別のファイルが必要と考えた方が良さそうである。もっとも、常に2つのファイルを用意するのは面倒だし、白黒の画像はOCRが済めば不要なので、最初にOCRをするか決めて、必要なファイルを作っていった方が良い。

では、OCRはどのくらいの精度が出るのだろう。e.Typistのマニュアルでは「100%は無理なので期待しないでくれ」と弱気なことを書いているが。

150dpiで読み込み
Photoshopで1回シャープをかけた画像
V‐700
カシオ計算機7万5
5万6900円1/4インチ万画素原色系CCD38
1雨寺目パンフォーカス70C(マクロ14C640
×480コンパクトフラッシュ2MB/2
独自フォーマ2.5インチTFTQ
ありありK単3アルカリ乾電池4本(ニッケル水
素、ニッカド目DO147×69×50/290g シリア
ル、PCカード
300dpiで読み込み
OCRにかけたテキスト
V‐700
カシオ計算機7万500円
6900円1/4インチ35万画素原色系CCDA38
+自○パンフ才一カス70C晩1(マクロ14C640
×80コンパクトフラシュ2MBFl/2
7枚独自フーマットH2.5インチTFTJ
ありあり単3アルカリ乾電池4本(ニッケル水
素、ニッカド1画DO147×69×50曲面290g シリア
ル、PCカード
400dpiで読み込み
OCRにかけたテキスト

ふ〜む、努力賞ってとこかなぁ。

画像保存形式

話は元に戻って、画像の解像度とファイル形式である。


ん〜、何だか面倒くさくなってきた。ふとスキャナから雑誌を戻して見てみると、何と見やすいこと!紙ってなんて素敵なんだ!!!ふと思い出した。どこかの雑誌のインタビュー記事で、Adobeの偉い人が言ったコメント。「もはやライバルは紙だけです」

最初に戻る