2013年04月16日

電子化書籍の作り方と整理方法

 年とともに書籍が増え、だんだんと書棚に収まらなくなっているのは、私だけではないでしょう。
 原子力関係の仕事をしていた上に、医学関係に進学し、さらには小説、マンガ、趣味の本と多様な書籍を購入していましたので、もともと本棚はきちきち。さらにこの原発事故で大量の本を購入し続けていますので、完璧にパンクしました。
 もう見返す可能性は、ほとんどないけれども、古本屋に二束三文でうるのも悔しい。それで、使用したサービスが、通称「自炊」といわれる裁断して、PDF化してくれるサービス。

デジス-格安だったが、つぶれた
INPECHITTO白黒、カラーの判定がやや雑
SCANEXPRESSクロネコ受け取りサービスもあって仕事も丁寧(A3可)だが、Paypalが使えない

これらのサービスを使って、今までに300冊ほど電子化を行いました。

送付前に、私本管理を使って、本についているバーコードから蔵書リストを作っておくと便利です。古い本の場合は、ISBN-13が印刷されておりません。その場合には、ISBN-9のコード+JANCODEチェックデジット計算

例) ISBN 4-08-851570-6 の場合 頭に 978 をつける
978408851570 として、ホームページで計算すると、チェックデジット0
私本管理に 9784088515700 と入れると、題名が出てきます。このようにしていけば、さほど苦労せずに蔵書のリスト化ができます。
2013041601.jpg

もちろん、最近の本はバーコードでISBNは簡単に入力できます。どれでもいいのですが、とりあえず安かったバーコード(私自身はこの機種を購入したことはありません)


取り込んだファイルは、Openbookshelfで管理。
2013041602.jpg

2013041603.jpg
このようにファイルの場所を指定しておけば、上記書棚をダブルクリックすることで目的とする本をパソコン上で簡単に開くことができます。このようにしておけば、スキャンした本が行方不明になることはないでしょう。

また、Calibre というフリーソフトもいろいろと使い勝手がいい(様々な形式の電子ブックが開ける)ようですが、私はそれほど使用はしておりません。

自分で電子化する場合(Scansnap)+裁断機


できまりでしょう。手間さえかければ、さくさくと電子化できます。

さて、本題(前振り長いですが・・・)。どうしてもばらしたくない本を電子化する方法をここからご紹介します。必要なのは、
irfanview−画像表示ソフト
uwsc−マウス、キーボードの自動化ソフト
・フラットスキャナ(最近の複合機で十分)

です。

Irfanviewを起動させ、この一括スキャンを選択
2013041604.jpg

画像を保存するディレクトリ、ファイル名などを適当に指定
2013041605.jpg

そうするとスキャナーの設定画面が出てきますので、文書に応じて、カラー、グレー、モノクロを設定します。(これは、スキャナーによって画面が変わってきます)通常の書籍であれば、モノクロ300x300dpiもあれば十分です。(200dpiでもいいかも)
2013041606.jpg

こうしたところで、UWSCを起動させ、スキャンボタンを押すという動作を覚え込ませます。
設定は、下記の通り
2013041607.jpg

ALT-F3 → スキャンボタン → ATL-F2 でその後、read.uwsとして、スクリプトを保管

autoread.uws として、次のファイルを保存
>>>>
for i=0 to 100
call read.UWS
sleep(5) // この部分の数値は適当に変えてください。小さすぎるとうまくいきません。
next
<<<<<

UWSCにこのautoread.uwsを読み込ませて起動しますと、あとはスキャンボタンを自動的に押してくれます。そのタイミングに合わせて、本をページめくりしながらスキャナーに読み込ませると1ページずつ画像をパソコンに自動保存。

そして、できあがったファイルをAdobe Acrobat Standard( Scansnapに標準添付)を使って、PDF化します
2013041608.jpg

読み取った画像をすべて選択
2013041609.jpg

最後に、ツールのところにある文字認識をかけますと、おおよそ文書がテキスト化され、検索することが可能となります。
2013041610.jpg

ちょっと難しいのですが、この方法を用いますと約1時間ほどで本を傷めることなく、電子化することができます。

 ちょっと難しかったでしょうか・・

動画にしてみました。
タグ:電子化
posted by いんちょう at 22:12| Comment(5) | 原子力
この記事へのコメント
電子書籍化が待てずに自炊しちゃう人も多いですね。最近はよくAmazonで自炊後の断裁本がたたき売られていますよ(著作権的にも考えさせられますね、スキャンがダメだとしても手書きでコピーは?江戸時代は手書きでコピーしていたが)。

確かに文章だけの本なら電子書籍も悪くないですが、個人的には書き込みなどが出来ないのが痛いです。小説やエッセーなどは読めば終わりのことが多いが、理工書などはノートを作るのも面倒で直接本に書き込む事が多いもので。スマホで電子ノートを作るときの最大のネックもこれなんだよな。ローテクだが紙に書いて写真をとるぐらいしかない。問題は数式入力などの規格化が遅れていることですが一向に進まない。全文検索すら未対応。全て10年前の技術で実現できるだろうに、内輪もめして一向に進まないのは電力と同じ。電子書籍もwin95の時代に実現できたが、規格化による内ゲバで日本企業は自滅しているのはWikipediaとかに書いてある。戦前から開発した技術をどう運用するのかということまで考えていないんだろう、支配階級にとっての便利な魔法使いとしか思われていないし作っているほうも運用までは関心がないので性能を上げることしか考えていない。徳川封建制時代から、考え方が変わっていない。欧米だとルネサンスやフランス革命が早かったからそこまでひどくないだろうと江崎玲於奈(ソニーを辞めて渡米したノーベル賞物理学者)が言ってた。話を戻そう。

みんなPDFには詳しいが、肝心のリフロー式であるepubなどはろくに知らない。個人的にスマホで読む事が多いもので、PCやタブレットも持っているがほとんど使わない。こういう人にこそ、知って欲しいのですが。

簡単に説明するとリフロー式ってのは画面サイズにすら依存しないで画面が小さくなれば文字や改行すらリサイズされてページ数をも変動するような文章システムのことです。携帯でPCのサイトを読むと、一行が一画面に収まらずに一行読むごとに画面を横にスクロールさせていかないとよめないので大変面倒くさい。スマホにPDFなどをぶち込んだ場合も同様である。これを改善したのがリフローってわけでibooksやKindleとかで使われてる技術だ。ここで売ってる本は全てリフロー式なわけ。売りたければepubを作ればいい。これらではPDFも読めるが、リフロー式のファイルだと小画面でも困らないというわけ。このブログを含め表示が最適化された携帯向けのページがあるサイトは多いが、それと似たようなものであると認識してくれればいい。ただページの概念すらなくなってしまったのでどこらへんに書いてあったのか、アナログな感覚で記憶していることも多いがページ数まで暗記しておかねばならないから面倒くさい(ただブックマーク機能もあるけど)。


リフロー式のデメリットは数式や図などの表示が遅れていると言うことだろう。特殊文字も画像化して埋め込んであるから、同様だ。スマホで黒背景で読むことが多いのですがこの図の表示が本当酷い。こういうことも声を上げないと、変わらないだろう。中身はHTMLなので、内部リンクなども貼れるが、画像の相互参照とかが非常に面倒。ここらは、技術が洗練されるのにもう少し時間がかかるだろうから、教育の電子化というのはもう少し時間がかかるはず。iBooksの独自形式だと、比較的自由だが、それでも数式の入力や表示などがひどいので技術が完成しない限り本格的な本を書くのは難しい。日本語版が絶版で数千円から数万円、あるいは流通すらしていないような本でも英語版電子書籍は数百円ということもあるのですが、肝心の数式や図の表示があまりに酷いものがおおいのですよ。

Amazonやアップルストアで売りたければ、PDFではだめで、epubを作成せねばならないところが、どうも敷居が高いのではないかと見ているが、epub自体は文章だけの本ならなんとか実用レベルにはあると思いますが、数式や図の表示が難しい。epubそのものは情報が既に大量にあるので素人でもちょっと調べれば文章だけの本なら簡単に作れるとおもう。でもアメリカのKindleが出て数年たつのに数式未対応だし、向こうもやる気がないのだろうか。現状iBooksのが優れてますが、独自形式だとMac必須なのが困る。epubならOSは不問で出せるけれど。
Posted by 今日は電子書籍ですか at 2013年04月16日 23:00
自民党 鬼木誠氏(福岡2区選出)が「食品に含まれる放射性物質の規制値が厳しいから、不安をあおり風評被害が発生する」と発言。

福島のJAが福島産の農作物を市場や流通関係者に取り引きの拡大をよびかけた。

Posted by キチガイの国 at 2013年04月17日 06:43
きれいに裁断さえ可能ならコピーファックス自動紙送りがついた大型の複合機に裁断後のページまとめてセットしてスキャンは出来そうです。コンビニとかに裁断機とデータを携帯ディスクに落とせるコピー機があるといいですね。
Posted by だいきち at 2013年04月17日 09:24
先生の書籍をばらさずに(つまり自炊せずに)書籍のコピーを作る方法は
素晴らしいですね。

自分の書籍の整理も兼ねてやる場合はそれでもいいのでしょうが、
書店ではもう販売されていなくて他人様から借りたり、図書館から
借りたりしてきた書籍をコピーする場合はばらすことはできませんから、
その場合には実に有効な方法ですよね。

色々検索しましても自炊業者は多士済々ですが、ばらさずにコピーを取ってくれる業者は見当たらないようです。自炊するよりは高いものに
つくでしょうが、そうゆう手段でコピーを作成してくれるところというのは
ないのでしょうか?
Posted by ハマの住人 at 2013年04月19日 06:52
パソコンなどが本格普及する前は、二冊購入して家や職場の机の上で読むためのものと、バラしてページを切り離して章ごととか、節ごととかに分けて持ち運んで外出先や移動中にも勉強している医者や学者などもいたとか、きいたことがあります。数年前もパソコンが普及してきていろいろな学習用ソフトとか、あったものですが、それがいまやスマホで世界中どこでも、寝ながらでも読めますから便利になったもんです。

文字認識もまだ完璧じゃなく、いろいろと課題も多いとかきいたことがありますが(日本語は字が多いからねえ)まがりなりにも検索できるもが大きい。ただスマホのマシンパワーでは全文検索がきつい。

そういえばAmazonでも中古の専門書の断裁本、結構たたき売られてるんですよ。電子書籍の論評には変化が激しくてはついていけないとか、よく言われてますがまだまだ変化が激しいですから読者サイドもいろいろ試しながらやっていくしかない。こういう誰でもできそうな地道な技術の啓蒙普及が、役立つものです。

私の場合は全部スキャンするのも面倒だし、読むのに時間がかかる専門書などの場合は節ごと、章ごとにスマホのカメラで撮影して、写真管理アプリでフォルダ分けして利用するという手法を使ってます。これだと移動中とか待ち時間とかでも、結構読めるんです。かなり原始的ですがまさにコロンブスの卵だと思ってます。しかもメモアプリ連携とかスクリーンショットなども組み合わせられます。文章だけの本だとそのぐらいじゃすぐに読破してしまいますし全部取り込むのも面倒ですのであまりやってませんがこれの取り込みも時間があればできます(ただ個人的にはスキャンする時間を読むほうに使ったほうが早いかなと思ってる)。このぐらいの用途なら中古のiPod touch とかでも事足ります。そういえば楽天がIOS版のkoboを出したが、古いOSは未対応だったので注意されたし(電子書籍目的で中古型落ちiPodやiPadなどを検討されてる方)。

ほかにはアナログになりますが、文庫本や新書などをポケットにいれて持ち運ぶぐらいでしょうか。文庫本といっても小説などのみならず、結構レベルが高い本格的なものから広いテーマのものも多いので参考文献を読みつづけるというマラソン的方法から図書目録などをみてみて興味があるものをひたすら読破を試みるというのも案外勉強になります。しかも文庫本とかだと大抵の図書館にはおいてありますからね。田舎でも県立図書館から取り寄せれば大抵はあると思います。本というのは自分がギリギリ理解できるぐらいのがちょうどいいそうです。誰かに言われたからというより、自発的にやっていくようにしないと。

あとYouTubeですが、倍速再生できるソフトなどが結構あるんで、長時間のドキュメンタリービデオなどを試聴する際におすすめです。OSや環境がわからないかぎりどれがいいとは一概にいえませんので自分で調べて下さい。1.5倍から2倍ぐらいならば、すぐになれますよ。例えば2時間の動画を試聴する場合でも2倍なら1時間で見れるので、時間節約にもなります。
Posted by 電子書籍で使えそうな技術 at 2013年04月22日 13:01
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。