今年最後の失敗: LinuxとスキャナーとOCR
以前、小規模に野菜作りをしていたときは、一年を通じての季節や気候の変わり方に敏感にならざるをえない。そのためにやっていたいろんなことの中に、新聞の地方版を参考にして、毎日の日の出と日没の時刻を記述し、表にする、という作業があった。
東京からC県のいなかに引っ越してから、とくにその中の冬の部分を書き起こしたのが、これである。時間時刻は東京のデータ、下のメモ書きは現場がそのいなかである。これの最初の入力は、今は亡きワープロOASYS上、それをMS-DOSのテキストファイルに変換したかしないかの記憶はない。したとしても、今はどこにも見つからない。とにかくこんな、ワープロのプリントアウトではなくて、可搬性に優れたテキストファイルとして保存しておきたい、という意思が前からあった。
##この単純な、日の出と日没の時刻を列記しただけのデータからも、いろんなことに気づくのである。ここではその例をひとつ: たしかに冬至は12月の20日すぎごろだが、しかしその日は、一年でいちばん昼の時間が短い日とは言っても、その日イコール、日の出がもっともおそく、日没がもっとも早い日ではない。日没がもっとも早い日は12月6日ごろ、そして日の出がもっともおそい日は1月7日ごろである。言い換えると、春はまず、12月6日すぎから始まり、1月7日すぎからより本格的に始まる、と言える。たとえば夕方の犬の散歩は、12月上旬までは暗くなるのが早くてうっとおしいが、12月下旬、大晦日が近づくにつれ、夕方の明るい時間が長くなり、犬の散歩も気分良くなるのである。白菜を作っていたころは、その頃からコーヒーかすで作った堆肥を十分に与えていた。
さて、紙の上のプリントアウトからテキストファイルを起こすには、どうするか。スキャナーである。長年、プリンターというものは保有していなかったが、最近のプリンターにはスキャナー機能もある、ということなので久々にプリンターを買った。これが、失敗の始まり。
買ってから分かったのは、プリンターのスキャナー機能とは、紙の上に印刷(または手書き)されているものをあくまでも『画像ファイル』として取り込むことなのだ。私が欲した、テキストファイルではない。PDFまたはJPEGの、ファイルを作ってくれる。上で見たdocument-3.jpgファイルは、そうやってプリンターが作ったJPEGファイルだ。
作業をやり直すためには、スキャナー専用機を買って、そのLinux用のドライバーをインストールすればよい。そしてLinux上の、saneとかxsaneとかのアプリケーションを使う。
でもプリンターを買うのにだいぶふところを軽くしてしまったので、お金の余裕がない。
しかも、うろ覚えの記憶を探ると、Linux上には文字の画像ファイルからテキストファイルを起こす、いわゆるOCR(optical character reader)のアプリケーションがあったはずだ。そいつに、document-3.jpgファイルを読ませるのが、手っ取り早い。
==== making a long story short ====
で、今は何でもクラウドの時代であるので、クラウド上≒Web上に、無料で使えるOCRサービスがある。Google Drive上のGoogle Documentサービスの設定メニューに、アップロードしたファイルに対する「画像→テキストファイル」変換機能がある。
その最終出力が、これだ。表の形式は完全に壊れているが、頑張れば元の形へ編集できるだろう。ふつうの、テキストエディターを使って。
しかし、今のプリンターにはスキャナー機能もある、という都市伝説は、どこでどう間違って私の脳に入ってしまったのか。というか情報過密の現代は、この種の間違いがあらゆる分野にあるのだろう。勝手な思い込み、という他者不在が、あの劣悪な偽(にせ)ニュース事件も招いたしまったのだ(ヒラリー・クリントンはISに銃器を売った、ローマ法王はトランプをエンドースした、などなど※)。
すべての情報は、他者として、批判的かつ対話的に接しよ!!!
※:
Buzzfeedが選んだ2016年の偽ニューストップ50
読者の70%以上は偽ニュースを本物と信ずる
| 固定リンク
コメント
物事を一面だけを見て判断しないようにしようと思ってるのですが、私はまだまだ修行不足です。結局自己中心的になっちゃうんだよなぁ。
投稿: musataro | 2017年1月 1日 (日) 06時44分
万事は他者。
早合点と独りよがりは、あらゆる病の素。
実践するのは至難の業だが、例えば酒と言う物とも他者として接するべき(自戒)。
投稿: 南 | 2017年1月 4日 (水) 11時06分
ノートパソコンには、読んde!!ココというソフトが入ってるが、使った事ないが
これOCRなんかな?
投稿: bad | 2017年1月 6日 (金) 18時56分
@bad
読んdeココについて:
http://denshi-shoseki.jp/news/130213.html
投稿: iwatani | 2017年1月 9日 (月) 13時18分
需要がないから開発やめたんかな。
投稿: bad | 2017年2月 2日 (木) 21時10分
病院の看護師さんらは何と言おうか美しい人が多いわ。勘違いか?
投稿: bad | 2017年2月 7日 (火) 00時18分
家にいた猫はオヤジが殺した。川の所で口から血を流して死んでいた。本当に悲しかった。あの猫は僕の人生の一部で非常に重要な存在だったのに。オヤジのバカ。
投稿: bad | 2017年2月11日 (土) 00時06分
それは動物虐待という犯罪だから、親族であろうとも即、公的(警察&法廷)に罰しないとだめです。
投稿: iwatani | 2017年2月11日 (土) 08時18分
友人がしつこく言うもんで、アナログプレーヤーを買った。音は確かにいいが、それだけの話だ。うーん。
投稿: bad | 2017年2月15日 (水) 17時12分
その友人は今の真如苑の女教祖はダメで
、本当は俺が教祖に成れるのに、邪魔する奴がいるのだと豪語するんである。まあ悪い人じゃないんだけど。
投稿: bad | 2017年2月16日 (木) 02時42分
病院の若い看護師さんに何気に宇多田ヒカルなんか聞きますか?と聞いた所、即
聞きました!聞いてました!昔と答えてくれたので、思わずアハハと笑ってしまった。
投稿: bad | 2017年2月17日 (金) 22時08分