2011年1月6日木曜日

境界線が不確か

 昨夜というか今朝というか、また妙な時刻に目が覚め、起き上がってしまうと寒くて完全に目が覚めてしまうので、手が届く範囲に一冊あった文庫本を開いたら内田百閒集成3の『冥途』(ちくま文庫)だった。すでにほとんど読んであるはずだが布団のなかで開いたら「流渦」。文庫本でたった4頁だが怖い。怖いというか、残雪の小説のような現実でも非現実でもない、その中間にぶら下がっている世界に引き込まれている感じがした。次は「山高帽子」、こちらはもっと長いがこれも正気と狂気の境界線が不確かになっていて同様な落ち着きの無さに身を置かされてしまう。
 また、何とか原稿を書いてしまったら、百閒先生の小説のような小説でないような作品をもう少し読もうかな。

 昨年末に「デジタル文学館」に推薦をいただいた作品の掲載誌が、今日、郵送で届いたので夕食後、早速スキャニングし、OCRソフトにかけてテキストデータに変換し始めた。
 ほぼ半分ほど済んだので、インスタント・コーヒーで一息入れながら、今、この記事を書いている。(案外デリケートで夜に豆から淹れたコーヒーを飲むとカフェインが効きすぎてしまうのです)
 使い始めの頃のOCRソフトは読み取りミス、変換ミスが多く、いっそキーボードで新たに入力した方がましではないかと思うくらい精度が低かったが、最近のものは上手にスキャンすれば1頁に一ヶ所もミスが無いくらい読み取り精度が上がっている。とはいえ、ミスがないか、一字一句あたらなければならないのは同じだ。モニター左側のスキャンした画像と右側のOCRが画像から変換した一字一句を比較しながらミスを探し、同時に作品も読んでゆく。校正の場合は文章を読んではいけないと言われるが、横着をしてミスを探しながら読んでしまう。うーん、すごいな。随分面白い。キャラクターも面白い。それもデフォルメやらカリカチュアやら、作家としての安吾を思い出したりボリス・ヴィアンの作品を想起ししたり......あ、いけない、まだ最後まで読んでないのにこんなことを書いてしまって。

2 件のコメント:

  1. その昔、経理屋だった私にとって、現在のOCRの読み取り精度は、まことに驚異的です。
    経理ソフトにも、手書き伝票のOCRというのがありましたが、勘定科目コードと金額という数字だけがOCR読み取りの対象で、摘要欄などはただの転写でしたし、たかが数字でさえ、読み取ってくれず、画面上でいちいち確認、打ち直しをさせられたものです。いかにOCR読み取りが正確な数字を書くか、部署内で競い合ったものでした。
    まこと、現在のIT業界の在りようは、産業革命か、あるいは戦時のような、技術革新の嵐だと感じます。いったいいつまでこの疾走は続くのだろう、いつになったら落着くのでしょう。
    > 百閒先生の小説のような小説でないような作品
    へそ曲がりの私は、またしても、小説のようではない小説をもくろんでしまっています。でも、もちろん百閒さんのようではなく、今考えているのは、花田清輝のような、小説らしくなさなのですが、志だけではいかんとも・・・。
    デジタル文学館に新作掲載、楽しみにしています。

    返信削除
  2. Lydwine.さん、コメントありがとうございます。
     二十年前には自分がパソコンを使ってこんな作業をしてウェブやら同人誌編集やらをこなしているなど、想像も出来なかったですね。
    >小説のようではない小説
    うふふ、楽しみです。
     デジタル文学館の新作、実は、先ずはLydwine.さんの感想が聞きたいと思っているくらいなんです。お楽しみに。

    返信削除