Archive for the ‘小説電子化’ Category
MeTilTranとeTilTranの使い方とか設定[Tips]
自分用のメモですが、機能の詳細についてまだ分からない部分が多いので実験しながら書いています。
MeTilTranの方が使う機会は多いのでMeTilTran中心です。
再配置の簡単な流れ(いつもやってるような流れ)
- 画像を読み込んで多くのページのノンブルが正しく認識されているかを確認する。
- ノンブルが認識されてないページ(挿絵以外で)を探し、有効領域がノンブルと本文をごっちゃにしているときは
グループ編集で本文のみを有効領域で覆う。(再認識すると元に戻る)
ページ編集に戻し、本文がおかしくないかを確認 - 段のとこをみておかしな数(1ばかりの中に2が混じってたり)を探して、
ノンブルを本文と認識している場合は切り離す(2の方法と同じ)
また角度を調整したりして再認識する。 - 適当なページでプレビューをして、好きなレイアウトに合うように調整する。
自分的にはウィザードで文字サイズ、行数と字数を決めて、細かい余白は設定から決め打ちしている。(この時の文字サイズを覚えておく) - ちなみに行数は19、字数は24ぐらいで余白は時計回りに上22,24,16,16ぐらいな感じにしている。(文字サイズはスキャンする小説毎に異なるのでいつもと見た目が同じくらいのサイズにする。75%前後が多い)
- 設定などができたら、できるなら1ページ1ページ崩れていないかを確認して角度を調整して直す。
- そして出力する。MeTilTranは文字サイズ(出力画像拡大サイズ)を忘れるバグがあるので4の時のサイズを入力する。
自問自答
- Q.ノンブルが左右で片方だけ上手く認識しないとき
偶数ページだけノンブルを認識しなかったり場合の話
画像を読み込む時(MeTilTranのスキャン)にグループ融合文字割合を変えてみる(初期値1.25)
これを1.00にしたりすると意外とできることがある。
分布左右_ノンブルの高さの有効範囲を設定する。
この値があまりにも小さいとノンブルを認識できない事がある。だけど大きくしすぎても意味はない。
30~50くらいで十分
- Q.文字が半分かすれたり、切れたりする。
まあ、 MeTilTranで再配置すると何枚かは必ずなると思う。
このかすれを減らすには角度のズレをなくすといい。
角度変更するときにShift+スクロールで0.1度づつ変更できる。グリッドに合わせてやればやりやすい。
eTilTranで細かく角度を調整するのもいいと思う。
またMeTilTranでも角度の補正はできるのでプレビュー画面で明らかにミスっているものは角度を少し変えてみるといい。
一番楽なのはスキャンするときにできるだけズレをなくすこと。(一枚も失敗しないときは気持ちいい。)
MeTilTranで傾きの設定項目で傾き検出文字数をあまり大きくすると(初期値20)補整角が上手く取得できないので、
大きな値にする必要はあまりない。
画像の大きさの適正とe.Typistの学習機能
前回と同じく小説のテキスト化。
e.Typistは仕事でのOCRに適正化されているみたいで、!など使われづらいであろう
ものの優先度が低めに設定されている感じがします。
なので、学習機能を使ってどのくらい改善するのか試してみた。
そもそも、ライトノベルなどで多用される!?や!!などの読み込みは無視されます。
なのでe.Typistでも(読んでココ!も同じ方法) !?や!!(今回の題材には??はなかった)を一つの文字として
認識させて読み込ませます。
小説をテキスト化する下ごしらえのTips
メモ書きなので、そのうちまとめます。(wikiかなんか作ったほうが良いかな?)
今回はどのフォーマットで下ごしらえをするべきかを比較しながらやってく。
サンプル作品はSnapScan(300dpi)でスキャンしたものを10数ページ。
画像ファイルの下ごしらえ
一般的には文字のようなものはフォーマット的にpngが最適だと思います。
使用ソフトはMeTilTranと藤 -Resizer-とe.Typistの3つを使っていきます。
MeTilTranで画像の角度修正とリサイズの両方の作業ができる、しかしMeTilTranは
画像の出力にはそれほど手を加えられないので、画像のリサイズに藤 -Resizer-を使う場合と比較してみる。
