Blue Prismの内蔵OCRで、請求書の読み取りを試みる<発動?編>
Blue Prismの内蔵OCR機能は、画面の一部を画像化して文字を読み取ることができます。
デフォルトだと、日本語がうまく読めませんでしたが、以下の記事で書いたように、ひと工夫することで日本語も読み取れるようになります。
ここまでで止めておけばいいのに、欲をかいて請求書のサンプル画像を読み取ろうとしましたが、うまくいかなかったのが前回です。
今回は、実際に紙をスキャンして、結果のイメージに対する読み取りを試してみます。
紙の領収書を用意してスキャンする
まず、紙の領収書を用意します。
この前、出張で神戸三宮 東急REIホテルに泊まったので、そのときの領収書を使ってみます。
いやぁ、駅から直ぐで、雰囲気も良く、本当に良いホテルでした。
一階のレストランのラストオーダーが、ちょっと早かったかな。。
・・・生産年齢人口の減少、働き方改革。仕方のないことなのか。
。。話を戻して、紙の領収書をスキャンします。
結果の上下を除去すると、例えば以下のような画像になります。
紙をスキャンした画像なので、折れ目がついてますね。
これでも、まだ大きいので、右下だけを切り取ってみます。
これをBlue Prismの内蔵OCR(tesseract OCR)で読み取ってみましょう。
読み取り結果
読み取り結果は以下の通りです。
本来の内容 | tesseract OCRの読み取り結果 |
お支払金額 | お支払金額 |
33,040 | 33, 。4。 |
ご請求金額 | |
0 | |
(内 消費税: | 内 消賽税ニ |
2,447 | 2' 447 |
うーん、、識別精度以前に、取れたり取れなかったりしてるな。。
思った以上に奥が深いような気がしてきました。。