OCR
いやもう、 いまここを書く時間も気力もないよね。。 Tegaki って何? Tegaki との連携 やってみた (部品を GitHub に)あげてみた まとめ Tegaki って何? Cogent Labs 社が提供する AI-OCRです。 製品情報は(たぶん)。 www.tegaki.ai AI-OCR としての性…
3ヶ月ぶりに革靴、履いたわ。。 (4ヶ月ぶりかも) DX Suite って何? DX Suite との連携 やってみた まとめ DX Suite って何? AI inside 社が提供する AI-OCRです。 製品情報は(たぶん)。 dx-suite.com AI-OCR としての性能、 すなわち、 UIの操作性と…
暑くなったり、寒くなったり、、 風邪ひきそうで怖い。。 ABBYY とは ABBYY 自体、たぶん相当、知名度が高いと思いますが、、 念のため解説! www.abbyy.com いわゆるドキュメント処理(キャプチャ)系の製品 スキャンした画像の補正 画像から文字の読み取り…
以前の記事で、Blue Prismの内蔵OCR(tesseract OCR)を使って、請求書や領収書の読み取りを試みました。 ebo.hatenablog.com ebo.hatenablog.com 結果は、、うーん、なんとも惜しい結果でしたね。 やっぱり、オープンソースのOCRだと限界があるんでしょうか…
Blue Prismの内蔵OCR機能は、画面の一部を画像化して文字を読み取ることができます。 デフォルトだと、日本語がうまく読めませんでしたが、以下の記事で書いたように、ひと工夫することで日本語も読み取れるようになります。 ebo.hatenablog.com ここまでで…
以前の記事で、Blue Prismの内蔵OCR(tesseract OCR)に、日本語の言語パック(jpn.traineddata)を入れてアレコレ試しました。 ebo.hatenablog.com 以前の記事では、Webページの内容を画像として読み取っていました。今回は、もう少し業務的なイメージを読…
昨日の台風、すごかったですね。 Blue Prismの内蔵OCR Blue Prismは6.0から、オープンソースのOCRツールである tesseract OCR が内蔵されるようになりました。 tesseract OCRであれば追加コストが不要で、かつ簡単に使うことができます。 github.com さて、…