より良いエンジニアを目指して

1日1つ。良くなる!上手くなる!

AWS,Azure,GCP。三大クラウドサービスの画像からテキスト検出の比較

あるイベントで手書きでメモを取っていたのですが、保存のため、結局はデジタルデータに落とし込む必要があります。

画像から文字列に変換できないかな、と三大クラウドサービスを試してみます。

AWS,Azure,GCPは凌ぎを削っており、画像一枚を分析する程度は無料でできます。

試す画像

153回の簿記三級の試験問題と、問題を解くための私の手書きのメモになります。

f:id:rimever:20200113160242j:plain

f:id:rimever:20200113160248j:plain

AWSAmazon Textract

f:id:rimever:20200113160846p:plain

f:id:rimever:20200113160910p:plain
AWSは日本語を検出しません。

AWSは日本国内でも、全世界でもシェアの高いクラウドサービスですが、日本語に対応してません。

Amazon Textractに限らず、対応しているのは英語とドイツ語と〜、日本語は対応してませんということがあります。

ここが日本語としてAWSに不安を覚える点でもあります。

AzureはComputer Visionだが

Azureは Computer Visionですが画像からオブジェクトを認識するようですが、画像からテキストを抽出するサービスはなさそうです。

f:id:rimever:20200113161103p:plain

GCPVision AI

f:id:rimever:20200113160619p:plain
印刷された文字列ならば、結構検出されます。

f:id:rimever:20200113160515p:plain
手書きの文字はまだまだ。私の字が下手なだけ?