Google Cloud、Microsoft Azure、Tesseract.js のOCR機能対決をやってみた
はじめに
結果的に Google Cloud の VISION API (画像認識) の OCR機能が凄かった件の話です。
今回は、
JavaScript だけで 文字認識できる「Tesseract.js」と、
Google Cloud の VISION API、
Microsoft Azure の Computer Vision のOCR機能を比較してみます。
1つめの画像
「Tesseract.js」の公式サイトにある、サンプル画像です。
「Tesseract.js」の結果
Mild Splendour of the various-vested Night!
Mother of Wildly-working visions! haill I watch thy gliding,
while with watery light Thy weak eye glimmers through a fleecy veil;
And when thou lovest thy pale orb to shroud Behind the gather’d blackness
lost on high; And when thou dartest from the wind-rent
cloud Thy placid lightning o’er the awaken’d sky.
「Microsoft Azure Computer Vision」の結果
Mild Splendour of the various-vested Night!
Mother of wildly-working visions! hail!
I watch thy gliding, while with watery light
Thy weak eye glimmers through a fleecy veil;
And when thou lovest thy pale orb to shroud
Behind the gather'd blackness lost on high;
And when thou dartest from the wind-rent cloud
Thy placid lightning o'er the awaken'd sky.
「Google Cloud VISION API」の結果
Mild Splendour of the various-vested Night!
Mother of wildly-working visions! hail! I watch thy gliding, while with watery light
Thy weak eye glimmers through a fleecy veil; And when thou lovest thy pale orb to shroud
Behind the gather'd blackness lost on high; And when thou dartest from the wind-rent cloud
Thy placid lightning o'er the awaken'd sky.
共に問題なく認識されました!!(みんな引き分け)
2つめの画像
「Tesseract.js」の結果 (何が起きた??)
| V n9"a \ Ge ofi‘ice I post , w“ .4, 5 PM PM” 13‘ ‘ ‘ ‘ , m l 71W l Level 3 $5 hm ' “mam é?" ‘ Level 1 ' ‘5: D‘paflmnnl «Training and ,7 H' E Workiwu Dwalopmnnt X», : Bummer Smile- Cenh % - K .314“
「Microsoft Azure Computer Vision」の結果
General
Post Office
3 Forrest Place
Level 3
Metropolitan
Redevelopment Authority
Level 7
Department of Training and
Workforce Development
Customer Service Centre
「Google Cloud VISION API」の結果
General Post Office
3 Forrest Place
Level 3
Metropolitan Redevelopment Authority
Level 7 Department of Training and Workforce Development Customer Service Centre
平面ではなく、奥行きがある文字は Tesseract.js は苦手みたいです
Microsoft Azure、Google Cloud は完璧です。
(ここは改行位置が完璧な Microsoft Azure が勝利)
3つめの画像(日本語)
「Tesseract.js」の結果 (まぁある程度認識している)
タ イ ポ グ ラ フ ィ 美Lく文字を組む 初醜状惠〟ヵ夕ヵナ、平仮名が闇いて入ヵされ、
漬宇か艦まっている タイポグラフイ 美しく文字を組む ー文宇すつ闔整した例〝 〝
ソフ卜ウェアの数値に左右されす`視覚たけ雄置を讀肇している 図=文宇粗のサンブル
「Microsoft Azure Computer Vision」の結果(AIに何が起きた?)
1:X5180+>JJ
「Google Cloud VISION API」の結果
タイポグラフィ 美しく文字を組む
初期状態。カタカナ、平仮名が開いて入力され、漢字が詰まっている
タイポグラフィ 美しく文字を組む
1文字ずつ調整した例。 ソフトウェアの数値に左右されず、視覚だけで位置を調整している
図1:文字組のサンプル
なぜか Microsoft Azure はまったく認識されませんでした
Tesseract.js は一部読めてました。
Google Cloud さんは恐ろしいくらい完璧です。(Google Cloudの勝ち)
4つめの画像(カタカナの手書き)
「Tesseract.js」の結果 (ブ??)
ブ、
「Microsoft Azure Computer Vision」の結果(ギブアップされました)
画像内で単語を検出できませんでした。
「Google Cloud VISION API」
ダイエット
ここでも、Google Cloud さんは恐ろしいくらい完璧です。(Google Cloudの勝ち)
5つめの画像(英語の手書き)
「Tesseract.js」の結果 (ん〜)
而AN k Ynu FDr 〔Dm垢日
「Microsoft Azure Computer Vision」の結果(またギブアップされました)
画像内で単語を検出できませんでした。
「Google Cloud VISION API」
THANK YOU For Coming
またまた、Google Cloud さんは完璧です。(Google Cloudの勝ち)
最後に
結果は、いずれの画像も完璧に認識してくれた Google Cloud さんの完全勝利でした。
恐ろしい認識力ですね!!
0 件のコメント:
コメントを投稿