この記事のポイント
- Google、Android アプリ用ドキュメントスキャナ機械学習 API「ML Kit Document Scanner API」提供開始
- アプリに「ML Kit Document Scanner API」を組み込むことでドキュメントスキャナ機能を実装可能
- Android 版「Google ドライブ」「Pixel カメラ」アプリなどにすでに実装済み
Google は 2024 年 2 月 22 日(木)、Android アプリ用ドキュメントスキャナ機械学習 API「ML Kit Document Scanner API」を、アプリ開発者向けに提供開始しました。
Android アプリ用「ML Kit Document Scanner API」は、アプリ内にスマートフォンのカメラで捉えたテキストが写る画像から、テキストを読み取ってテキストとして抽出したりできるようになる API です。このほかにも、書類の角検出や自動回転検知、影や汚れの除去などの補助的な機能も内包されています。
また「ML Kit Document Scanner API」は読み取られたデータがクラウドに送られて処理されるわけではなくデバイス上で各処理が行われる仕様で、セキュリティとプライバシー保護も考慮されています。このほか、「Machine Learning(ML / 機械学習)」の知識がなくても、「ML Kit Document Scanner API」を用いることで簡単に「ML(機械学習)」機能をアプリに実装できる点も特徴。
「ML Kit Document Scanner API」は今回開発者向けにリリースされたわけですが、Android 版「Google ドライブ」「Pixel カメラ」アプリなどにはすでに実装済みです。また他にも、「ML Kit Document Scanner API」を実装している Google アプリは複数あると予想されます。
そして今後さらに、ドキュメントスキャナ機能を実装する Android 用アプリも増えてくるでしょう。
Source:Google
コメントを残す