写真を撮るのがお好きですか?
趣味にしているかどうかは別にしろ、何割かの人は旅行先や子供さんの写真を撮ることを趣味にしているかと思います。
そんな方に朗報です。
マイクロソフト(MS)が人工知能(AI)を活用してイメージにキャプションを付けるアルゴリズム技術を開発したと発表しました。
人工知能はイメージを分析し、これを文章で詳細に描写します。 物事を識別するだけでなく、物事間の関係をより明確に説明することができます。 研究陣は人間よりずっと早くて正確に作業を遂行するとお墨付きを与えています。
マイクロソフトは2015年にも同様の技術を公開していますが、5年が経ち、技術は発展しました。 研究陣は、「従来のAIより精度が2倍高いAIです」と話しています。
アルゴリズムの技術レベルはかなり高いと思われます。 マイクロソフトはイメージキャプションベンチマーク(写真にどれだけ正しい説明をつけられるかの試験)「ノーキャップス」で自社アルゴリズムが1位になったと説明しました。
ノーキャップスベンチマークは、制約的な条件において大まかな技術レベルを示す指標として活用され、イメージキャプション分野で広く使用されています。
このAIはどのように役に立つでしょうか?
写真に名前を付けるだけ…と聞くと、大して有用なのかわからないかもしれませんが、
例えばあなたが、数年前にキャンプした先で撮影した滝の画像を取り出したいとします。
取った日付を具体的には覚えていません。もはや4年前のことだったか6年前のことだったかもあいまいです。
これを何万枚という画像フォルダの中から探し出すのは至難の業です。
最近の画像整理ソフトは色で識別することもできますが、…滝の色は水の白い色か、周りの岩の黒い色なのか……まったくわかりません。
しかしこのAIがあれば、まるでネット上を検索するかのように「滝」とワードを入れるだけで、あなたの目的の写真が見つかるでしょう。
それだけでは…とがっかりしましたか?それだけではありません。
これは商業的に大きな意味があります。
例えば新聞社や制作会社が保持している何万枚もの写真。
これらには、もはや何年も取り出されてないような、”埃をかぶった”データが存在しています。
しかしそれらすべてに自動でキャプションがつくなら、必要な写真を簡単に取り出すことができます。
「撮った先から手動で整理してこなかったのが悪い」と思うかもしれませんが、ではその人件費の負担も考えてなければなりません。
これから撮影する分に関しても、整理する作業は短時間で済むことになるでしょう。
更に、ビッグデータを扱う業界の人には、大きな意味があります。
例えばInstagram上にあがっている無数の画像。これらを毎日、無作為に抽出して分析すれば、現在の流行りを自動で分析することができます。この情報はとても高値で取引されている貴重な情報で、精度が高いほど意味があります。
更にデータ分析を進めれば、人々の趣向や精神状態、今後の展望等も見えてくるものがあるかもしれません。
そして、この技術は何よりも視覚障害者に有用な技術になる見通しです。
マイクロソフトは視覚障害者向けに「シーイング」というアプリを公開しています。 シーイングAIは周辺のイメージ情報を認識して文字に変換し、音声で聞かせる機能を提供します。
視覚障害者が前が見えなくても、周りの環境を描けるように詳細に説明してくれます。 該当アルゴリズムがシーイングAIに適用されれば、驚くべき性能の向上が期待できるのです。
また一つ、AIがいい影響を人類に及ぼしてくれそうです。
この技術は近いうちにAzure(マイクロソフトのクラウドプラットフォーム)で公開されるとのことです。
参照:https://blogs.microsoft.com/ai/azure-image-captioning/