Google Lensの画像認識技術とその未来について考えてみた! |
3年ほど前にネット上で話題になった画像があります。それは海外のもので、「Puppies Or Food?」(子犬たち?それとも食べ物?)と題されたその画像を紹介する記事には、ビーグルとベーグル、シープドッグとモップ、チワワとレーズンマフィンの画像が交互に並べられていました。
誰もが画像を見るまでは「まさか」と思うようなまったく違う「動物」と「物体」が、交互に並べられると実にそっくりであることに皆驚き、そして「これは見分けがつかない」と大笑いしたのです。その画像は今でも時々思い出したようにSNSに流れてきては、その度に話題となるほどです。
人はそれでも、そこに写っているものが犬なのか、それとも食べ物や道具であるのかを正しく判断することができます。例えば、WebサイトのBot(ボット)のクロール対策として画像を選択させる認証システムがありますが、あれはその画像に何が表示されているのかを少なくとも現状ではBotでは正しく判断できないという前提があればこそ可能なシステムです。
しかしながら、テクノロジーの進化はとどまるところを知りません。コンピューターはそこに表示されているものがビーグルなのか、それともベーグルなのかを人間のように判断し始めています。もはやチワワとレーズンマフィンを間違えることも、トイプードルとフライドチキンを間違えることもなくなりつつあります。たった3年の間にどのような進化があったのでしょうか。
感性の原点からテクノロジーの特異点を俯瞰する連載コラム「Arcaic Singularity」。今回はGoogleが開発した「Google Lens」を例に機械学習の仕組みを解説しながら、コンピューターの画像認識技術の最先端を追います。
3年前に話題となった記事。現在はこの記事の画像以外にも数多くの類例が作られ、あちこちでまとめられている。(引用記事はこちら)
■画像認識技術への挑戦は「長い旅の始まり」
(引用元:livedoor news)
0