データサイエンティストAnchorBluesのブログ

とある民間企業で数学とコンピュータサイエンスをやっている研究員のブログです。

シンボルグラウンディング問題について -人工知能が超えつつある壁

最近は人工知能技術の発展が目覚ましい。
どうして最近になって急激に人工知能技術が発展したのだろうか?
その理由の一つとして、Deep Learningによって、「シンボルグラウンディング問題」を克服することが出来たから、というのがあげられる。
Deep Learningについては今回はひとまず置いておいて、今回はこの「シンボルグラウンディング問題」についてまとめたいと思う。

シンボルグラウンディング問題とは

記号(文字列、言葉など)を、それが意味するものと結びつけることが出来るかどうか、という問題。
コンピュータは2012年頃まで、このシンボルグラウンディング問題を克服できずにいた。
つまり、記号がどのような概念を指すものなのかを理解したり、記号をその意味するところと結びつけたりすることが出来ずにいたのだ。

シンボルグラウンディング問題の具体例

あなたはどのようにして「ツノメドリ」の概念を獲得する?

例をあげて説明しよう。
以下の画像を見ていただきたい。

f:id:AnchorBlues:20180131180913p:plain

この画像は、「ツノメドリ」という鳥の画像である。
画像をじっくり見て、ツノメドリの特徴をしっかりと捉えていただきたい。
その上で、以下の質問に答えてみよう。
下の画像に写っている鳥はツノメドリだろうか?

A. B.
f:id:AnchorBlues:20180131181012p:plain:w300 f:id:AnchorBlues:20180131181034p:plain:w300

なんと馬鹿げた問題だろう。Aはツノメドリで、Bはツノメドリではない(ハトだ)。当然のことである。
ではあなたは、どのようにしてそのように判断することが出来たのだろうか?
恐らく、最初にツノメドリの画像を見た際に、ツノメドリの特徴を抽出していたのではないかと思う。以下のような感じに。

  • 目が縦に細く見えるような模様
  • ペンギンみたいな白黒の身体
  • クチバシが短い
  • 足に水かきがついている

そして、Aに写っている鳥はこの特徴に合致しているから「ツノメドリである」、Bに写っている鳥はこの特徴に合致していないから「ツノメドリではない」と判断したはずだ。

コンピュータが一から概念を獲得することは至難の業

これは人間にとって、ごくごく自然なことであるように思われる。
しかし、コンピュータではこの処理を的確に行うことが出来ないのだ。
何故か。画像のどこをどう見たらいいのか、つまりツノメドリの特徴として何に着目したらいいのか分からないからである。
あるコンピュータは、ツノメドリの特徴を以下のように捉えてしまうかもしれない。

  • 翼は常に閉じている
  • 鳥の背景の色が灰色っぽい

そしてこの特徴を元に、翼を開いていて背景の色が灰色っぽくないAの画像の鳥は「ツノメドリではない」、翼を閉じていて背景の色が灰色っぽいBの画像の鳥は「ツノメドリである」と判断するかもしれない。
普通の人間はこんなふうには考えない。ある種類の鳥を認識する時に、翼が閉じているかだとか、背景が何色だとかに着目しても、ツノメドリという概念を獲得することが出来ない、ということを「直感的に(あるいは経験的に)」分かっているからだ。
しかしコンピュータはそれが分からない。画像のどこを見たらツノメドリという概念を獲得することになるのかわからないのである。
もしコンピュータのツノメドリの認識精度を上げさせたい場合には、「鳥のある種類の概念を獲得するときには、その身体の色やクチバシの形状を見ればいいんだよ」というように、どこに着目したらいいのか、ということをまず教えてあげないといけない。

Deep Learningの登場によって

しかし最近出てきたDeep Learningでは、この問題を克服しつつある。
画像を見た時に、その画像のどこをどのように見たらいいのか、というところまで、コンピュータが自動的に識別できるようになってきたのだ。
このDeep Learningの技術の発展が、人工知能技術の発展を押し上げているのである。

参考文献

松尾 豊 著『人工知能は人間を超えるか』(角川EPUB選書)