fastapple's blog

時系列関係なく、情報を追記・分割・統合などします。ブログに記載の内容のうち、引用ではなく、私自身が記載している文章・コードなどについては、自由にご利用ください。

人間より人間らしい機械


自分が以前から時々考えていた疑問の一つに、人間より人間らしい機械というのがありうるか?というのがあった。これについて、5年以上前の自分は、それはありえないという持論を持っていた。しかし、今(2015年現在)では、これはありうることである。という持論に変化した。今回はこの話題について、書いていきたい。

人間より人間らしい機械。そういうことを以前からぼんやりと考えてはいたような気がする。もう今から7,8年前になるが、初音ミクの登場でこの原思考を省みる機会が訪れた。初音ミクの歌を聞いた当初は、すごいものを見たと思った。しかし当時(テクノロジーの普及期にありがちな)初音ミク批判のようなものも現れた。そもそも初音ミクを批判している時点で、初音ミクが人間の一部を代替していることを暗黙のうちに認めてしまっているので自己矛盾のようにも思うが(例えばギターが出てきたときに、これは人間のかわりを務めることはできないと批判する人はいないだろう。)、批判が出てくるというのは、それだけ多くの人の関心を買ったからだろう。あれから7年ほど経ったが、正直自分としては、もっと早い速度で、人間の自然な声に近づいてほしいと思う。

当時、そもそも初音ミクは人間ではないのだから、人間以上の人間らしさというものを持つことは不可能であると思った。単純な考えだ。人間ではないのだから、人間らしさで人間を超えられない。という論理だ。

しかし、それはちょっと違うんじゃないかと思ったのは、ある動画で、文字認識におけるコンピュータの進化についての話を見た時だ。羽生さんとドワンゴの会長の対談動画だったと思う。その中で、人間より人間の書いた文字を上手く認識するコンピュータの話が出てきたのだ。見ている途中で、人間が読み取れないのに、なぜその文字を「その文字だ」とする根拠があるのか?という疑問が生まれた。すぐにその動画内で、それについて説明があった。例えばある文字を少しずつ消していくと、ある時点から人間には元の文字がわからなくなるが、その文字認識エンジンを持つコンピュータでは、人間がわからなくなってからも、元の文字がわかるという。

そもそもなぜ人間が、例えば「あ」という文字をみて、それを「あ」だと認識できるのか?という根本的な問題がある。例えば手書きの「あ」は、人によって様々な形で書かれる。しかし人間はそれをすべて「あ」であると認識できる。

この現象について、イデアという概念を持ち出すと割りと単純に説明できる。イデアというのはプラトン哲学の言葉で、ぶっちゃけよくしらないが、理想の形、理想のイメージみたいなものを、人間は心のなかに持っているというのである。例えば、りんごならりんごのイデアというのがあり、自分の心のなかには、完璧なりんごのイデアが存在する。実際のりんごを見た時、人はそれをりんごのイデアが、少し歪な形で現実世界に現れたとかんがえるのだ。

他の例を出すと、例えばこの喩えは使い古されているが、円というのは実際のところ完璧な円を現実の空間に書くことはできない。概念として完璧な円というのはある。この場合、それが円のイデアである。しかし現実空間では歪になってしまう。しかし、ある程度円に近ければ、それを円と呼んで差し支えないだろう。そうしなければ、現実世界には何も、円と呼べるものがなくなってしまう。(掘り下げると面白そうだが今回書きたい話じゃないのでこの辺にする)ここで、あるイデアを現実世界に表現しようとしたものを「インスタンス」と呼ぶことにしよう。我々の「認識」という作業は、ある「インスタンス」を、自分のなかにもっている「イデア」と結びつける作業であるということもできるだろう。

人間の認識モデルは実際のところもっと複雑だと思うが、単純化としてはイデアというのは、まずまず優秀なモデルではないかと思う(上から目線)。先ほどの文字認識の例でいけば、あるインスタンスを、イデアとして認識する作業が人間より得意なコンピュータがあるということだ。

ところで人間もまた現実空間にいる以上、「インスタンス」であるといえる。つまり、人間が人間を認識するとき、人間のイデアというものがあり、それに結びつけている。もし機械を、そのイデアに極限まで近づけることができるなら、生身の人間というインスタンスよりも、イデアに近い機械が存在してもおかしくはない。

一番現実的かつインパクトが大きいのは、人間の声だと思う。近い将来、人間より機械のほうが人間の声のイデアに近い声を出せるようになると思う。