人工知能が反逆することを想定した非常停止ボタンを開発した──ってネットで公開したのでAIに悟られないか? (2/2ページ)
■ AIの裏をかけ
DeepMind社のLaurent Orseau氏とFHIのStuart Armstrong氏の名前が明記された論文「Safely Interruptible Agents」では、AIが常に適切に動作するわけでは無いことを示し、人間の手でいつでも安全な状態に矯正するための非常ボタンの仕組みが必要であることが提案されている。
同時に、AIが人間の介入を妨害することを学ばないようにする方法も提案していることから、想像以上にAIを危険視していことがわかる。
やっかいなことに、AIは人間が作った非常用ボタン自体を無効にすることも学習する可能性があるというのだ。
そこで考えられたのが、非常ボタンを使って人間が停止命令を出したとしても、AI自身にはそれが外部からの介入であると悟られない仕組みを考えるということだ。
つまり、予めAIのアルゴリズムにある種のトリガーを仕込んでおき、そのトリガーを作動させるとAI自身が自分で停止したと錯覚する様に騙すのだ。
催眠術で、特定のキーワードを聞かせると笑い出すように暗示をかけておくことに似ているだろうか。
■ 一筋縄ではいかないAIの停止
さてさて、これで安心してAIを活用できるかというと、そうでも無いらしい。
研究グループは、全てのAIを停止できるかどうかは現時点では不明だとしているからだ。
AIはいずれ人間並みの知能を持つであろうと考えられているだけでなく、恐ろしいのはその段階に達したAIは一気に人間の能力を超えるとまで考えられていることだ。
私などは単純に、人間にはコンセントを抜くという最終手段があると考えてしまうが、あらゆる分野の制御にAIが介入していた場合、コンセントを抜くことは人間の生活にもダメージを与えてしまうことになる。
つまり、有る段階からAIは、人間の生活を支えるという人質を得ることになるのだろう。
ところで今回の論文はネット上で公開されているが、AIに読まれているという心配はないのだろうか?
【参考】
※ DeepMind develops ‘big red button’ to stop dangerous AIs causing harm – Business Insider
※ Google’s ‘big red’ killswitch could prevent an AI uprising | WIRED UK
※ Safely Interruptible Agents