Google傘下のAI企業が対戦データなし、自己学習のみの囲碁AI「AlphaGo Zero」を開発。あっという間に世界最強に

2021.08.25 19:06 カラパイア

［画像を見る］

image credit:youtube DeepMind

　　グーグル傘下のAI企業ディープマインド社が公開した「AlphaGo Zero」は、数千年にわたって積み重ねられてきた人類の知の歴史をたった数日で凌駕してしまう自己学習型囲碁AIだ。ディープマインド社によれば、「人類の知識の限界に制約されない」最強のプログラムである。

・ルールのみ、対戦データなしで自分自身で学習する囲碁AI
　AlphaGo Zeroは囲碁の世界チャンピオンを史上初めて下した「AlphaGo」の最新バージョンだ。

　これまでのバージョンとは異なり、Zeroには囲碁のルールしか教えられていない。前バージョンは人間が打った膨大な囲碁の対局データを元に打ち方を学習したが、Zeroの場合は自分自身と対戦しながら学習しなければならない。

　・無双すぎるその実力
　それでもZeroは、わずか3日で18回世界王者の李世ドルを破った旧バージョンを相手に100戦全勝の完勝。さらに40日後、現世界1位の柯潔を破ったAlphaGo Masterに対して100戦89勝という大差で圧倒した。

　「旧バージョンのAlphaGoはまず人間のアマチュアとプロ棋士が行なった数千の対局を元に訓練する。一方、AlphaGo Zeroはこの段階をパスして、自分自身を相手に碁を打ちながら学習する。その最初は完全にランダムな打ち方だ」とディープマインド社はブログで説明する。

［画像を見る］

image credit:deepmind

　囲碁は人が数千年も昔から遊んできたゲームであるが、一から始めたコンピュータープログラムはものの数日で史上最強のプレイヤーになったのだ。

　最初は人間の初心者と同じであったが、あっという間に腕を上げ、これまでの常識を覆す定石や新手を編み出しさえした。

人工知能の研究は、音声認識や画像識別から遺伝子学や新薬開発までのさまざまな分野で急速な発展を遂げている。多くの事例では、人間の膨大な専門知識やデータにテコ入れするシステムが採用されているが、人間の知識には高価すぎる、信頼性に欠ける、あるいは単に存在しないという問題がある。

そこでこの段階をパスして、人間の知識がなくても高度な領域で超人的なパフォーマンスを発揮できるアルゴリズムの研究が行われている

（ディープマインド社）

［動画を見る］

AlphaGo Zero: Discovering new knowledge・これまでのデータを継承することなしに学習するAI
　AphaGo Zeroはこの目標へ向けた重要な一歩と見られている。そして開発者は同様の技術を応用して、将来的に現実における主要な問題に取り組めるようになると確信している。

　

　例えば同様の技術が、たんぱく質のフォールディング、省エネ、新素材の開発といった別の問題に応用されるようになれば、それによるブレークスルーは社会を大きく変えるだろう。

　だがそれは有限のルールで成り立っているAlphaGo Zeroの開発よりもずっと難しい課題であろう。だがいつの日か、そこに到達する日が来るのかもしれない。

　今回の論文は『Nature』に掲載された。

via:deepmind / thevergeなど/ translated by hiroching / edited by parumo

　将棋の世界でも、最強AIはすでに人間の棋譜には頼っていないそうで、それどころかなんで強いのか開発者も理解できなくなっているという話も聞く。

　ホーキング博士がAIを恐れている理由もなんとなくわかる気がするな。

『画像･動画、SNSが見れない場合はオリジナルサイト（カラパイア）をご覧ください。』