همه جا صحبت از یادگیری ماشینهاست؛ اینکه به ماشینها بیاموزیم چه کاری را انجام دهند و بعد از اینکه به خوبی وظایفشان را آموختند، آنها را رها کنیم تا خودشان بطور هوشمند کارها را انجام دهند. هنوز این ایده به خوبی عملیاتی نشده است که با گونه جدیدی از ماشینها مواجه میشویم: ماشینهایی که خودشان یاد میگیرند؛ بدون نیاز به دانش انسان. نسخه جدید AlphaGo مثالی است از چنین ماشینهایی.
AlphaGo چند ماه پیش یکی از استادان بازی سنتی Go را شکست داد. چندی بعد نسخه بهبود یافته آن، AlphaGo Master در ۶۰ بازی، بهترین بازیکنان این رشته را مغلوب کرد. نسخه جدید یا همان نسخه Zero این برنامه تفاوت عمدهای با نسخههای پیشین دارد و آن اینکه بدون نیاز به انسان و آموزش دیدن و تنها با دانستن قوانین ابتدایی بازی، خودش بطور مستقل بازی را آموخته و در این بازی مهارت بالایی پیدا میکند به گونهای که نه تنها موفق به شکست دادن انسان شده بلکه نسخه قبلی خود را نیز شکست داده است.
این برنامه با دانستن قوانین ابتدایی بازی، طی مدت چند روز میلیونها بازی با خودش اجرا و شبکه عصبی خود را بر اساس نتایج این بازیها بهروزرسانی کرده است. Zero بعد از انجام این بازیها (حدود ۵ میلیون بازی)، این آمادگی را پیدا کرد که بر انسان و حتی نسخه نخست AlphaGo پیروز شده و با گذشت ۴۰ روز، موفق شد نسخه Master برنامه را نیز شکست دهد. به نوشته وبسایت سینِت: « این برنامه ظرف مدت چند هفته موفق شده است استراتژیهایی را بیاموزد که بیش از هزاران سال طول کشیده تا انسان به آنها دست یابد. حتی در بازی، استراتژیها و حرکات غیرمعمولی پیاده کرده که از روشهای استادان این بازی هم پیشی گرفته است».
DeepMind قصد دارد از چنین دستاوردی در کاربردهایی جدیتر از بازی Go استفاده کند. به گفته Demis Hassabis مدیر اجرایی ارشد و یکی از بنیانگذران DeepMind: « برای کمک در رفع مشکلات مهم دنیای واقعی نظیر protein folding یا طراحی مواد جدید » از آن استفاده خواهد شد.