DeepMind بخشی از شرکت گوگل که بر پیشرفت تحقیقات هوش مصنوعی متمرکز است، امروز نسخهی جدیدی از برنامهی AlphaGo را معرفی کرد که گیم را تنها با بازی کردن با خودش میآموزد. این سیستم که AlphaGo Zero نامیده میشود از طریق یادگیری از خروجیهای به دست آمده از گیمهایی که با خود بازی میکند، کار میکند و از فناوری یادگیری ماشینی استفاده میکند که یادگیری تقویتی نامیده میشود.
همانطور که Zero به طور مداوم آموزش دیده، این سیستم شروع به یادگیری مفاهیم پیشرفته در بازی Go به صورت خودآموز کرده است و موقعیتها و توالیهای سودمند خاص را انتخاب میکند. جالب است اضافه کنیم که پس از سه روز آموزش، سیستم جدید قادر بود AlphaGo Lee، نرمافزار DeepMind را 100 به صفر شکست دهد که سال گذشته دربازی با برترین بازیکن کره، Lee Sedol مغلوب شده بود. پس از 40 روز آموزش،که به معنی 29 میلیون بار بازی با خود بود، AlphaGo Zero توانست AlphaGo Master را 89 به 11 شکست دهد، این برنامه هم اوایل سال قبل مغلوب Ke Jie، قهرمان جهان شده بود.
همانطور که Zero به طور مداوم آموزش دیده، این سیستم شروع به یادگیری مفاهیم پیشرفته در بازی Go به صورت خودآموز کرده است و موقعیتها و توالیهای سودمند خاص را انتخاب میکند. جالب است اضافه کنیم که پس از سه روز آموزش، سیستم جدید قادر بود AlphaGo Lee، نرمافزار DeepMind را 100 به صفر شکست دهد که سال گذشته دربازی با برترین بازیکن کره، Lee Sedol مغلوب شده بود. پس از 40 روز آموزش،که به معنی 29 میلیون بار بازی با خود بود، AlphaGo Zero توانست AlphaGo Master را 89 به 11 شکست دهد، این برنامه هم اوایل سال قبل مغلوب Ke Jie، قهرمان جهان شده بود.