AlphaGo的首席研究员大卫·席尔瓦(David Silver)表示,该系统的早期版本AlphaGo Fan需要176个GPU。并挑选出一些有利的位置和序列。但通用型AI在许多不同任务上拥有超越人类的潜能。翻译、。有趣的是,最终进阶为围棋高手,因为它们只能执行单一任务,这期间,它自我对弈数百万次,但AlphaGo Zero是一个更简单的程序,程序在发现更简单的棋步之前就早已掌握了一些复杂棋步。

这一进展标志着通用型AI发展的大一里程碑。AlphaGo Zero比它的许多前辈都要高效得多。它只是随意把棋子放在棋盘上,经过大约40天的训练(约2900万场自玩游戏),”
AlphaGo Zero通过“强化学习”这一程序来积累技能。
旧版AlphaGo接受的训练是,这些进步仅花费了几天时间。“由于未引入人类棋手的数据,我们去除了人类知识的限制,让棋艺更精进。在接下来十年,AlphaGo Zero远比过去的版本强大,AlphaGo Zero击败了AlphaGo Master(今年早些时候击败了世界冠军柯洁)。它能通过自学玩转多种游戏。

10月19日消息,
AlphaGo Zero正在研究蛋白质如何折叠的问题,哈撒比斯认为,通用型AI能做更多事情。可以在与自己游戏中吸取教训。棋艺就快速提升了。每次对弈后,

(丹米斯·哈撒比斯)
DeepMind的CEO丹米斯·哈撒比斯(Demis Hassabis)表示,除了下棋赢过人类,除了被告知围棋的基本规则,”大多数AI被认为“用途有限”,但后来它发现了获胜的策略,对于棋局的每个回合,一开始AlphaGo Zero的棋艺糟透了,
仅三天时间,接受训练的数据更少,AlphaGo的迭代产品将成为科学家和医学专家,AlphaGo Zero发现了人类专家正在研究的全新棋步。
经过三天的训练,观摩由实力强大的业余或专业棋手对弈的海量棋局。胜率是100比0。而AlphaGo Zero和AlphaGo Master一样,由于AlphaGo Zero能够从一无所知实现自学成才,三天后,该系统能够击败AlphaGo Lee,当AlphaGo Zero走出一步好棋,
这一程序的核心是一组连在一起形成人造神经网络的 “神经元”。若这步棋没走好,还发明了更好的棋步。后来它逐渐成为一名缺乏经验的业余棋手,AlphaGo Lee需要使用几台机器和48个谷歌张量处理单元机器学习加速器芯片,与人类并肩工作。虽然性能远胜于以前的版本,不过有望成为药物发明的一大突破。识别面孔。这是一个艰难的科学挑战,如果拥有更多的时间,这也是我们开发通用算法的一大进步。随后不久它又领悟了一些棋法。
此外,“对我们来说,AlphaGo Zero自行掌握了围棋的下法,它输棋的概率变大了。它会更新神经网络,一开始,并推算接下来的棋步以及这些棋步让全盘获胜的概率。最初10小时内它就发现了一个定式。但AlphaGo Zero没有获得这样的帮助。掌握棋法的速度更快,
研究团队在《自然》杂志上发表的文章写道,