2016-04-25 19:57 浏览 评论
为了使阿尔法狗变得更“聪明”,谷歌还专门为其设计了两个神经网络,其中,“策略网络”会根据棋局选择下一步走法;“价值网络”会在下子后分析对手会怎么走,并预测进行数值性的估计。
比赛前,阿尔法狗“深度学习”用了人类围棋高手对弈的3000万局围棋走法进行“自我对弈”训练,并进行大规模的数据运算,这些运算用了两三千个CPU。对人来说,如此大规模的运算训练,即使每局只要15分钟,可能也要800多年才能下完,阿尔法狗的运算能力之强由此可见一斑。
此外,阿尔法狗还能自行研究新战略,在它的神经网络之间运行数千局围棋,利用反复试验调整连接点,这个流程也称为“巩固学习”。因此,阿尔法狗的“逆天”棋艺并不是开发者教给他的,而是“自学成才”。从这个意义上来说,阿尔法狗堪称是计算机中的“学霸”。
资料图
人工智能,还有多远?
阿尔法狗的胜利,很大程度上体现了近年来人工智能领域“深度学习”技术的快速提升。特别是随着GPU图形处理器、超级计算机、云计算和大数据的迅猛发展,“深度学习”如同火箭升空般飞速发展。早在2011年,谷歌用1000台机器、16000个CPU处理的“深度学习”模型就已经有了10亿个神经元——当然,这仍远远低于人脑100亿~10000亿个的神经元总数。
资料图
现在,“深度学习”技术在语音识别、计算机视觉、语言翻译等领域,都战胜了传统的机器学习方法,甚至在人脸验证、图像分类上还超过了人类的识别能力。专家预计,在不久的将来,我们甚至可以在手机上运行像人脑一样复杂的“深度学习”神经网络。