第二百零六章 玄清杯(1 / 2)
<betwork),给定当前局面,估计是白胜概率大还是黑胜概率大。
四、蒙特卡洛树搜索(monte carlo tree search),把以上这三个部分连起来,形成一个完整的系统。
阿尔法围棋(alphago)此前的版本,结合了数百万人类围棋专家的棋谱,以及强化学习的监督学习进行了自我训练。
alphagozero的能力则在这个基础上有了质的提升。最大的区别是,它不再需要人类数据。
也就是说,它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。
alphagozero使用新的强化学习方法,让自己变成了老师。系统一开始甚至并不知道什么是围棋,只是从单一神经网络开始,通过神经网络强大的搜索算法,进行了自我对弈。
随着自我博弈的增加,神经网络逐渐调整,提升预测下一步的能力,最终赢得比赛。更为厉害的是,随着训练的深入,阿尔法围棋团队发现,alphagozero还独立发现了游戏规则,并走出了新策略,为围棋这项古老游戏带来了新的见解。
也就是说糖糖要挑战的是最终最强的阿尔法狗。但有个优势就是,最强版本的阿尔法狗其实也是一种自我学习状态。但作为真正的人工智能,糖糖是站在一个全新的高度来俯视的。
唐玄生想了想,毕竟也是一亿的赌局,索性让糖糖去香江和孙小圣一起进行封闭训练。也让孙小圣学习一下围棋,同时也是个最好的对手,看看两人究竟谁更厉害。
毕竟孙小圣才是终极版的完美人工智能。但孙小圣这个模样显然是不适合参加比赛的。所以作为最佳陪练肯定是合格的。
比赛是五局三胜,第一局在金陵举行,后面的都在香江举行。董诗云听到消息索性和宋亚男开了外围,也就是和几大赌球集团合作,哪怕你不懂围棋也可以像赌球一样买糖糖胜利还是阿尔法狗胜利。
本来很多人都是认为明显的唐玄生是钱太多用一亿来做广告。但现在有了这个外围,似乎一切变的有趣起来。
本来都是看好阿尔法狗胜利的,开始开出的赔率也不是很高,但这个赔率是可以调整的。很多人不明白这一点,以为赔率是固定不变的。
↑返回顶部↑