MathorCup竞赛优秀论文.docx
《MathorCup竞赛优秀论文.docx》由会员分享,可在线阅读,更多相关《MathorCup竞赛优秀论文.docx(34页珍藏版)》请在优知文库上搜索。
1、评委一评分,签名及备注队号:10302评委三评分,签名及备注评委二评分,签名及备注选题:A:2048评委四评分,签名及备注题H:基于MonteCarlo局面评估和UCT博弈树搜寻的2048摘要本文首先提出Random-Max-Trees算法来实现人工智能的2048。此算法是通过静态评估函数来求得最优解。但是在实现的过程中出现冗余的现象,当移动方格步数过多的时候,好的评估函数却很难找到,使Random-Max-Trees算法效率降低。随后本论文接受Alpha-Beta算法,是前者的一种改进,在搜寻结点数一样的状况下,可以使搜寻深度达到原来的两倍。在实现的过程中发觉Alpha-Beta严峻依靠于着
2、法的找寻依次。只有当程序挑最好的子节来当先搜寻,才会接近于实际分枝因子的平方根,也是该算法最好的状态。但是在首先搜寻最坏的子节时,Beta截断不会发生,此时该算法就如同Random-Max-Trees一样,效率特殊低,也失去AIPha-Beta的优势,也无法试图通过面的搜寻来弥补策略上的不足。本文接受蒙特卡洛评估对以上模型进行了改进。它通过对当前局面下的每个的可选点进行大量的模拟来得出相应的输赢的统计特性,在简洁状况下,胜率较高的点就可以认为是较好的点予以选择。由于UCT算法能不断依据之前的结果调整策略,选择优先评估哪一个可下点。所以在蒙特卡洛德基础上运用UCT算法提高收敛速度。可求得概率为1
3、00%o对于其次问,接受归纳法以及概率论量化数值,当方格为4x4时,最大能达到2=131072,假如将方格扩展到NXN个,能达到的最大数为最终对模型进行评价。本论文算法是接受JAVA、C+以及MATLAB实现。关键字:Random-Max-Trees;Alpha-beta;MonteCarlo;UTC;概率论基于MonteCarlO局面评估和UCT博弈树搜寻的20481.问题提出2048是最近一款特殊火爆的益智游戏,许多网友自称“一旦玩上它就根本停不下来”。2048游戏的规则很简洁:每次限制全部方块向同一个方向运动,两个相同数字的方块撞在一起之后合并成为他们的和,每次操作之后会在空白的方格处随
4、机生成一个2或者4,最终得到一个“2048”的方块就算胜利了。假如16个格子全部填满并且相邻的格子都不相同也就是无法移动的话,那么游戏就会结束。本文将建立数学模型,解答下列问题:1 .如何才能达到2048,给出一个通用的模型,并接受完成游戏所需移动次数和胜利概率两个指标来验证模型的有效性;2 .得到2048之后,游戏还可以接着玩,那么最大能达到多大的数值呢?假如将方格扩展到N*N个,能达到的最大数是多少?2 .问题分析本文首先基于Random-Max-Trees和Alpha-beta剪枝算法来实现人工智能(Al)的2048。本文认为可以把2048游戏看成是一场人类和计算机的博弈,人类限制全部方
5、块向同一个方向移动并合并,计算机则在空白处随机放置一个“2”或“4”的方块。但是在AI的环境下,博弈双方都是计算机,双方都不理性,所以在AI的环境下,选用更加保守的Random-Max-Trees博弈策略比选用Mini-Max-Tree的更加适当。假如把当前格局作为博弈树的父节点,把下一步全部可能的走法所造成的格局作为树的一个子节点,假如接着运用RandOm-MaX-TreeS算法,则此算法的效率很不志向,会造成许多不必要的步骤。因为每一个子节后面还有子节,可能的状况许多循环往复,直到2048为止,但是并不是全部的节点都必需搜寻完毕,有些节点是不必要的。为了解决这一问题,本文可以接受Alpha
6、-beta剪枝算法。对于第一问为实现2048的这种状况,蒙特卡洛评估是一个很好的解决方法,它通过对当前局面下的每个的可选点进行大量的模拟来得出相应的输赢的统计特性,在简洁状况下,胜率较高的点就可以认为是较好的点予以选择。UCT在蒙特卡洛评估算法的基础上很大的提高了收敛速度,UCT能不断依据之前的结果调整策略,选择优先评估哪一个可下点,基于此策略从而也可以得到其次问的答案。对于其次问,如何计算出最大值是有条件的,对有随机值的问题,我们须要量化数值,假如考虑随机那么就有不确定性,这会使我们无法接近最大值,所以在最起先就干脆规定好,取4来作为加数,因为这是累计的题目,4比2大,所以在有限的范围内,4
7、的总和确定比2的总和大。规定好数值,起先计算最大值。最大值是2的倍数,通过玩2048已经知道相同的数可以合并形成更大的数,合并一个数须要有两个数的空间,通过这一规律我们可以知道当格子都排满的状况下,还是有可能进行数字的合并的,假如可以进行合并的话,那就又增加一个4,这时又是满格的状况,假如合并过的数再次进行和并又再次产生一个空位,那么以此类推用过可以产生15次空格,那么,这15有同时增加了15次4,通过这些新加入的4,数值会进一步的增加。3 .模型的假设1) Alpha-Beta有比Minimax搜寻算法更加精确的评估函数才能保证那些优秀的节点不被过早的剪枝;2)博弈树较小而可以被完全绽开,博
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MathorCup 竞赛 优秀论文
