共 19 篇文章
显示摘要每页显示  条
吴军:数学,为人生之题解出漂亮的答案。在著作《数学之美》中,吴军曾对数学的魅力和实用性大加赞美。数学其实讲究的是一个逻辑,它跟实验科学不一样,实验科学都是你观察到一个现象,然后试图通过一种理论解释一个现象,数学它不是,它是从一些符合我们日常认知的基本假设出发,然后完全用逻辑推导出的结论,只要它的逻辑是对的,它的结论都...
【ICML Oral】DeepMind提出深度学习新方向:神经过程模型。【新智元导读】函数逼近是机器学习中许多问题的核心,DeepMind的最新研究结合了神经网络和随机过程的优点,提出神经过程模型,在多任务上实现了很好的性能和高计算效率。在这项工作中,DeepMind研究科学家Marta Garnelo等人的团队提出一种基于神经网络并学习随机过程逼近的方法,他们...
【深度】专业解读“深度强化学习“:从AlphaGo到AlphaGoZero.它创新性地结合深度强化学习和蒙特卡罗树搜索,通过策略网络选择落子位置降低搜索宽度,使用价值网络评估局面以减小搜索深度,这样搜索效率得到了大幅提升,胜率估算也更加精确。目前来看,AlphaGo中神经网络的成功主要还是基于卷积神经网络,但是下围棋是一个动态持续的过程,因此...
Nature重磅:人工智能从0到1, 无师自通完爆阿法狗100-0 | 深度解析。去年,阿法狗(AlphaGo)代表人工智能在围棋领域首次战胜了人类的世界冠军,但其棋艺的精进,是建立在计算机通过海量的历史棋谱学习参悟人类棋艺的基础之上,进而自我训练,实现超越。这或许说明人类的下棋数据将算法导向了局部最优(local optima),而实际更优或者最优的下法...
一张图解AlphaGo原理及弱点。如果有中国职业棋手想挑战AlphaGo,我们愿意为其组建最顶尖(且懂围棋)的人工智能专家顾问团,助其取胜AlphaGo。通过大量的自我对弈,AlphaGo产生了3000万盘棋局,用作训练学习价值网络。攻其价值网络,万劫不复:AlphaGo的价值网络极大的提高了之前单纯依靠MCTS来做局势判断的精度,但离准确判断围棋局势还有不小...
一文读懂蒙特卡洛方法 | 谷歌围棋机器人科普。做为一种通用的计算方法,蒙特卡洛采样法的思想是当我们在求解一个确定但未知的值的时候,“在概念上”巧妙构造一个随机过程,使得这个随机过程的某个数字特征依概率收敛于我们要求的值,然后“在实际操作中”通过对该随机过程进行采样来对这个值进行统计估计。前面提到了,每个围棋盘面都有一个“...
柯洁输棋不是人类的失败,而是人类的胜利。显然,从大众的情绪反应来看,很多人将此理解为人类的失败,而不是人类的胜利。之所以那么多人对AI感到恐惧,当然不是因为它连胜人类棋手本身,而是因为此事所代表的象征意义:围棋被我们默认为是人类最复杂的棋类游戏,象征着人类智能的某种极限。确实,我们应该把目光从“围棋”上挪开,也不要本能...
AlphaGo 的下一步。因此,此次围棋峰会将是 AlphaGo 参加的最后一场赛事。这个工具将可以展示 AlphaGo 对围棋落子位置的分析,帮助大家更好地了解这个程序是如何思考的,最终让职业棋手以及爱好者可以从 AlphaGo 的视角来重新审视围棋。围棋界对 AlphaGo 给予了积极的评价,职业棋手和业余围棋爱好者也对 AlphaGo 给围棋这一古老游戏带来的全新...
即便分出了赢棋输棋方的落子方案,赢棋者的落子不一定都是好棋(如两个臭棋篓子下棋),输棋者的落子不一定都是差棋(如两个顶尖高手的精彩对弈)。分析原因,大概就是我们刚才说的赢棋者的落子不一定都是好棋(如两个臭棋篓子下棋),输棋者的落子不一定都是差棋(如两个顶尖高手的精彩对弈)的情况。“走棋网络”的特点是模拟人类的常见走棋...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部