AlphaGo挑战股神能成功吗

xhunion 2016-04-05

展开全文

【AlphaGo挑战股神能成功吗】2016年3月，发生了围棋界的“世纪之战”，这也是近些年来人工智能与人类之间的巅峰一决。Google Deepmind开发的人工智能AlphaGo完美亮相：从连下三城，到出现bug，AlphaGo最终以4:1的光鲜成绩战胜人类顶尖围棋大师李世石。（一财网）

　　2016年3月，发生了围棋界的“世纪之战”，这也是近些年来人工智能与人类之间的巅峰一决。Google Deepmind开发的人工智能AlphaGo完美亮相：从连下三城，到出现bug，AlphaGo最终以4:1的光鲜成绩战胜人类顶尖围棋大师李世石。

　　这局比赛充分让人们看到了深度学习的强大，甚至有网友玩笑，Skynet0.1版本已经诞生。

　　然而从科幻电影回到现实，我认为从技术本质来说，这是集人类智慧大成的数据科学、工程学技术、加上长久的探索，让人工智能在信息处理和反应能力上，更接近人类设计的理想水平。

　　我们来回顾一下近几年棋类人工智能的发展阶段。

　　1) 初级阶段，国际象棋。根据棋盘上剩余棋子的数目和棋子距离对手底线的距离，简单加权求和来评估局面，再去搜索对应的策略。机器天生的计算速度和记忆能力在这个阶段显示出惊人的优势：最厉害的棋手号称“一步十算”，也不过在脑海中算出十步以后的棋局，但是计算机可以尝试十多种走法几十步后的局面。然而这种方法连基本的智能都称不上：不过碰巧找到了一个可以评估棋局双方胜率的简单函数，再运用工程学的规划算法找到找出最优的下棋走法。

　　2) 进阶阶段，棋类的最高领域：围棋。人工智能进入围棋领域主要有两个障碍。最大的一个麻烦就是如何评估棋盘状态。早期的围棋智能通过检索当前棋盘与数据库中哪一个布局、定式最为相似，将数据库中记录的局部棋形的好坏评分汇总在一起得到整个局面的评价。然而，这种方法并没有什么类比能力，遇到不在图形数据库中的棋局，机器臭招频出。另外这种方法没有考虑任何“上下文”状态和全局状态，所以机器也没有在各个局部中取舍做出最优抉择的能力，出现无谓脱先、无谓争劫、提早收官的失误，面对盘中绞杀就更是无能为力了。

　　另一个还有一个大麻烦是，因为围棋太过复杂，即便是运算能力最强的机器也不能在有限的时间遍历搜索所有可能的走法。围棋高手们相信，机器永远不可能掌握他们称之为的“棋感”的这种直觉，最终将被淹没在庞大的可能性中。

　　对此AlphaGo的两大绝杀计是：并联了走子策略网络(Policy Network)和走子评价网络(Value Network)，然后加了一个无比强大的外挂：加快计算速度的快速走子模块到它的概率决策系统中。两大绝杀计加外挂的运作模式是：评价网络负责评估不同局面获胜的概率，策略网络来预测顶尖的人类棋手下一步下哪里，让计算机可以仅仅针对对手的行为思考，大大缩减的搜索空间从而加快了速度；而快速走子类似于直觉，使AlphaGo可以以牺牲下棋质量代价达到快速选择的目的，在不需要精细思考的搜索中使用以进一步加快计算的速度。

　　可以看到，到此AlphaGo走法已经很接近人类思维：评估不同时刻棋局状态，猜测对手行棋，根据假想的双方行棋几步以后的状态决定走法。AlphaGo通过3万局真人棋手的棋局和3000万局的左右互搏自我对弈，从真实棋局记录出发训练两个神经网络，最大限度的学习人类棋手的行棋想法，最终可以在任意局面作出获得最高胜率的判断。

　　人类对人工智能的期待其实不只是在棋类这种陶冶情操的娱乐爱好中，其实在更广泛的商业领域，人工智能的尝试早已不是新鲜事物。其中一个就是大家都会感兴趣的：股票交易。

　　传统的股票交易中技术分析流派也主张从蜡烛图总结规律，因此出现了箱体盘整、支撑、破位、趋势、波浪等等名词。近年来大放异彩的量化交易，则是通过人工设定的交易规则对历史数据回测，通过统计指标来寻找最佳的交易策略，逐步也用到了一些机器学习算法。

　　但是目前人工智能在股票交易领域的尝试还处在类似国际象棋的初级阶段，在这个领域的进阶还需要克服很多挑战：

　　1) 与更高阶的围棋类似，全球金融资产交易市场的数据复杂度可以用数以万计的公开交易资产数量，乘以数十年的精确到每秒甚至每毫秒的时间跨度来简单估算，这里还不包括数以亿计的交易对手方的下单和成交明细。单单是看4000种A股股票买或者不买，状态复杂度就已经超过围棋了。这些信息量之大，自由度之高，根本无法完全放入到传统的数据模型中估计，只能人工提取特征再细分问题，最后建模。

　　2) 另一方面，如果不把宏观经济和大盘走势纳入模型考虑，就会如同缺少围棋中“势”的感觉，过于关注局部而可能被大盘走熊拖累。但如果纳入考虑，则会降低针对个股的预测能力。这种平衡现在机器很难随着时间的推移自动调整于是就需要依赖基金经理或者交易员的主观判断，使用一些聚类算法来辅助交易决策。

　　3) 同时，传统量化假定了历史是简单重复的，没有考虑所有的交易员都是市场的一部分，交易员下单的反身性可能引发蝴蝶效应，使得策略失效甚至是出现巨大的亏损。

　　但是Alphago的两大绝杀计加外挂的运作模式让我们看到了希望。比如我们可以通过把全局特征--也就是大盘所有的价格走势、其他宏观经济信息、财务信息等可以反应市场信息的数据――转换成向量作为输入，经过卷积神经网络的深度学习能力，自动提取各个层级图形特征，让机器可以自己学习出包括量价关系在内海量信息的升级版“技术特征”，预测当前持仓最后盈利的概率。

　　AlphaGo可以基本上完全不懂围棋是什么的情况下，简单粗暴的根据棋谱训练出神经网络，那么深度学习也可以在毫无金融领域知识的情况下，精准识别不同经济背景不同股价走势的特征，并评估出现在持仓的盈利潜力。而且，如果人类能通过经验整理出厚厚一本的技术分析指南，那么机器则可以学习出整部四库全书厚的高阶形态特征，以更为精准的预测。

　　当然仅仅知道了市场变化还是不够的。如前面提到，金融的交易有数不清的对手方，他们之间的信心、判断、操作都会相互影响。投机套利需要抓住对手方转瞬即逝的“错误”定价，不然就会被其他人抢走。我们可以再训练另外一个策略网络，来模拟最优秀的交易员面对同样的环境会如何抉择。最后，结合两者到一颗蒙特卡洛搜索树中，就可以在瞬息万变市场中抓住市场的滞后赚到大钱。

　　在股票交易领域，人工智能还有一个契机可以利用。人类的围棋高手可以在棋局上刻意地制造复杂的局面，通过有意识的“做局”骗过机器。但是单一投资机构左右金融市场的难度太大，这反而给了人工智能更广阔的应用空间。

　　但是另一方面，股票市场缺充斥着非公开信息，不同水平投资者的主观判断、信念抑或是冲动、贪婪。如何界定数据边界，避免机器在边界外的过度拟合而犯下让人啼笑皆非的低级错误，还需要一定的探索。所以至少目前阶段，AlphaGo作为股票交易者，尤其来到中国A股市场进行实操，还为时过早，即使不用断掉google服务器连接，估计也赢不了中国大妈。(作者系前海征信总经理)

(责任编辑：DF302)