可拖拽无需编程机器学习量化平台AI策略简介最近几年人工智能(AI)技术得到飞速发展,其在各个领域的运用也不断取得重大成果。机器学习是实现人工智能的一种方式,被评为人工智能领域中最能够体现智能的一个分支,机器学习与人工智能、深度学习的关系可以参考下图: 机器学习可以这样简单理解:借助于计算机,对数据(训练集)进行学习后,形成模式识别(模型),进而实现对未来数据(测试集)的预测。 假设我们要去预测某个变量Y未来的取值,并找到了影响变量Y取值的K 个变量,这些变量也称为特征或因子(Feature Variable)。机器学习即是要找到一个拟合函数f(X1,X2,…,XK|Θ)去描述 Y和特征之间的关系(绝大多数是非线性关系),Θ为这个函数的参数。 要找到这样的函数,必须要足够量的观测数据,假设有 N 个样本数据y1,y2,…,yn和 x1i,x2i,…,xKi (其中i=1,2,…,N)。然后定义一个函数L来衡量真实观测数据和模型估计数据偏差,函数 L 也称作损失函数(Loss Function)。基于历史观测数据,我们可以求解下列的最化问题来得到参数Θ 的估计值 。 求解(1.1)过程称作模型训练(Model Traing)。基于特征变量的最新观测值和训练出来的模型参数就可以预测y的数值。 接下来,我们看一下用机器学习方法开发策略的具体流程。 AI策略开发流程相对于传统策略开发的复杂流程和调参等大量重复工作,AI策略开发更简单,将我们的脑力从重复工作上解放出来,专注在更有创造性的地方。 StockRanker算法机器学习算法太多,本文讨论只针对适用于金融数据预测的常用有监督型机器学习(Supervised Machine Learning)算法:StockRanker。 StockRanker算法是专为选股量化而设计,核心算法主要是排序学习和梯度提升树 我们对AI策略开发做了抽象,设计了如下开发流程 (以 StockRanker 算法为例,也可以使用其他算法):
StockRanker的特点
StockRanker的领先效果还得益于优秀的工程实现,目前在学习速度、学习能力和泛化性等方面,都做了大量的优化,并且提供了参数配置,让大家可以进一步根据需要调优。 可能遇到的一些问题
|
|