【原】AI量化投资思考与下一步计划

AI量化实验室 2023-10-12 发布于北京

展开全文

原创文章第290篇，专注“个人成长与财富自由、世界运作的逻辑与投资"。

文章更新暂停了几天，但思考没有停下。

星球这几天还是持续加入同学，我们是把AI量化当成事业来做的，要停下来思考一下，下一步怎么走，如何给星友们提供最大化的价值。

AI量化投资的目的是什么？ ——量化是手段，AI也是手段，让我们可以更科学，更安全，更轻松地获得投资收益。

一是风控，二是收益，安全性永远是投资世界里第一位的。

投资无外乎买什么，何时买，买多少，何时卖，卖多少的问题，再精简就是——“低买高卖”，但如何做好，非常不容易。

择时之难，预测市场是不可能的事情。

那么，轮动其实是一个更优的逻辑，多因子排序轮动，与市场共舞。

量化系统要收集尽可能多的数据，有效数据，另类数据，从数据中提取出因子。然后测试因子的性能，把因子组合起来，对股票进行排序，定期重复上述过程，这就是一个典型的系统做的事情。我们可以通过监控全市场数据，这是量化的优势，我们可以借用前沿人工智能的非线性“统计”能力得出综合排名。

一、数据及其预处理：是全A股市场的量价数据、财务数据，资金面数据等。每日收盘后更新，后端数据库是mongodb，够简单，然后“聚合到”hdf5库中。做好基本面这样的季度数据换成日频数据等，数据清洗，预处理。

二、数据挖掘，比如“每日选股”。就是通过一些条件给合，去看历史上这样股票及其表现，获得直观感觉。

——这一步有“工程上”的难度，因子是需要现计算（无法都进行预计算，因为子逻辑上讲无穷多）的，比如一些rank，需要全市场，比如3000支股票的历史数据都加载上来，然后计算相应的指标，而后对期进行排序。qlib为此做了自己的“数据存储”格式，就是希望加速这个过程，但个人感觉太重了，不方便更新。

另外预计算完成之后，要进行缓存，但这个缓存何时进行更新，这个qlib也做了不少努力。比如aplha158, alpha360，这里计算量都非常大。在gui界面里，很难做到即时响应的。

有一部分工作会放在服务器完成，涉及定时任务，机器学习调度等。大计算量的，预处理的，需要定时计算的等等。需要更多人工干预的，输入的，隐私的，搁到pc端。

三、因子分析，多空分析等

这一步是比较确定的，IC/IR，分组分析等。不过这里的计算量不大，因为是单个因子的计算。

四、上述组合起来（规则或AI量化模型），就可以做量化回测。

自动化的机器学习技术栈，从数据更新到特征工程到模型训练，参数保存等等，这一块可以关注一下。

年化29.3%，大类资产ETF动量轮动，添加商品与货币ETF，实盘跟进中（代码+数据下载）

年化41.4%的指数多因子轮动与年化26.5%大类资产动量轮动，准备实盘跟踪。（代码下载）