分享

AI量化投资思考与下一步计划

 AI量化实验室 2023-10-12 发布于北京

原创文章第290篇,专注“个人成长与财富自由、世界运作的逻辑与投资"。

文章更新暂停了几天,但思考没有停下。

星球这几天还是持续加入同学,我们是把AI量化当成事业来做的,要停下来思考一下,下一步怎么走,如何给星友们提供最大化的价值。

AI量化投资的目的是什么? ——量化是手段,AI也是手段,让我们可以更科学,更安全,更轻松地获得投资收益

一是风控,二是收益,安全性永远是投资世界里第一位的。

投资无外乎买什么,何时买,买多少,何时卖,卖多少的问题,再精简就是——“低买高卖”,但如何做好,非常不容易。

择时之难,预测市场是不可能的事情。

那么,轮动其实是一个更优的逻辑,多因子排序轮动,与市场共舞

量化系统要收集尽可能多的数据,有效数据,另类数据,从数据中提取出因子。然后测试因子的性能,把因子组合起来,对股票进行排序,定期重复上述过程,这就是一个典型的系统做的事情。我们可以通过监控全市场数据,这是量化的优势,我们可以借用前沿人工智能的非线性“统计”能力得出综合排名。

一、数据及其预处理:全A股市场的量价数据、财务数据,资金面数据等。每日收盘后更新,后端数据库是mongodb,够简单,然后“聚合到”hdf5库中。做好基本面这样的季度数据换成日频数据等,数据清洗,预处理。

二、数据挖掘,比如“每日选股”。就是通过一些条件给合,去看历史上这样股票及其表现,获得直观感觉。

——这一步有“工程上”的难度,因子是需要现计算(无法都进行预计算,因为子逻辑上讲无穷多)的,比如一些rank,需要全市场,比如3000支股票的历史数据都加载上来,然后计算相应的指标,而后对期进行排序。qlib为此做了自己的“数据存储”格式,就是希望加速这个过程,但个人感觉太重了,不方便更新。

另外预计算完成之后,要进行缓存,但这个缓存何时进行更新,这个qlib也做了不少努力。比如aplha158, alpha360,这里计算量都非常大。在gui界面里,很难做到即时响应的。

有一部分工作会放在服务器完成,涉及定时任务,机器学习调度等。大计算量的,预处理的,需要定时计算的等等。需要更多人工干预的,输入的,隐私的,搁到pc端。

三、因子分析,多空分析等

这一步是比较确定的,IC/IR,分组分析等。不过这里的计算量不大,因为是单个因子的计算。

四、上述组合起来(规则或AI量化模型),就可以做量化回测

自动化的机器学习技术栈,从数据更新到特征工程到模型训练,参数保存等等,这一块可以关注一下。

年化29.3%,大类资产ETF动量轮动,添加商品与货币ETF,实盘跟进中(代码+数据下载)

年化41.4%的指数多因子轮动与年化26.5%大类资产动量轮动,准备实盘跟踪。(代码下载)

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多