01 kaggle与量化交易 kaggle是一个机器学习竞赛平台,上面有大量的数据科学家和开发者,kaggle比赛的得分可以作为开发者履历很好的一个补充。2017年,Google收购了Kaggle。 市面上大多数的量化教材,主要是把传统技术面和规则变成自动化执行的逻辑,尽管这也可以称之为量化,但与大数据,人工智能的强项基本挂不上钩。 一方面很多人认为机器学习在量化上无用,市场太混沌——这是事实,但人工智能具备挖掘高维非线性的隐知识甚至暗知识也是事实。 是机器学习无用,还是我们没有用好? 关于量化为何提及kaggle? kaggle有点像传统应用数学领域的数学建模大赛。 把一个实际生产中遇到的问题,简化成一个数据应用的命题。然后大家可以开放式的去解决这个问题,最终谁的效果好,排名高可以获得不菲的奖金。 这个制度非常好,激励很多高手,很多大厂不遗余力的打比赛,刷排名,而且平台最终还会公布大家的模型,使用的技巧。 这是促进机器学习在工业界落地,也是机器学习者进阶的有效路径。 传统的机器学习,使用的数据集如iris或者boston,或者image net的数字分类,随便一个模型上来就是准备率95%以上,这会给初学者造成错觉。 而kaggle的数据集大多源自真实的场景,有噪声,有无用的维度,考察的是参与者解决实际问题的能力。 最为重要的是,这里数据集也有量化投资相关的命题,为私募对冲基金提供。 这就是真实的案例,通过参考高手们的解题思路,可以让我们尽量少走弯路。 qlib作为一个AI量化的框架,从数据库到指标计算,到模型训练到量化回测都准备好了。相当于给我们提供了一个实验平台。怎么做实验的思路,可能需要从kaggle比赛里去学习。 02 成长与反思 进步注定是缓慢的。 春种秋收,这是“延迟满足“的核心要义。 现在的努力,可能需要三年后有收成。 当前的结果,是三年前布局的结果。 想想2019年我们在做的努力,以及2022年的当下我们的所得。 展望一下2025年的可能收获。 你无法立刻马上获得你想要的东西,但可以期望2025年到来的时候,能达到自己心目中理想的状态。 人的精力非常有限,以至于只能做好一件小事,一件有价值的小事。 这就意味着我们做事情的机会成本很高。 谨慎选择,用心去做,坚持而专注。 日拱一卒,功不唐捐。 想想那些在病痛中的人,那些不可逆的伤害,有些亲人的伤逝,还有一些无法言表的贫穷,战乱中求生的人们。我们遇到的事情还好,而且我们还有机会去改善,去改变,去努力。 都说要突破圈层认知很难,确实,也许我们都没有意识到认知的限制。 王强和徐小平如果没有老俞让他们回国,他们会不会就此平庸一生?不知道,人生哪有那么多如果,天时,地利,人和罢了。 |
|