分享

推出主流板块量化核弹级研发成果-板块匹配度

 播股001 2021-12-18

    2011年北京邮电大学计算机系硕士研究生。投资风格深受陶博士、股市魔法师mark影响,利用大数据挖掘分析量化专长,专注于净利润断层模式、口袋支点、VCP、3C等模式,分析第二阶段股票、致力于量化市场情绪规避系统风险。

01

今日核心观点-主流板块量化核弹级研发成果

目前量化炒股的2大痛点】

1)基础数据不准。由于目前大部分从事板块量化的朋友,绝大部分采用的是通达信、同花顺等现有软件的数据,但是这数据有非常大的问题,数据量小(只有100多个)同时分类混乱。这个难点,我已经在6月底攻破了,把之前的三级分类数据,扩容到四级分类,而且分类都是统一标准,数据量也从100多扩容到950多个。



2)板块匹配度问题。这个问题就更复杂了。如果说基础数据不准这个问题可以用数据挖掘的方式来解决,那板块匹配度的问题,必须用到神经网络,AI训练的方式来解决。匹配度的问题,需要用市场每天实实在在的数据进行训练的,所以说,匹配度这个是不断自我迭代的过程,时间越长,训练样本量越大,他的匹配度越精准。
 

    第一个难点就是解决基础数据数据不准的问题。这个问题,我经过几个月的努力,终于在6月底完美解决。大家有兴趣的话,可以去翻我之前的文章,6月26日发表的。

    第二个问题,也就是板块匹配度问题,为什么说他难度更大呢?我在这里简单的解释下她的难度在哪里。我们还是已目前最火热的储能板块来做例子。以大家熟悉的通达信软件来解释。通达信里面储能板块一共有125个股票。这125个板块里,有一线正宗概念,也有很多是趁热度的小杂毛。我截图给大家看看。这是周五收盘的最新数据。这里面有涨停的好几个,同时也有大跌的,甚至还有跌幅高达-13.71%的。从这2个截图,你还会觉得他们是同一个概念板块吗?哈哈哈。这些都是市场的实实在在走出来的数据,不是我编的,每个人都可以看到的。
    但是,实际上,这些涨停的和跌停的,他真真切切的都被归为同一个概念板块,在计算板块涨跌的时候,也是混在一起算数平均算法计算的。我把这个问题抛出来,大家是不是觉得很有研究价值。
    简单的讲,同一个概念板块100多个股票,有涨停的,也有跌停的。有些朋友冲着储能板块去的,本来想着去买涨停的,哪知道悲催的买到了跌停的,同一个板块命运天壤之别。心中受到一万点暴击。明明买的是热点板块,而且板块指数确实也涨的不错,为啥我买的就跌停呢?
   

图片


图片



  我来解答这个问题吧,其实这一切的原因,就是板块匹配度的问题,板块是好板块,但是有些个股人家是根红苗正的,有一些只是稍微趁点边的小杂毛,资金都是聪明的,这些会一视同仁?举个生活上的例子,你如果是导演,你愿意花一线明星的片酬去请一个十八线的小明星来当主演?
   那既然板块匹配度这么重要,为什么一直没有得到有效的解决呢?其实这就是他的复杂程度来决定的。他的难点到底在哪里呢?
1)首先,这个板块匹配度,是动态的,并不是静态的。这需要你的算法具备自我学习,自我拟合的能力。这个匹配度是市场算了算的,他说你是啥概念,你就是啥概念,所以你不可能用静态的什么主营业务占比之类的财务数据简单的来做匹配算法,你必须用动态算法,用每天的市场交易数据来训练你的算法,使他的匹配度也来越精准,这是个不停训练,不停迭代,不停拟合的过程。说个简单点的,知道阿法狗是怎么战胜顶尖棋手的吗?他就是用几百万盘棋谱来训练,来自我强化。我曾经说过,量化有四个层次。

图片

现在这个概念匹配度的算法,已经在无限接近第四层次的要求了。

  
    板块量化无法向更深层次推进的重大难题是啥呢?那就是个股的概念匹配度问题,这个提法,大家肯定觉得很新奇,确实如此。概念匹配度是我首创的,我之前翻看了一些网络,好像没有这么深入研究。

      那到底什么是概念匹配度呢?举个很简单的例子说明下,先打开大家最最熟悉的通达信软件。我们随便看一个股票,那就看最近的牛股,百川股份吧。

图片

    大家看到没有,百川股份,光在通达信这个软件里,就有这么多,有化工原料概念、锂电池、石墨烯、芯片、钴金属、OLED概念、储能、降解塑料等10来个,这还不包括江苏板块,含可转债板块、业绩预升板块。

    那问题来了,他今天的涨停,是因为她的哪个概念的原因,或者说是因为哪个概念导致了最近这段时间的强势。也就是板块匹配度问题

     这个股票,这么多概念,那到底在这10多个板块里,他跟哪个板块相关性最高。

  今天有个朋友在私下给我留言,我觉得这个是很有意思的问题,我把他这个问题贴出来给大家看看。他是这么说的“有个问题不知道你是怎么处理的,就比如石墨烯板块,里面的百川股份,美锦能源,中泰化学都涨幅前列,带动了板块的走强,然而百川炒的主要是储能,美锦炒的是氢能,中泰则是PVC为主,这几个根本不是因为石墨烯上涨的,那么这种情况还能看这个板块吗?”

     就是这说的,就是一个问题,就是板块匹配度。

大家要站在大资金的角度考虑问题,如果说,我们今天要发动储能板块,他会最优先攻击哪几个股票?肯定是先攻击概念最纯正的哪几个,对吧。小杂毛们等行情火热的时候,等着鸡犬升天。

    好了,我用了不少的篇幅,把什么是板块匹配度解释清楚了。板块匹配度实在是太重要了,如果不把这个研究清楚,那所谓的板块量化分析,基本上属于盲人摸象。我大概用了一个多月的时候,研究板块匹配度的算法。知道什么是算法吗?算法在软件开发中,才是最最核心的。

   关于这个算法,我已经研发完成了,优化工作也已经全部完工,原计划是周日完成,现在比计划提前一天,已经全部完成。表格已经完成,有需要或者感兴趣的可以联系我。


首先我介绍一下我这个策略的特点:

    1)全部量化完成,完全克服人类的贪婪和恐惧。

    2)永远满仓,不择时。全部调测都是头天在网络上更新,第二天都按集合竞价    的价格进行调仓,盘中不做任何调仓行为。

    3)最重要的就是真实,调仓计划都提前公布,计算过程绝对客观,网友也可以全程监督,最简单的方法,网友可以把我提前公布的10个股,放在通信达的一个自建板块里,收盘看看是否我统计的有误差。

    4)这个策略,完全不需要经验,也不需要天赋,普通人只需要花3-5分钟按得分高低选股就行。简单、易操作,可重复。

     开始最激动人心的【股市阿尔狗大战地表最强实盘王者

图片


明日操盘计划】
  无

02

重磅推出-每日更新最具实战价值的2张表

      首先我说明下,对于大数据来说,其实有2个流派:一个是数据挖掘,一个是数据呈现。数据挖掘就是通过海量数据分析,找出他隐藏的规律和特性,来指导未来的操作。另外一个流派叫做数据呈现,就是他不对原始数据进行任何加工整理,只是通过一些可视化、花里胡哨的给你呈现出来,让你眼前一亮,哇塞,好漂亮,其实上这些数据都是各大网站上轻而易举就能取得的。只是换了个呈现方式而已。

     我要做的就是第一种,实战派。我比较推崇的一种炒股方式,就是叫做极简炒股,通过数据挖掘的方式,把最有效,最贴近实战的数据呈现出来。不要给你一堆乱七八糟的,看似丰富多彩,实则花里胡哨的数据,看着很热闹,实际在选股和选主流板块上一点用都没有。

好了,回到正题:我每天要提供的最具实战价值的2张表是怎么样的呢,不多说,直接上图。

第一张,就是概念板块RPS分值图,根据网友的反馈意见,我特意增加了RPS50的栏目,现在一共4个周期,分别是5,10,20和50.

 先说说目前市面上的板块RPS研究的痛点是什么?

  我是学我是学计算机的,拿数据分析,我试着从我专业的角度进行一个分析,大家可以看到股票有4000多个,但是这个板块大家可以看到,我们之前的那些板块都是在架构于通信达这个软件上进行的一个二次开发,你不管这样怎么编公式,他所用的底层数据也依然是通信达自带的那些板块数据,一共好像也就两两三百个吧。

图片

   大家可以看看上面这个图,就知道问题所在了。你看,按概念分的,比如芯片,多晶硅,有按资金类型分的,比如外资背景,有按市盈率分的,比如低市盈率,又按省份地域分的,比如陕西板块,又按增减持分的。所以这种分类方式五花马门,强行把这些混乱的分类放在一起研究,得出的结论可想而知.另外还有一点,从统计学的角度来说,因为你的样本量不够,一共才200-300个这样统计出来的效果并不会太好。。所以说咱们这份底层数据就是有非常大的问题,你再从既然基础数据就很不靠谱,然后你用再高级的方法去二次加工或者说再挖掘,那都是徒劳无功的,你就是要在沙漠上搭房子,你下面的基础是不稳当的。

所以综上所述,目前来说目前的这个 rps板块研究有两个痛点:

1)样本量太小,如果按照总共200-300个样本量太小

2)各个板块,各种分类方式混杂在在一起分类,没有统一。这种基础数据加工出来的东西,效果就可想而知了.而咱们的个股呢,为什么它会很好呢?因为个股都是统一标准,它都是实实在在在我们市场上交易的4000多个股票,它的标准非常统一

     接下来为什么说我的研究取得了一个重大突破呢?首先我把这个分类方式进行了一个按照统一的概念进行了重新的分类,打破了原有的根据不同的行业概念,地域,什么中报这些混杂在一起的分类方式,我统一按照更加贴近于实战的概念的分类方式来进行,从这一点上做到了板块划分的一次性。第二就是样本量的问题,刚才也说了,按照目前通信达的分类,就算你把各种各样的板块,各种各样的分类方式加在一起,它的样本量也就是两三百个,但是经过我大数据挖掘后,我按照他的这个更加贴近实战的这种概念分类,目前来说,现在的这个板块的样本量已经达到了952。这是我的板块分类,贴近实战。

  下面我们来上截图:一共是952个最接近实战的概念板块,不存在和地域等乱七八糟的分类方式混在一起的情况。根据网友的反馈意见,我特意增加了RPS50的栏目,现在一共4个周期,分别是5,10,20和50.

图片

说完了板块RPS,我们现在来说说另外一张实战表:

图片

表格中各列的实战意义

    通过上一节的介绍,我们知道了什么是第二阶段股票,而且我们要买也只能买第二阶段股票。但是问题来了,我筛选了6月12日,一共有500多个股票处于第二阶段,那具体哪几只值得买呢,如何优中选优呢?这是我们这节需要回答的问题。

     大家可以看到我的表格设计里,除了代码、名称和概念外,一共有11个列。下面我们来详细说说这11个列都是啥?

     1、首先是ROE,有一定炒股经验的朋友,应该都听过这个指标。ROE全称叫做净资产收益率。:曾经有人问巴菲特,如果只能选择一种指标去投资,会用什么?巴菲特当时毫不犹豫的说出了净资产收益率ROE。可见这个指标的重要性。

     2、后面有三列,分别对应的是最近三个财报季的净利润率。为什么这个很重要呢?一代宗师马克曾经在书中说过。读过《股票魔法师》一书的股友都知道书中阐述有一个模式:全速前进:代码33。是指如果公司销量增速在加快,利润率也在同步增加。两者共同作用会点燃净利润,推动股价出现爆发式增长。两者共同作用的效果远比单一效果要好。净利润全速增长的最好情况就是销售加速增长,利润率同步提高。

图片

3、后面有两列是RPS值,分别是250日和120日的。这这个RPS指标非常重要,简单讲就是股票的相对强度。这个指标在好几本经典书籍均有提到,大家可以去翻开下。将这个指标发扬光大的,是陶博士,我非常敬佩的一位宗师。其实我所做的量化工作,说简单点就是把几位宗师的理论,用大数据的方式把他量化出来,研究的对象就是我们日思夜想的大A股。

4、后面一列是距一年最高价的距离。这个非常好理解,字面意思,也很有参考价值。

5、后面是五年年线中有4年为正。这个依据的是好学生理论,对于我们A股有很强的实战价值。如果最近几年都表现的非常健康,就是好学生,那下一年继续考高分的概率比垃圾学生会高很多。

6、后面是净利润断层。这个我详细讲解下,什么是利润断层。净利润断层就是当天因为业绩预告业绩快报正式报告,企业发表的公告业绩大增,股价被人抢筹导致的跳空缺口。每年有一季报、中报、三季报、年报四个业绩定期报告,每个业绩报告期有业绩预告、业绩快报、定期报告等节点,不同的节点均有超预期个股出现较为明显的挣钱机会,因此,净利润断层是贯穿全年的行情,是每年均确定有的行情,且净利润断层所需关注的股票较少,属于耗时不多,收益颇丰的一种操作模式。同样这种模式也来自《股市魔法师》书中。

6、后面是知名基金持有并加仓的情况。基金公司有很强的投研能力,很多高学府的精英人才。他们对个股的选择上有严苛的标准,最大限度的规避各种风险。他们强大的投研能力是我们散户朋友望尘莫及的,高毅、高瓴资本等明星基金经过多年市场考验,他们的持股动向有很强的参考价值。

7、后面是外资增仓的股票情况。这个数据是每天更新的。北向资金,又被称为聪明钱,他们的一举一动,值得研究。他们的持股理念是长期持有,对于看好的股票进行持续推升。历史上我们A股的几个大牛股,持续被北向资金买入。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多