前言 本文涉及大量的量化和统计知识,需要智商90以上的才能看懂,不行的请绕道。 PS:根据本人测试,水湄的智商只有89.9,所以需要我讲两遍才能听懂。 缘由 长投日本房产的H5上线了,第一版比较简陋,当然房源也不多。但是对比链家等中国房产中介有一个优势就是日本房产中介都比较老实,列出来的都是真实的房源。 他们不会拿一套特别便宜的假房源来钓你上钩,如果你一咨询,链家中介就会说:对母鸡啦,这套房子已经卖掉了,不过我这里还有一套类似的房子,巴拉巴拉。 不过第一版有一个数据没有上线,就是每套房子的估值。因为我估计这个一上线,后台问题肯定爆掉:你的估值怎么出来的?为什么不是一个精确值,而是个范围值?这套房子为什么估值这么低?你的估值逻辑是什么? 对于以上的问题,我的回答一般都是:我可以告诉你,但是怕你听不懂。 不信?继续往下看吧。 原理 我们现在数据库中已经有最近东京1万4千套,大阪6千套的已交易或可交易房源,所以任何一套新的房子,我们都能找到和他比较相近的几十套房子。 比如说对于一套在大阪距离天满桥地铁站步行3分钟距离,2002年建造,面积20平米,位于一栋20层大楼第16层的房子,我们可以找到一群相近者: 1、距离大阪天满桥地铁站步行7分钟,1998年建造,面积17平米,位于10层大楼第6层的房子,现在售价是800万日元 2、距离大阪天满桥地铁站步行2分钟,1984年建造,面积25平米,位于20层大楼第20层的房子,现在售价是1300万日元 3、距离大阪天满桥地铁站步行3分钟,2016年建造,面积19平米,位于7层大楼第2层的房子,现在售价是950万日元 …... 然后根据已知的这些数据,我们来推断我们的标的:距离大阪天满桥地铁站步行3分钟,2002年建造,面积20平米,位于20层大楼第16层的房子。应该正常价格是多少。 如何推断 前方高能!前方高能! 前方进入智商110以上领域,不足者请自行离开。 再重复一遍,这不是演习,再重复一遍,这不是演习,各单位请自动进入装逼模式!!! 首先我们用多元回归法,每一条我们已知的房源数据,就是一个6维的向量,然后我们对这个向量来建模。哪6维呢? 1. 车站是一个维度,车站有大站小站之分。 2. 车站的距离是一个维度,离车站越近当然房价越贵了。 3. 房龄是一个维度,什么时候建造的房子,越新的房子当然越贵了。 4. 面积是一个维度,小房子的单价(每平米价格)一般比大房子要贵。 5. 楼层是一个维度,越高的房子也越贵了,顶层的往往更贵。 6. 最后朝向也是个维度,朝南的总比朝北的好吧。 所以针对每一个新的房源,我们可以获得几十个6维的向量。新房源就是一个主向量,那对这些6维向量,我们要做出修正,采用在机器学习(Machine Learning)领域十分流行的K近邻算法(K-Nearest Neighbors Algorithm)来做修正。 修正的意思,比如我知道一套房源,其他条件和新房源一模一样,唯一的差别是离地铁站步行距离多2分钟,那在单价(每平米价格)上,为了这2分钟,需要补偿多少价格呢? 或者说,有一套房源和新房源其他都一样,唯一的差别是年代老了5年,那这5年对于单价(每平米价格)影响又是多大呢? 这里不光用到多远回归法,还需要高维曲面展开技术(High-Dimensional Surface Expansion Method),自上而下地对搜索结果分层调整,确保最终结果的准确性和稳健性。 最后,每一套新房源的估值根据这6个维度来修正,会得出不同的值,那这些值的范围就是我们给出的这套房源的估值范围了。 估值的意义 你可能会问,如果新房源可以估值了,有什么意义呢? 相信高智商的同学们已经想出来了: 首先第一个意义就是,任意一套房子,我都能知道它的价值是多少,这样至少保证我可以避开那些太贵的房子。 其次,量化的思维,有了估值,我们才有了投资的核心和锚定,不论是买卖甚至只是看房,也有了主心骨。 最后也是最强大的,可以做短线,我们完全可以买入一套特别低估的房子,然后第二天就挂牌卖出。只要挂牌的价格是在估值范围内的,那就不会卖不出去。而我们赚的就是这个差价。 长投日本房产基金就准备这么做了。 我相信肯定会有人问:那税费怎么办?日本房产交易,特别是短时间的交易,税费不是很高的吗? 是的,税费是很高,但你要这么想:一套房子比如你可以赚300万日元,就算税费收掉了150万,你不还是赚了150万吗?如果你不会估值,不做短线,那连150万都赚不到了,不是吗?别关心国家会收掉多少,只需要关心我们能够赚多少不就行了。 后记 你能看到这里,说明你的智商已经从轰炸中硕果仅存下来了。还不快点赞并转发给你的朋友们,测试一下他们的智商? |
|