2022-02-09 18:40 谈谈信息挖掘本文来自微信公众号:caoz的梦呓(ID:caozsay),作者:caozsay,题图来自:《超体》 众所周知,TK教主是搜索引证的达人,在技术高手的成长路线里,善于使用搜索引擎一定是最基本的能力诉求。 旧文也多次提过,有价值的信息往往碎片化,往往如面包屑隐藏在不同角落里,如何搜索,整理,判断,归纳,就显得尤为重要。 而信息越完整,关键决策的支持也就越完整,决策的准确性也就越高。 那么到底,怎样才算是信息挖掘? 前几天,我直播的时候,拿自己的习惯做了一个案例,但不知道什么原因,被系统以异常为由终止了直播。 友情提醒,本文所有内容仅为信息挖掘案例展示,不作为任何投资决策建议。 案例: 最近好奇大阪的房产投资,所以做了一些功课,跟大家分享一下我的信息采集和整理的思路。 第一,为什么考察大阪。 1. 相对于东京而言,大阪的房价只有1/3到1/2,但作为关西最大城市,以及热门旅游目标,其出租回报和东京的差距并没有房价那么悬殊。整体出租回报率,从表面来看,非常可观。该部分后续再展开。 2. 新加坡的银行可以为客户购买大阪房产提供贷款,并且有一定利率优势。 3. 日本法律相对规范,代理机构相对可信任,政局相对稳定,相对于东南亚地区的一些新兴小国,长期风险相对可控。 4. 疫情期间,有一定的低估价值,疫情结束后,存在报复性旅游的可能性。除了中国游客外,无论是东南亚游客,还是欧美游客,都有非常多人热衷于大阪旅游。 这里,1和2属于基本信息的采集,其中存在一定的道听途说,需要进一步的核对和验证。而3和4属于基本认知和常识。当然,有人如果不承认这是常识,没关系,此部分仅作案例完整性陈述使用,不争论。 第二,如何搜索房源。 搜索海外资源,默认谷歌。 如果用中文搜索,多半会发现一个中文日本房产平台,那么用英文搜索,也会找到一些当地的房产网站,但这些是否是最完整的呢? 换一种搜索方式,搜索“日本最大的房产网站”,找到一些讨论是suumo。不过是全日文的,也就是正常情况下我们是搜索不到的,那么全日文网站能不能使用,当然能,因为有“谷歌翻译”,在Chrome浏览器右键即可全站翻译。基本内容理解起来是没有问题的。 对比房源,确实比中文平台内容充实。 不同平台的房源有些是重复的,但有些也是各自平台独有的。 第三,关于信息深挖。 找到了房源信息,价格,地段,面积,是不是就可以做出足够的对比了,这仅仅是开始。 这里补充一句,关于房产持有的税费,很容易搜索到,属于基本信息,不赘述。 3.1 搜索不同城区的房价对比和区域特征对比。 红灯区房价相对很低,治安也相对较差,流浪汉多。北区是新发展区,金融中心和信息产业。 大阪大学所在是北部。东区外国人较多。 中央区,浪速区,天王寺区属于传统旅游和商业区域,游客较为集中,等等。 以上,搜索“大阪城区房价对比”,能找到不少。 3.2 不同区域人群构成和政治倾向构成。 非常有意思,我还查了“大阪特区公投”的倾向性分布图,这个有一定代表性,可以了解不同区域主要居民,是偏向革新,还是偏向保守,那么这也会多少影响到该区域未来的发展活力。 3.3 不同区域的房租对比。 房价对比和房租对比,可以更好的理解租售回报的比例。 这些是基本信息,也是很多人可以想到的,但这些足够了么? 并不够,其实房源信息里提及的很多关键词,要有好奇心,那么基于这些关键词,继续深挖,就会看到更多有价值的信息。 比如某些房源价格明显低于同地区行情价,那么通常都是有原因的。 3.4 所谓土地类型和最高容积率。 发现有第一类居住区,第二类居住区,商业区,工业区等等。 那么第一类是低密度优质住宅区,第二类就普通一些,是不是第一类住宅区更好呢,未必。因为这种地块商业配套往往不够好。如果不是自住,而是出租给游客和普通人,可能不如第二类居住区方便。 商业区可以有更高的容积率,可以开店铺,通常价值更高,但是仔细阅读条款其实是有风险的,居住区的采光权是有一定保障的,但是商业区就不是了,所以如果不仔细调查周边,有可能是被高楼包围,暗无天日的地块。 3.5 所谓建筑许可。 防火区域,半防火区域,这个和普通区域区别在哪里。 日本一户建大部分是木造结构,成本较低,但是防火区域就不允许木造结构,只能做钢混结构,那么建造和改建成本都会比木造高很多。 再建筑许可。有些老房子是禁止再建的,因为不符合新的建造法,可能这种地块后续维护就比较烦,虽然也允许翻新,保留主体结构即可,但毕竟不能为所欲为的改造房产,特别是这种都是很老的结构,所以这种往往价格显著低于市场价。 3.6 谷歌卫星和谷歌街景。 看到房源信息和所在区域,要查看地图周边,那么谷歌街景和谷歌卫星其实是价值是非常巨大的。你只看地图,可能大概知道这个房产的位置和区域,但是街景可以看到周边的真实情况,比如前面提到的,采光,以及是否可能存在较多噪音污染。 还有很重要的一点,我也看到一些显著低于市价的市中心区域房源,那么用卫星地图和街景才注意到,背后是一些神社,而里面则是密密麻麻的墓地。换句话说,这个房子是无遮坟景房,这种你从公开的信息图片是看不到的,如果无法去现场考察,或者现场无法深度调查(比如只允许在前面参观,以租客的名义不允许进入内部查看视野),那么谷歌卫星非常有用的。 3.7 民宿许可。 大阪允许全年民宿营业,但这里有一个问题,所谓允许,其实是需要邻里同意才可以,而大部分公寓是禁止民宿进入的。 所谓许可,只代表该区域许可,不一定代表该房源许可。 3.8 城市发展规划和重点校区分布。 政府官方网站和官方报告其实是最直接的资源,当然,还是需要谷歌翻译。 以上这些,都是通过房源信息内容展示中不同的关键词,那么基于这些关键词不断组合搜索挖掘出来的。 当然,在搜索之后,可以再联系会中文的中介,对不明确的信息进行进一步的咨询,这时候,问出来的问题就会显得相对专业,别人也会认为你确实有足够的准备,当然也会认真对待你的问题。 3.9 其他。 比如说,日常维护和管理的成本,代管费用,比如说,出租市场的行情,当你觉得出租回报率很好的时候,别忽视潜在的空租率。 这些可以通过进一步沟通深度了解,而且可以多咨询不同的中介,互相印证。 今天啰嗦这些,回到最初话题,是不是说鼓励大家投资房产,绝对不是。 我旧文《关于海外置业,我泼点冷水》有提到。 今天的主题是,如何进行信息挖掘。 第一,好奇心很重要,你对某个领域有好奇,是驱动你深挖的动力源泉。 第二,学会寻找最有价值的信息源。信息源很重要,很多时候,有价值的信息存在于垂直领域的搜索平台里,你要先找到这个平台。 第三,对关键词敏感,浏览领域内文章,领域内信息的时候,看到有些关键词不是很理解,不是很明确,要去搜索确认。 这点极为关键,往往可以通过一个信息点,查阅的过程中不断发现新的关键词,不断扩展信息点,最后会成为很庞杂的知识树。 我旧文经常会留有一些面包屑,也就是某些关键词特征,有极少数的人可以通过自行搜索,拼凑出更多的丰富内容。也有人会说,我搜过了,找不到,其实很多是需要一些关键词组合,有些是内容提到的,有些可能需要脑补一下。比如你搜索什么领域的,那么特征关键词+领域标记词,可以很好地限定搜索范围,这本来应该是很常识的东西,但确实很多人并不擅长。 第四,多渠道信息比对,确定信息真伪,来源和完整性。有时候,某些渠道的信息不完整,可以通过识图搜索,或者其他关键词组合方式寻找其他渠道的同一信息,相互对照补充。 第五,建立信息之间彼此关联的逻辑。 比如前文所述,不同授权区域,不同建筑许可,不同周边环境对房价的影响因素等等。要建立一个关联影响的框架逻辑。 第六,必要的时候,寻求专业人士的见解。 前提是,做足功课。 你做足功课,别人也会重视你的咨询,比如前文所述,一个中介面对一个做足功课的咨询者,一定会认为对方有足够的交易意愿,当然会更积极的回复和交流。而且当发现对方有足够的信息储备,自然也不敢过于夸大其词。 互联网信息往往是碎片化的,那么你首先要明确,自己所期望的目标是什么,并建立最基本的目标逻辑框架。 比如房产投资,追求租金回报和追求升值,其底层逻辑是完全不同的,其所需要关注的信息重点也是完全不同的。 基本目标逻辑确认后,再根据所收集的信息,将各种影响及关联因素尽可能罗列,并且对每个影响因素的影响范围尽可能标注,并通过进一步的信息采集去修订。 当我们试图做出一些关键决策的时候,这些信息越完整,因素关系越清晰,对决策的效率越有意义。 《数据控新加坡买车记》,这也是一个范例,决策前的数据准备和信息挖掘。当时我劝身边朋友说,根据历史数据,COE会大涨,但是都没听我的,后来疫情特殊原因还下跌了一段时间,但很快就飙升了,从当时的推算逻辑来说,我的预判是没有问题的,疫情是个黑天鹅事件,仅仅是短时间影响。 做出重大决策、关键决策的时候,信息挖掘和采集都是非常重要的。然而现实中,很多人会一时头脑发热做出关键决策。此外,盲从所谓权威意见也是很危险的,甚至很多权威就是靠收割来实现其权威价值的。 最后,补充一句,以上案例所提到的信息采集,并不足以建立真正有效的决策支持。信息不对称所带来的风险依然存在。此外,世界多变,诸多黑天鹅因素会严重干扰决策效果。 本文来自微信公众号:caoz的梦呓(ID:caozsay),作者:caozsay 本内容为作者独立观点,不代表虎嗅立场,授权事宜请联系hezuo@huxiu.com 如对本稿件有异议或投诉,请联系tougao@huxiu.com 正在改变与想要改变世界的人,都在 虎嗅APP |
|