幻想最多的可能不是大模型,而是AIGC本身 AIGC的第一个投资维度是模型。 生成式AI的爆发是伴随着ChatGPT在2022年11月的横空出世,此后,大量的大语言模型(LLM)也逐步走入市场。毫无疑问,从逻辑上看,模型是一个投资视角。 然而,问题很明显,投入过于巨大:模型的单次训练成本极高,人才要求极高,所以国内基本都是大厂——例如百度、阿里、科大讯飞等机构在做,虽然有一些非大厂已经提供了优秀的大模型,但是他们的估值大多数也已经达到数十亿元,这已经不是普通VC能接受的了。 换句话说,在国内,模型方面的投资窗口,从目前看,基本已经关闭了。 AIGC的第二个投资维度是数据。 数据既要关注质又要关注量,比如Chat GPT的数据源就包括维基百科、特定书籍与期刊、Reddit精选内容(WebText)和特定的网络爬取内容(Common Crawl,这是2008年至今的一个网站抓取的大型数据集,数据包含原始网页、元数据和文本提取,它的文本来自不同语言、不同领域。),这就是典型的有质有量,叠加优秀的大模型,就可以发挥出很好的效果。 对于国内的生成式AI产业来说,有独特数据源的企业是值得关注的,也就是你有某个特定行业数据,这样,你的模型就是针对特定行业定制的,就是所谓的“一米宽一百米深”的逻辑,做垂直行业、细分行业的特定模型。 问题来了,你的数据从哪里来? 公开数据,嗯,这很好,但是要提一句,请注意数据的合规问题,不然就是“爬虫用的好,牢饭吃到饱”; 私有数据、内部数据,他们从哪里来呢?这就要看团队的积累了,可以说是团队过去多年“隐性资产”的变现能力: 比如,一个“AIGC+设计”的团队是来自于拥有海量图片、影音版权的平台,但是这个设计业务可能最终客户是在电商上销售产品的消费品品牌; 再比如,一个“AIGC+电商”的团队是来自阿里、京东等顶尖电商巨头,服务的可能是企业的电商客服或者选品、测款等步骤,最终目标是打造类SHEIN的小单快反等等。 规模——或者说是收入——一直是投资人最关注的指标,虽然规模并不意味着护城河,但是至少证明你是个值得重视的玩家。 事实上,生成式AI领域目前真正形成规模的项目是相当稀缺的,大部分项目依然处于早期阶段,而这些早期项目又开始陷入两个陷阱当中。 第一是项目制,做一单赚一单的钱,对于早期团队去做标杆案例、了解客户需求是有价值的,而且也会产生养活团队的现金流(我们暂时不考虑应收账款的问题)。这里的陷阱是,你如何证明你未来不是项目制,甚至从VC角度,当我们脑海里闪现出“项目制”三个字后,就是一件很麻烦的事情了。 更麻烦的是第二个陷阱,很多创业者说自己不是项目制,未来会走向订阅+按需付费,但是这种订阅本质上绝大多数是SaaS,无论你是如何用AI去赋能这个SaaS,你本质还是SaaS。 SaaS的问题有两点: |
|