分享

AIGC领域的三个投资维度

 零售威观察 2023-09-10 发布于北京

幻想最多的可能不是大模型,而是AIGC本身

文/王子威@零售威观察

AIGC,或者叫做“生成式AI(Generative AI),是当下极其热门的投资领域。近期,在交流过海量项目,并对部分早期项目进行投资后,我认为有必要进行一些反思,对过去几个月的心路历程进行复盘。
本文内容仅为个人总结、个人观点,其中必然充满偏见和错误,希望可以抛砖引玉。请勿作为投资指导,DYOR。


模型

AIGC的第一个投资维度是模型。

生成式AI的爆发是伴随着ChatGPT在2022年11月的横空出世,此后,大量的大语言模型(LLM)也逐步走入市场。毫无疑问,从逻辑上看,模型是一个投资视角。

然而,问题很明显,投入过于巨大:模型的单次训练成本极高,人才要求极高,所以国内基本都是大厂——例如百度、阿里、科大讯飞等机构在做,虽然有一些非大厂已经提供了优秀的大模型,但是他们的估值大多数也已经达到数十亿元,这已经不是普通VC能接受的了。

换句话说,在国内,模型方面的投资窗口,从目前看,基本已经关闭了。


数据

AIGC的第二个投资维度是数据。

数据既要关注质又要关注量,比如Chat GPT的数据源就包括维基百科、特定书籍与期刊、Reddit精选内容WebText和特定的网络爬取内容Common Crawl,这是2008年至今的一个网站抓取的大型数据集,数据包含原始网页、元数据和文本提取,它的文本来自不同语言、不同领域。,这就是典型的有质有量,叠加优秀的大模型,就可以发挥出很好的效果。

对于国内的生成式AI产业来说,有独特数据源的企业是值得关注的,也就是你有某个特定行业数据,这样,你的模型就是针对特定行业定制的,就是所谓的“一米宽一百米深”的逻辑,做垂直行业、细分行业的特定模型。

问题来了,你的数据从哪里来?

公开数据,嗯,这很好,但是要提一句,请注意数据的合规问题,不然就是“爬虫用的好,牢饭吃到饱”;

私有数据、内部数据,他们从哪里来呢?这就要看团队的积累了,可以说是团队过去多年“隐性资产”的变现能力:

比如,一个“AIGC+设计”的团队是来自于拥有海量图片、影音版权的平台,但是这个设计业务可能最终客户是在电商上销售产品的消费品品牌;

再比如,一个“AIGC+电商”的团队是来自阿里、京东等顶尖电商巨头,服务的可能是企业的电商客服或者选品、测款等步骤,最终目标是打造类SHEIN的小单快反等等。



规模
AIGC的第三个投资维度是规模。

规模——或者说是收入——一直是投资人最关注的指标,虽然规模并不意味着护城河,但是至少证明你是个值得重视的玩家。

事实上,生成式AI领域目前真正形成规模的项目是相当稀缺的,大部分项目依然处于早期阶段,而这些早期项目又开始陷入两个陷阱当中。

第一是项目制,做一单赚一单的钱,对于早期团队去做标杆案例、了解客户需求是有价值的,而且也会产生养活团队的现金流(我们暂时不考虑应收账款的问题)。这里的陷阱是,你如何证明你未来不是项目制,甚至从VC角度,当我们脑海里闪现出“项目制”三个字后,就是一件很麻烦的事情了。

更麻烦的是第二个陷阱,很多创业者说自己不是项目制,未来会走向订阅+按需付费,但是这种订阅本质上绝大多数是SaaS,无论你是如何用AI去赋能这个SaaS,你本质还是SaaS。

SaaS的问题有两点:

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多