分享

硅潮访谈录|澜码周健:做一家“AI原生”的企业

 百年张裕88 2023-06-01 发布于湖北

ChatGPT问世之后,人类的历史进程被改变了。有人认为这是“iPhone时刻”,有人认为这是第四次工业革命,也有人认为这是新一代的“火”和“电”,而即使最保守的观察家也会同意:人类社会注定将被AI重塑。

为此,我们推出「硅潮访谈录」这一栏目,围绕AI、机器人、芯片相关领域,对话身处浪潮前沿的科学家、创业者和投资人,跟踪硅基涌来的洪流,勾勒社会的未来轮廓,识别出这些结构性变化里蕴藏的历史性机会。



大模型重塑世界,可能会先从重塑创业者开始。

摆在淘金者面前的矿脉巨大且真实。黄仁勋将其比作15年前的iPhone时刻,比尔·盖茨回想起50年前的PC机雏形,而马化腾则在上周的股东会上把历史拉到了工业革命诞生“电”的级别——这些“时刻”都是新一代商业巨头诞生的前夜。

大佬们用简单的类比,给创业者们标注了本次机会的量级。这样的“风动”下,任何具有计算机背景的创业者可能都会“心动”,在很多人还在担忧硅基取代人类的时候,一部分人已经开始小步快跑,今年2月份创办澜码科技的周健就是其中之一。

周健是笔者在上海交大电院的学长,他身上的标签很多,比如亚洲首个ACM-ICPC大赛冠军、阿里云的那群疯子、AI四小龙依图10号员工……当这些标签和履历重合到同一个人身上时,不去折腾点什么反而是说不过去的。

笔者第一次听到周健的名字是刚入学的时候。他跟林晨曦等人的故事一向是学院里的传说——2002年他们的队伍拿到了第26届ACM-ICPC大赛的全球总冠军,成为亚洲首个夺冠队伍,并催生了后来交大著名的ACM班,培养了出无数牛人。

毕业之后周健加入Google,接触到了全球最顶尖科技公司的代码库。之后周健加入阿里,参与了王坚院士牵头的阿里云飞天系统的研发,这种“一生只有一次”的大级别项目,极大得锤炼了周健的软硬件技术能力。

如果说“技术”是周健职业生涯的上半场,那对商业的观察和思考则是他下半场的主线。

离开阿里云后,周健有过一段短暂的创业经历,过程中暴露他“离技术太近,离商业太远”的短板。结束创业项目后,周健加入了林晨曦创办的依图科技,成为第10号员工。依图也给了周健一个观察技术与商业如何交织的最佳位置。

在依图,周健见证了AI视觉领域的技术曲线从诞生到成熟的一条完整路径,也目睹了商业如何一环环闭环、竞争如何一步步紧逼。之后周健加入RPA创业企业弘玑,对组织、技术、商业的融合,尤其B端业务的开展,有了更全面的理解。

走到今天,周健以一个创业者的身份重新出发,方向毫无疑问:AI

周健选择的是超级自动化赛道,去做“基于大语言模型的自动化平台”。他觉得冥冥之中有一股力量,把自己在技术、项目、商业、管理上所有的经历都连向了这里,如同乔布斯描述的“Connect The Dots”。

图片

在我的理解里,周健并不想追逐AI赛道上那些最热门但又最烧钱的明珠——比如底层的infrastructure,而是更在意自己的公司能否在商业上跑通、能否在财务上健康,这显然跟他在依图和弘玑的所见、所感、所思密不可分。

而在组织上,周健试图把澜码打造成一家“AI原生”企业——大模型成为核心生产工具、prompt和magic word驱动工作、组织高度扁平、强调单兵作战能力……用他的话来说就是:大语言模型就像太阳,我让自己的企业布满太阳能板。

回看过去三个月,周健用波澜壮阔来形容,他喜欢用军事和历史的角度来思考商业和组织,跟他聊天不枯燥而且非常有趣。我们的这次访谈长达3个小时,凝结了他这些年对AI、对创业、对竞争以及对硅基革命本身的思考。

以下,是硅基研习社与澜码科技CEO周健的对话正文。

01

十字路口与新大陆

硅基研习:你是什么时候开始关注大语言模型的?

周健:其实关于OpenAI的GPT、谷歌的Burt很早就有听说,但之前并没有花费精力去了解。直到去年年底我决心出来创业后,一次偶然的机会去网上搜索之前关注过的一家公司,想了解下它现在怎么样了,我的一名同事同时去问了ChatGPT。看到结果后非常震惊,ChatGPT非常详细地给到了公司什么时间成立、何时被收购、目前业务情况、有多少名员工信息在LinkedIn,我作为一个行业专家花十几分钟获取的信息还不如ChatGPT。

这时我就开始认认真真研究ChatGPT,使用时也会遇到各种小问题,但已经感觉到这是一个大机会。

当时自己还想过给3-5年工作经验的程序员写份教程,教他们该怎么生存,每一次认知加深以后都觉得之前写的不对,写到第三稿时就放弃了。我还是以技术好标榜自己的,最后发现原以为有价值的东西全部没有用。

悲观并不至于,前段时间软件大牛Kent Beck面对这次的AI大浪潮,在Twitter上做了一句很经典的总结:The value of 90% of my skills just dropped to $0. The leverage for the remaining 10% went up 1000x.(个人90%的技能价值归零,但剩下10%的价值会提升1000倍。)

所以整个复盘过程对我的价值很大,让我意识到所有人、所有公司其实都需要重新review一遍技能,哪些技能会被替代,哪些技能暂时不会被替代,只有放大后者才能生存下来。

硅基研习社:为什么会选择现在这个创业方向?

周健:我从弘玑离开出来创业时,最早只是想解决RPA(机器人流程自动化)市场存在的一些老问题,譬如说怎么提升RPA的价值。创业方向选择上也是处在一个十字路口摸索阶段,还设想去做跨境电商、BI、营销自动化其它方向过。

春节期间对ChatGPT做了更深入的研究以后,创业方向才正式确定,就是澜码现在的slogan:基于大语言模型的自动化平台。之前RPA因为缺少AI,很多大的自动化场景无法解锁,但现在全改变了,大语言模型就是未来的技术。

对澜码而言,我们的problem solution fit已经可以实现,下一步便是product market fit,用未来的产品去解决过去的市场问题,未来技术已经摆在眼前,而且不需要澜码自己去研发,拿来用就可以。也就是说,我只要对市场有清晰的认识,能够把场景做好匹配,知道技术的边界,业务推进就是顺其自然的事情。

硅基研习社:软件自动化领域老牌企业很多,新进入者也不少,你如何定义竞争对手?

周健:AI 转自动化容易,自动化转 AI 相对更难,竞争对手其实更会是懂AI的人。从趋势上看,大家会从四面八方涌入,不过很可能会像当年AI四小龙一样,碰一碰就错开了。因为市场实在太大了,不一定非要挤在一处分出胜负。

按照我的理解,我们现在竞争的维度主要在数据。微信聊天记录是大量生成出来的数据,但在此之上还有一层不那么易变的数据,例如白领简历中的上下级关系。这些关系网络数据是稀缺的,而私有数据本身很难放到大语言模型之上。这一层数据谁拿到了,谁的数据飞轮就可以转起来。

HR、财务、供应链等领域,公司与公司之间会因为他们某些人的关系从而产生出很多重复的商务关系,很多评价也是基于这层关系,他适不适合做我的供应商、适不适合做我的客户等等,都是基于此。

“物”层面的数据也是一样,京东、淘宝的SKU,当你这些数据优势存在时,会变得更加智能去理解客户的习惯。“我的秘书已经那么了解我了”,客户会很难换掉你的系统。

所以,真正影响竞争格局的会是这个维度的事情。

硅基研习社:面向B端与面向C端的企业,AI浪潮下面临的业务发展有什么区别?

周健:面向B端的服务有两个特点,一是相关企业会为了更高价值的工作流进行额外的准确率付费,二是服务围着公司和岗位走,而不是人本身,因此更容易形成“边界感”。

C端不一样,C端首要一件事就是人在不同场景上是情绪化的。例如,想要做好面向C端的系统,需要知道用户昨晚睡得好不好,如果不好的话可能今天想吃个大餐补偿一下,这类需求是时刻在变的。其二,C端的触点非常多,公司场景、出差场景,休闲场景,如果要占住终端用户,那意味着投入需要很大,错失一个环节可能就会被对手占住。

所以,C端必然是大资本投入的事情,竞争会非常激烈,很难出现创业公司的身影,很难百花齐放。

资本会大量入场,一定会有一场厮杀,创业公司在前期很难入场,但最后会有非大厂的机会。每一个像我这样的创业公司,到某个时点上不会愿意被大厂裹挟,所以会找机会与非大厂的企业合作。那就会存在这样的位置,不过也就一家,而且这家公司一定会活得非常艰辛。但它会活下去,会有我这样的企业去支持他。

硅基研习社:如何看待国内大厂在LLM上的竞争?可以用一个什么样的框架去思考?

周健:开发大语言模型很像造粒子对撞机这类大工程,我认为它需要三个方面的能力:数据、工程、组织。

第一点数据,这也是大家讨论比较多的,选什么数据、如何对数据进行清晰、如何生成高质量的数据等等,都很重要。

第二点工程,可以用炼钢炉来做个类比,当下关键不在于3倍还是5倍的花费,难点在于能不能把温度烧到2000度。本质上今天OpenAI 就是有一种办法,他把它烧到了2500 度,然后发现说,噢,原来金子在2000度都就会融化。你的资源可以堆很多,但你烧不到那个温度的话就是没有用。所以说,参数不是多了就好,需要“温度到那里”,才有用。加上现在一些“设备”受到限制,加大了所有人的试错成本。

第三点就是组织结构的配合,谁拥有更强的组织力,谁能聚集足够的资源,谁能让大家利出一孔,能调动大兵团作战的大厂,我觉得胜率会更大。

战斗力的调动非常重要。Google为什么会落后OpenAI?它缺资源吗?缺数据吗?缺算力吗?都不缺。Google最大的问题就在于,它过去的组织结构是 1000 人把所有的钱挣了,其他人全都躺平随便玩。

硅基研习社:如何看待midjourney这类企业?

周健:midjourney其实更接近中间层企业的角色,它并没有具体围绕C端的某一个娱乐场景或者工作场景去构建,只是让用户“玩”,然后用户可以拿此去做其它事情。它的优势在于有一个模型,可以基于模型去做一些事情,而不是一个直接面向C端的应用。

我们可以用“新物种”的视角去看它们,引用下奇绩创坛创始人陆奇关于三类系统的定义:system of information、system of model、system of action。过去的系统都可以归类为system information,midjourney属于第二类,主要负责think,澜码是第三类,主要负责act。

这是完全不同的三类物种,未来可能会有融合,但至少现在,我认为从创业视角来看还是选择一个路径,保持纯粹更好。

02

颠覆式组织

硅基研习社:过去多段就业经历,让你对“500人管理困境(多层架构下的管理困境)”的问题思考很深,在你看来,AI能否解决这个问题?

周健:在传统组织中,500人的规模意味着CEO已经站在了四线的位置,公司资金消耗会加大,成长速度却慢下来,组织的官僚系统会天然存在阻力,导致战略决策没有办法有效传导。这就让500人成为公司成长中很大的一个坎,如果没有准备好,不能轻易“踩上去”。

组织上的困境源于人的working memory有限,单线管理可能上限就是15人,但其实很多管理动作是重复性的,你的下属与你确认工作内容,一些内容不需要发挥你的智能,只是需要你做完一个决定。

知识工作者,或者说传统白领,他们在具象任务中知道很多上级不知道的事情。所以为了保持协调和一致,那就必须需要有一些很多的沟通,很多的上下文,去确保上级能清晰他们的工作内容,以及他们能理解上级的意图。

但现在,因为AI可以理解语义,管理和协调的工作可以一部分让AI去做,AI可以替你去做到很多解释性的工作。你做了一个决定,机器可以帮助翻译给下属,而且可以回溯,这是第一个维度。第二个维度,当你把质量标准描述出来,机器可以 7x24 小时永远保持这个标准,人是做不到的。

这就导致整个企业的组织结构、管理方式发生变化。以军队为例,以前是班长、排长、连长、营长、团长、旅长的层层架构,现在就可以转变为特战小队的形式。一旦形势发生变化,班长可以立即冲出去,因为你有信息最新的承载方式,可以把这个战场的形势实时反馈,让听得见炮火的人去呼唤炮火。

过去在知识领域内很难做到,因为中间有大量的层级限制,未来都会发生改变。

硅基研习社:作为一家“AI原生企业”,澜码内部是以一种什么样的方式组织运行?

周健:澜码目前在尝试一种任务式指挥的组织方式。这是借鉴空军的一种组织形式,因为从空军的视角看,整个战场形势变化极快,所以没有办法层层下放指令,只能是给出一个大概目标,具体要依靠个人在战场后的随机应变。

目前在管理上,我给出一个主线任务,明确任务标的,然后赋能员工,让他们能够去开展这些事情,去自己组队把任务拿下。现在环境变化非常快,所有决策应该是动态的,创始人需要聚焦自己的任务,给程序员要大幅放权。

作为一家AI native的公司,澜码必然是全面拥抱AI的。我会明白需要在什么条线上配置什么样的leader,但leader之下,不再配置下级,我的假设就是今天他们应该 to prompt 给我的机器人,然后在这一层级上,去进行新的组织调整。

因为代码的产生方式也在改变,过去的程序都是控制式的,但现在有了大语言模型后,它可以理解用户的需求。例如一个行程安排的智能体/agent,行程中的城市、城市间的距离、时间、交通工具,都是用于描述state;然后可能有一个policy,不能坐公务舱,必须中午出发;然后还有一定衍生的question,最后涉及到action,确定机票和酒店。

未来程序会依赖于这样一套SPQA的流程,agent的数量会更加关键。公司要做的就是鼓励他们做创意涌现,鼓励magic prompt的发生。

硅基研习社:澜码如何应对挑战?未来组织会发生什么样的变化?

周健:从外部环境来看,今天就像一个美洲大陆,我也不知道美洲长什么样,需要我的飞行员不断出击取回情报,任务式控制下,我会更加注重单兵作战能力。

我们要清楚公司的核心价值是什么,我跟我团队强调的是,公司最多写1000万行代码,超过了必须开源一部分,这就逼着大家去写最有价值的东西。

市场很大,我要求我的团队去获取“最鲜美的肉”,而不是去贪多。在现有的环境下,组织大没有用,强才有用,大反而是被别人撕咬的对象。

硅基研习社:澜码的核心竞争力是什么?

周健:我希望澜码是一家技术驱动的公司,所以会有两大核心能力的要求,一个是智能相关,一个是作为神经中枢的能力。

进一步延伸,在考核上有两大重点。底层是API,这是澜码业务的驱动来源,是我们的手与脚,它需要足够抽象,就是一段自然语言的描述,输入是什么类型,输出是什么类型。中间层是agent(智能体),它有自己的感知、规划、行动,能够把底层API组织起来,去为终端用户提供服务。

在更上层,我希望更多第三方加入进来,让澜码产品的通用性进一步放大。那之后便是考虑降低使用门槛达到易用性的水平。

也就是说,我们想把澜码打造成一个通用、易用的平台,把这些API和agent做好管理,让agent包装不同的API,不同模型的 agent 能够在上面更好地协作,让它们可以在平台上更有效率、更智能地服务好客户。标杆客户、通用性、易用性,这是澜码需要构建的x,y,z三个能力轴。前期必然围绕标杆客户与产品通用性去打造,之后从提升毛利的必要性出发,再去提升易用性。

澜码现在优先是做专业场景下 to B的agent,但我自己判断,未来可能会有这么一个场景:用户通过聊天,可能一周甚至一天内生成一个定制化程序。

今天一个WMS(仓库管理系统)程序10万行代码可以搞定,在今天的模型助力下,程序员的代码效率还可以提升10倍甚至几十倍,全中国代码生产量应该会翻3-4个数量级。等技术达到一定高度时,可以产生的效果就是你作为个体可以要求机器人,你可能跟他聊完,他就给你个性化的生成了一个类似 WMS 复杂的这样一个程序。

现在来看,虽然有“技术平民化”的说法,例如说接入ChatGPT以后每个创业公司都相当于拥有了一个300人的NLP团队。但其实不是的,不是每个人都知道如何使用agent,对有些人可能相当于3个人,但对有些企业可以抵3000人,不会用就用不上去。

但对于我的员工,入职我就会给他做各种方法论培训,他就可以把agent用得很好,而且我还会鼓励员工互相协作,澜码内部已经把agent视为团队的一员。设想如果每个环节的效率可以提升3倍,多模块应用以后,效率会是指数级别的提升。

硅基研习社:一家AI native的软件公司会是什么样?

周健:在我看来,大语言模型它就像一个太阳。今天一个企业,有多大的办法能够去布满太阳能的电板,把这些能量吸进来,企业的工作效率当然就会大幅提高。

这可以一层层推进,最直接的是使用ChatGPT。进一步可以把ChatGPT包装成一个前端程序员、测试经理、产品经理等等,甚至进一步把它“变身”为agent,它们之间互相沟通协作,去完成我布置的任务。

智能就是一种生产力,过去布置一个任务,可能下属会直接说不能做,不会就不会了。但现在的话,可以先问ChatGPT该怎么做,这时候prompt就很重要。

一条magic prompt可能会使准确率直接提升20%,这个组合空间就非常大。通过不断引导ChatGPT,让它think step by step,每个专业领域里面都有只有行业专家才知道的这些 magic word,如果行业专家能够变得会用它的话,它会给你惊喜。

就比如,我今天在逼着我的 HR 使用,我也不知道他什么时候会说出一个 magic word 来,之后他review简历就变得特别高效。从这个意义上讲,就是需要拼命去使用它,不断与它交互,想尽各种办法去把它引到你的工作流里面来。

由此也产生了一个新问题,当出现这个智能体之后,工作流应该是什么样的?人原来只能是顺序的,现在有了智能体之后,它可以不是顺序的,甚至可以来决定任务应该怎么分发。从这个维度上看,可以发挥的效率是极大的。

03

iPhone时刻何时到来

硅基研习社:产品形态会怎么演变?

周健:关于未来AI产品到底会长什么样,其实现在只是摸索阶段,对话框的形式也只是一个中间态,大语言模型下的人机交互聊天框一定不是终极形态。

我们今天习惯的聊天框形式,其实经历了很多进步。最早只能文字来取,后来QQ加入了表情符号,到现在飞书可以针对某一个文字去回复、标注,这里交互的形态就开始发生了变化。

今天并没有人定义好,人与一个能够理解自然语言的机器人应该用什么样的方式去交互。这其实是一个很难的事情,甚至可能需要定义一种新的语言,就像二次元有火星文一样,它可能是一种介于Java、Python与自然语言之间的表达。这就关联到之前说的agent之间需要有沟通和交流,需要有标准——一本供agent使用的《新华字典》。

这个新的问题是需要被回答的,也需要用某种方式去解决。一项新的技术出现了,但仍然有很多不成熟、不完美的地方,所以我们要在人机交互中,在产品层面上去帮助它能够更容易实现,将一些内容沉淀下来。

再进一步设想,未来可能会有一种世界语言的出现,去降低人类与机器沟通的损耗,尽可能去增加信息量。

最终长什么样真没人知道。对,不知道,想不出来。

硅基研习社:当下处在一个什么样的阶段?

周健:现在更像是大型机、小型机诞生的阶段。

就像Altman说的,AGI其实不是大家认为的超级智能,而是一个中等智能人的角色。也就是,当AGI知道自己能做什么、不能做什么、知道不能做什么时应该如何去寻求帮助,这个属性其实很夸张。现在的GPT-3.5与GPT-4还没有到这个程度,如果智能再进一步,到GPT-5可能就会出现。

所以说,未来最大的冲击不是来自于一个超级智能,而是说能把一个中等智能,或者说超过平均人水平的智能用它1/1000的成本引入到行业,那这个时刻,可能是真正的iPhone时刻。

硅基研习社:新“iPhone时刻”什么时候会出现?

周健:可能会是2年后。

按照Altman的表述可能就是两年,他曾说过,如果有任何一家机构能够在 AGI 上超过他,他不会竞争,他直接把他所有的经验贡献出来,但是这个承诺只在 2 年内。那言外之意就是,他自己能在两年内做到。

当它是一个独立,跟平均人的智能一样,能够知道自己什么能做什么不能做,就真的能够变成企业牵token就雇进来的员工。此时你再给它做职业培训,以前设想的最好的员工是高忠诚度、低工资、高智商,原先几乎不存在的员工现在真实存在了,而且可以 7* 24 小时工作。未来企业可能要为机器人去交社保。

硅基研习社:这在社会层面会有什么影响?你对白领有什么建议?

周健:对于很多企业而言,除了地理意义上有办公室复制需求,其它角度上看,很多做重复性工作的低端白领会面临非常大的冲击。这对诸如财务、法务、HR、客服、中低端IT等岗位的影响会很大,而头部员工的效率会大幅提升,winner takes all。

随着大量低端岗位被取代,很多行业会被颠覆,但娱乐、虚拟经济依然会存在。

例如,从报纸杂志、自媒体公众号到短视频、直播,今天电影仍然是内容行业的皇冠。既然未来是生产力极度爆发的时代,那能不能每个人都能做一部电影?你也很难让大语言模型按照明朝的背景重新写一部红楼梦,但是人可以教大语言模型,人写一个固定脚本,然后用大语言模型慢慢去生成、修改,效率会极大提高。

前段时间斯坦福大学做的25个智能体的小村庄,这个业务模式完全可以向教育迁移,例如所有的大四毕业生,是不是需要在这样一个虚拟环境中进行职场培训,嵌入雇主打分功能;可以在其中进行社交能力的培训;甚至还可以模拟创业环境,过去创业试错的成本太高了,现在供给端成本下降以后,需求也会爆发。

所以,一定要去积极拥抱各种新工具的产生,这样至少能延缓被替代的速度。

哲学上一直有探讨“计算与算计”的话题,AI是计算非常强,但它不会算计。但人不一样,人是生死驱动的价值观,AI没有办法去用兴趣驱动,人可以去追求自己真正兴趣所在的东西,而这些东西往往是AI去做不经济的。

更客观点讲,未来人可能是与AI去比拼ROI,对于那些AI做起来ROI不够高的领域,譬如说去分析海洋当中的某个生物的习性、去品各类茶的优劣等等。

好处是,人可以更聚焦于自身,去放大自己的兴趣,产生个性化创意的内容。社会有足够的资源让你开展研究,你可以完全拓展自己的兴趣,而不必被996所束缚。但如果你觉得天天研究鱼和茶叶根本没有什么意义,不如996去追求传统的工作价值,那就会很痛苦。

这么来看,未来既是天堂,也是地狱,每个人都会有自己的答案。


全文完,感谢您的阅读。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多