分享

百人会热议ChatGPT:新AI时代已至,如何应对ChatGPT冲击波?中国AI产业路在何方?

 源源不断 2023-03-25 发布于宁夏


图片
3月23日,信息化百人会2035数字议程伙伴行动 · 领导者三周会(第9期)在京召开,围绕”迎接’新AI时代’——从ChatGPT看中国AI产业发展之路”这一主题,特邀了政策制定研究、产业组织研究、AI大模型设计开发研究的政府领导、产业专家、科学家及人工智能领域头部企业负责人以及众多百人会成员进行了深入交流和研讨,助力中国特色的AI技术和产业发展之路。

图片


这次会议重点讨论了以下问题:

1.如何认识理解ChatGPT?

2.新一轮AI技术和产业的制高点和主战场在哪里?谁是中国的主力军?

3.新一轮AI发展对算力基础设施提出哪些新要求?中国算力基础设施发展面临什么样的问题的挑战?

4.中美发展模式之间的差异与比较——以ChatGPT成功为例,如何看待美国的发展经验:技术路线、商业模式、大企业主导、产业生态(人才、资本、开源)等;

5.什么是中国新一轮AI的高质量发展之路?中国AI产业发展应该选择怎样的发展道路?采取什么样的技术路线、商业模式、生态建设、新型体制、治理体系?有哪些基础、优势和力量?

以下是会议重点内容摘要。

图片

图片



微软韦青:ChatGPT只是一棵“树”,我们应更关注庞大的“树根”

图片


微软(中国)首席技术官韦青认为,新“人-机”时代应该是一个以人为主体、以机器为客体的时代。针对当前ChatGPT、GPT-4的火爆,韦青表示,我们不要着急“往上走”,去追逐技术潮流,而是应该“往下走”,去看看技术的起源。应该“由因推果”,而不是“由果推因”。ChatGPT所使用的GPT-3技术是一种基于Transformer的大语言模型,是这一轮人工智能技术取得实质性突破真正核心的“因”。人类的知识是土壤,各类以大语言模型为代表的基础模型相当于地下庞大的“树根”,ChatGPT只是在这上面长出来的一棵“树”。在大语言模型的“树根”之上可以长出无穷多“小树”出来 ,如果只把目光放在其中一棵“树”上,那么可能永远也赶不上时代潮流。但是无论哪棵树,上面结的果实,也就是因基础模型的能力而产生的各种原来无法想象的新型应用,比如刚刚发布的ChatGPT插件(plugins)功能,和诸如Futurepedia网站上发布的海量AI工具,和更为基础的Azure OpenAI服务,将为人类利用机器能力的领域打开一个全新的大门。

韦青认为,以Transformer为核心的大语言模型,就像是一个极其高效的“知识提炼器”或“知识蒸馏器”,需要拿大量的、高质量的语料去“喂养”。OpenAI能够提炼的语料全是开放的、共享的和免费的,而我们明明有高质量的中文语料,但都被存在各家的后花园里面,不共享出来,不得不去国际上拿一些别人家花园的语料。之所以目前AI作图会出现“夫妻肺片”等令人啼笑皆非的结果,其原因也包括大语言模型的中文语料太少,这不是一两间公司能够解决的问题,这是全社会需要密切关注并大力投入的公共知识基础设施。这种智能机器能力的实现是一个复杂的巨系统工程,具有典型的短板效应,不仅仅要有算力,还要有优质的语料和素材,还需要有一个支持与包容创新,尤其是包容看似失败创新的社会氛围。为了以汉字为代表的华夏文明在这一轮智能机器潮流中屹立不倒并持续发展,需要全社会有钱的出钱,有力的出力,有知识的共享高质量的知识,“一种文明体系的语料如果不具备被这类知识机器抽取提炼的话,这种文明在智能机器时代的价值可能就会逐渐丧失。


张云泉:目前大多数智算中心并不适用GPT大模型的需求

图片

全国政协委员、中国科学院计算技术研究所研究员张云泉认为,GPT-3的出现意味着AI对算力的需求进入新阶段,算力服务异军突起,算力越来越成为当前整个数字经济社会发展的关键,算力与AI融合创新成为新趋势。

他指出,据MIT预测,训练GPT-4预计会花费26亿美元,2032年才能降低到5百万美元。OpenAI这么快就能把 GPT-4做出来,它是如何把训练费用降下来的,我们为什么当前降不下来,这是值得探讨的问题。

从GPT-3到ChatGPT的过程是中国人工智能之路和美国人工智能路的分歧点。我国也在做大模型,我们追求的是参数量,从千亿级到万亿级的快速跃进,没有出现智能涌现。OpenAI走了另外一条路,利用人工反馈(RLHF)的训练机制,通过标注、对齐、高质量数据,用千亿参数的大模型把通用智能挖掘出来。OpenAI这条路为什么走通了,这值得反思和探讨。

张云泉指出,目前大多数智算中心并不适用GPT大模型的需求。当前国内开启了智算中心建设热潮,这一轮智算中心的建设还不是针对大模型的,针对的是之前人工智能深度学习的,应用范围比较有限,没有那么大的算力需求,所以配置的计算部件是一般国产的部件,没有那么高的能力。


安筱鹏:中国为什么没有ChatGPT?这个问题问错了

图片


信息化百人会执委、阿里研究院副院长安筱鹏认为,ChatGPT是通用人工技术(AGI)发展的重要里程碑,AGI将引发新一轮数字技术竞争格局重构,也是大国新一轮数字技术竞争的制高点,必将对未来5-10年全球技术创新、企业竞争和国家博弈产生深远影响。透过ChatGPT现象,围绕“抢占'新AI时代’制高点”这一主题,他重点从AGI来临、中美差距、竞争焦点、面临挑战、追赶之路等方面分析了AGI的五个关键问题。

他认为以ChatGPT为代表的AGI具有颠覆性、涌现性、工程化、通用性、(技术、资本、人才)密集型五大特征。ChatGPT这种AI大模型是工程化的重大创新,其核心技术壁垒是数据、算法、算力等要素资源的精巧组合。Open AI从走向盈利组织,是小公司资源约束下(算力)理性选择,Open AI+微软是技术与商业的完美组合。

“业界会问一个问题:中国为什么没有ChatGPT?我觉得这个问题问错了,正确的问题是,中国为什么没有Open AI?中国为什么没有Snowflake?中国为什么没有Palantir”

安筱鹏指出,关于当前AGI全球竞争,需要关注的焦点是这轮竞争的入场券、主力军、主战场与天花板。“公共云+AI”的系统能力是通用人工智能(AGI)技术创新和产业化的“入场券”。拥有算力、数据、人才优势的大型科技公司是AGI大模型工程化的“主力军”。构建技术生态和产业生态是AGI全球竞争的“主战场”。规模庞大的统一市场决定了AGI市场竞争的“天花板”。

他指出,当前,我国AGI技术创新与产业发展还面临较大挑战,在统一大市场、高端芯片等方面与美差距较大,尤其是盲目建设低水平智算中心,消解了我国统一大市场优势,高端算力严重不足,低端算力严重过剩;数据的规模少、质量低和处理能力弱,降低了人工智能大模型的“智商”;创新生态体系尚未形成,制约了创新型企业群体涌现。

OpenAI由技术信仰与长期主义+风险投资创新+小公司创新与大公司商业化闭环等要素叠加带来的创新启示是技术的差距是表象,本质是创新机制、创新生态与创新文化的差距。

围绕本次研讨会的五大主要议题,来自研究机构的专家学者以及产业届和投资界的相关负责人进行了精彩的对话讨论。

图片

中国科学技术信息研究所人工智能发展研究中心副主任、科技部新一代人工智能发展研究中心副主任李修全表示,尽管人工智能远期路径仍存在一定的不确定性,但目前来看,GPT所代表的大规模预训练模型应该是当前最具可行性、并仍有相当大能力提升空间的技术路线。中国在这条技术路线已经具备了体系化的软硬件技术基础,要取得进一步突破,还需要思考从激活人才创新活力的环境、多元化的资金支持、适合大科学工程的组织机制等方面进行变革,并在如何有效组织存量和增量算力、如何开发利用数据资源等方面探索走出中国自己的模式。

图片


清华大学计算机科学与技术系教授、清华大学人工智能研究院视觉智能研究中心主任邓志东认为,大模型、大数据、大算力带来了生成式人工智能的大进步。ChatGPT、GPT-4之所以成功,是因为OpenAI走的是生成式人工智能的技术路线,采取无监督加微调及少样本的学习方式。关于中国如何进行追赶,邓志东认为,我们要做好创新生态建设,并利用好新型举国体制。“毫无疑问,中国一定要有自己的ChatGPT,但是不用太多,1-2家就可以了,因为它和电力等基础设施一样,是基于人类全球文本数据进行构建的重大战略性基础设施。”

图片


中国信息通信研究院副总工程师王爱华认为,ChatGPT、GPT-4等的出现的确开启了一个新时代,称它为AI 2.0,比肩苹果开启移动互联网时代也不为过。虽然目前GPT-4还是闭源的模型,但人工智能是基于开源开放才成长起来的技术,所以未来GPT-4如果要发挥更大的作用,得到更广泛和深入的应用,相信对其开源开放的期待也会愈加迫切。王爱华表示,大模型发展并非一日之功,中国需要在算法、算力、数据方面建立国家级的协同能力,另一方面需要产学研广泛深度的生态合作。

图片


阿里巴巴集团科研项目支持办公室主任史大治从创新视角分析了他对ChatGPT现象的思考。他指出, OpenAI或ChatGPT的成功不是单一技术的创新而是新技术体系的工程化创新,这样的创新是有时代背景的。大量公开数据可以通过互联网获取,公共云计算技术与服务的成熟都是ChatGPT能够成功的时代背景。在技术层面,Transformer的大规模工程化,实现了以机器为主体的底层的数据组织形态与存储结构创新,由此引发了对应上层技术体系的改变,是一次重大的技术颠覆。这一过程中由机器产生的数据也会形成新的知识,验证了新科技范式带来的创新。从AI治理视角,我们应该把AI技术作为人类的辅助能力,而不是与AI对抗,作为AI产业未来发展的底层逻辑支撑。关于大模型的孵化,他建议国家通过设定正确的创新目标和机制,选择正确的路线,发挥举国体制优势,从基础设施角度做出有全球影响力和竞争力的AI大模型。

图片


信息化百人会学术委员,十三届全国政协经济委员会副主任、中国发展研究基金会副理事长刘世锦在会上指出,GPT为什么会出现“涌现现象”,Bard模型会出现涌现现象吗?这是值得探究的问题。他认为,大模型出现之后,特别是通用能力形成之后垂直领域的应用,应该是主战场,产业空间非常大,是否是先2C再2B也很值得讨论,当下需要更多的信息和研究,从而为大模型带来的巨大产业空间做指引。

对于发挥举国体制的优势来做GPT大模型,刘世锦强调应该以企业为主体。他指出,数字经济的新基建不能走过去的老路,和过去机场、道路、铁路的基建不一样,虽然确实是通用性的基础设施,但不能由政府主导,应该坚持市场导向,由企业来主导。政府的责任是创造一个公平竞争的环境,可以做一些数字经济的示范工程,或者给予企业一定的资金支持或跟投。

本次会议由北京信百会研究院、阿里研究院联合主办。阿里巴巴集团区域研究中心主任李树翀主持。

参加本次会议的重要嘉宾还有:信息化百人会学术委员、中国电子信息行业联合会常务副会长周子学,信息化百人会执委、北京信百会信息经济研究院副理事长、执行院长钱卫列,信息化百人会执委朱炎以及信息化百人会成员、首旅集团原副董事长丁同欣,石化盈科信息技术有限责任公司原高级副总裁蒋白桦,中国电信集团有限公司原总经理李正茂,中国联合网络通信集团有限公司副总经理梁宝俊,中国石油信息管理部原总经理刘希俭,北京太极信息系统有限公司董事长吕翊以及阿里巴巴集团公共事务副总裁逄孝钢,SK中国副总裁樊会文等企业代表。

参会的还有科技部战略规划司、发改委创新中心的相关负责人,经济日报、科技日报、中国新闻网、中国青年报、中国电子报等媒体。

此外,还有多位信息化百人会成员以及信息化百人会“2035数字议程”合作伙伴企业线上参会。

本次研讨会后,北京信百会信息经济研究院将根据会议内容进行整理并报送中央有关机构、国务院有关部门,作为管理决策和政策制定的参考。








图片

关于“2035数字议程伙伴行动 · 领导者三周会”

为应对日益复杂、更具多重性和不确定性的数字发展环境,信息化百人会提出了“2035数字议程”计划,聚焦讨论和研究在数字化变革、转型与发展中,所应共同推动的重大战略、重要政策、关键行动及时间表,并据此推动开展“2035数字议程伙伴行动”

“2035数字议程伙伴行动 · 领导者三周会”是信息化百人会“2035数字议程伙伴行动”的重要内容之一,目的是助力百人会成员和重要合作伙伴登高望远、追求卓越,助力国家政策的研究和落实。会议采取闭门形式,有限范围定向特约参会人员。每三周召开一次,每次一个主题,邀请一到两位权威人士主讲,留出充裕时间让参会人员有机会围绕主题向主讲人提问,并与参会的政策决策部门相关工作负责人和特邀专家进行会上和会间交流。参会人员限政府决策部门人员、特邀相关企业一把手、特邀专家。


  

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多