分享

“一个让人更加兴奋的技术时代来了”

 秀水岩 2023-05-10 发布于广东

王海峰团队获颁吴文俊人工智能科技进步奖特等奖。百度供图

■本报记者 赵广立

5月6日,代表我国人工智能科技领域最高荣誉的“吴文俊人工智能科学技术奖”在京揭晓表彰名单。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰带领团队完成的“知识与深度学习融合的通用对话技术及应用”成果,获得了吴文俊人工智能科技进步奖特等奖。

这是该奖项12年来首次评出特等奖。人们不禁想要知道:这是一项怎样的成果?它有何特别之处,使其在人工智能大潮汹涌的今天,从群雄逐鹿中脱颖而出、独占鳌头?近日,《中国科学报》走访百度,一探究竟。

谈技术:有何过人之处?

众所周知,近段时间以来,引爆人工智能“能量场”的正是以ChatGPT为代表的对话机器人。与以往对话机器人相比,ChatGPT等产品不仅可以与人进行多轮交互对话,还能结合上下文,对对话内容进行记忆、理解、规划等,以给出更贴合用户想法的答案。

事实上,真实应用中的对话机器人背后,是涵盖对话语音识别、管理、生成等一系列复杂技术的人机对话系统。“知识与深度学习融合的通用对话技术”正是这些复杂技术面向通用场景的系统性突破。

“通用对话技术是人工智能领域最具挑战性的方向之一,也被认为是通用人工智能的必备能力。”在发表获奖感言时,王海峰提到,人工智能通过学习海量人类知识,在一问一答间逐渐给出令人满意的答案,这个过程并不容易。

比如,对话知识统一表示与构建是通用对话的知识基础,若人工智能不能对对话内容有全局规划,对话的连贯性和条理性就会大打折扣;在语音输入输出的对话中,提升对话语音识别精度与降低延迟很难兼顾,若无法妥善解决,则会影响语音交互的体验感;还有一些知识场景训练数据稀缺,需要引入小样本学习、反馈驱动持续学习等机制,否则人工智能难以准确理解对话内容;在对话生成方面,也存在对话行为多样性建模等难题。凡此种种,都对人工智能能否自然、准确、流畅地与人对话有显著影响。

基于百度在人工智能技术领域的长年积累,王海峰团队加快脚步,围绕上述通用对话技术中的关键技术和重点难点展开攻关,取得了一系列技术突破。

比如,在这项获得吴文俊人工智能科技进步奖特等奖的研究成果中,他们提出了基于知识统一表示的通用对话管理技术,致力解决对话不连贯的难题;优化了融合知识的流式对话语音识别技术,瞄准解决对话听不清的难题;提出了知识增强的通用对话理解技术,以期解决理解不准确的难题;提出了基于隐变量与知识的对话生成技术,通过攻克对话行为多样性建模难题、研制百亿参数对话预训练生成模型等手段,推动实现内容丰富、知识准确、自然流畅的对话。

颁奖典礼上,中国人工智能学会对这项特等奖成果不吝赞誉:“整体技术指标与应用效果达到国际领先水平,极大提升了我国在这一领域的科技竞争力和产业影响力。”

看应用:加速缩小与国外最好水平的差距

正如中国人工智能学会所评说的那样,这项成果的产业影响力引人关注。

项目资料显示,“知识与深度学习融合的通用对话技术及应用”这项成果,已获授权发明专利82项,发表高水平论文36篇,在国际权威评测中获世界冠军11项。目前,项目成果已经实现了大规模产业应用,支持5亿台智能设备,服务超过10亿用户,覆盖包括通信、金融、汽车、能源等在内的20多个行业。

“知识与深度学习融合的通用对话技术目前已广泛应用于各行各业和人们的生产生活中。”在发表获奖感言时,王海峰说道。

备受关注的新一代知识增强大语言模型文心一言,也使用了通用对话技术方面的研发创新。文心一言基于文心大模型ERNIE及对话大模型PLATO研发,具备知识增强、检索增强和对话增强等优势。其中,在对话增强方面,文心一言在相应技术的赋能下,具备记忆机制、上下文理解能力和对话规划能力,可以实现更好的对话连贯性、合理性和逻辑性。

通用对话技术在文心一言上的应用,加快了后者追赶世界领先水平的脚步。王海峰在受访时谈到,如果说之前我们跟国外最好的系统还有些差距,“现在这个差距正在加速缩小”。

他告诉记者,百度很早就将自然语言处理技术中的语义理解、语义匹配等技术嵌入搜索引擎的升级之中,目前搜索应用也在与文心一言协同“进化”;在ToB业务端,基于知识增强大模型的开发应用正在改变云计算的游戏规则,百度智能云正借力MaaS(模型即服务)让智能服务变得更易用、更快捷。

人工智能发展已进入新的临界点

亲身经历一个个新技术从积蓄力量到奋力起飞的故事,看到人工智能在模拟、延伸和拓展人的智能的道路上不断加速进步,王海峰不由得感叹:一个让人更加兴奋的技术时代来了。

“因为这意味着人工智能将给人类带来越来越多的价值。”王海峰回忆说,在2011年百度翻译上线前,他已经投身于机器翻译领域18年。但百度翻译上线仅一周,增长的用户量就超过了过去18年的总和。如今,百度翻译的每天翻译量达千亿字符。类似的,今天以文心一言为代表的大语言模型技术也面临着大量真实需求。

特别是随着文心一言的迭代升级,王海峰发现,人工智能技术(如通用对话技术)在深度理解与生成、推理计算、跨模态等方面都在取得新的突破。这让他更加确信:“人工智能技术和产业发展正进入一个新的临界点。”

“人工智能在围棋比赛中第一次击败人类顶尖棋手时,人们都很兴奋,因为这个里程碑事件让人们看到了人工智能进步的程度和它带来的想象空间。”王海峰说,现在,我们仿佛可以看到未来人工智能将有全方位的进步,并最终为人类带来方方面面的价值,“这个影响是更深远的”。

值得一提的是,随着人工智能技术进步走向深入,智能化时代信息技术架构传统的“芯片-操作系统-应用”三层架构或将被颠覆,进而走向“芯片-框架-模型-应用”四层架构。百度认为,四层架构可顺滑实现层与层反馈、端到端优化,进而使人工智能在大数据、大模型、大算力上如鱼得水、得心应手。目前,百度在这四个技术层面全面攻坚,并逐渐成为中国人工智能技术和产业的领航者。

《中国科学报》 (2023-05-10 第3版 领域)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多