分享

科大讯飞胡郁:AI技术让电话诈骗减少60%

 汐钰文艺范 2016-10-25






撰文 | 罗凯


等下一次交互革命到来的时候,语音会取代触摸成为核心的交互手段。到时候,不仅双手会被解放出来,连与设备的距离,也变得更自由了。”胡郁做完演讲匆匆从世界人工智能大会(AI WORLD 2016)的讲台上走了下来,他是目前炙手可热的智能语音企业科大讯飞的创始人之一,也是现在的轮值总裁。胡郁觉得,这个未来不会太远,物联网的契机一定会推动语音交互快速爆发。


“语言本身是有壁垒的,使用习惯和表达方式都有很强的本土性,这个特性给很多本土企业留下了发展的空间。比如在电脑和手机上使用的输入法,就是很好的例子。”胡郁刚刚坐下,又开始谈起了业务,“这个壁垒转换到具体的语音业务时,情况更明显。语音识别、语意理解和语音合成哪一项都跟使用者的表达习惯直接相关,要做得实用、有亲和力,除了强大的技术,还要对使用者的背景和习惯有清晰的了解,用词的方式、语音、语调都是不能忽略的重点。”


今年9月,科大讯飞刚刚在国际多通道语音分离和识别大赛(CHiME)中获得了三个项目的最好成绩。大赛只设立了三个项目,因此可以说是包揽整场。项目测试的核心内容是在复杂环境下语音分离和识别的能力,换句话说,这个比赛从侧面证明讯飞在嘈杂环境中的识别能力,已经走到了世界顶级。


“因为有技术优势,又直接服务本土用户,我们在国内语音市场的占有率已经达70%以上。但现在的问题非常明显,用户使用语音交互的比例还不是很高。”胡郁说。很明显,讯飞不能等物联网的爆发来拉动用户活跃度,在此之前,他们得主动扩展智能语音的应用场景,提高智能语音使用的满意度。“教育、医疗、智慧城市、智慧交通,这些都是非常重要的领域,智能语音能够介入的空间也很大,”胡郁说,“我们尝试着做个性化的智能教育,让智能系统收集学生的学习情况,综合分析后,再给出具有针对性的练习方案。在合肥一中做的测试反馈还不错,一些排名中等的学生冲到了年级前列。”


“除此之外,还有一个案例非常有意思,是跟安全有关的。最近电话诈骗非常猖獗,而安徽省的诈骗次数却下降了60%。这是因为我们和当地电信系统合作,做了一个监控系统,对有诈骗性行为通话进行自动提醒。整个提醒工作都由智能系统自动完成,不会增加额外的人力,”胡郁顿了顿,笑着说:“当然,这些例子在反映技术整合的实用价值以外,也推动了我们的技术进步。只有把语意理解和推理能力做得足够好,才能把这两件事做好。我们的落脚点还是人工智能技术。”


1999年,科大讯飞刚在安徽合肥成立时,林林总总跟语音处理相关的公司在北京和上海等创新中心冒出了一批。相比而言,科大讯飞所处的地理位置和投资环境都不占优,除了背靠中国科技大学以外,几乎很难找到显眼的优势。要知道,“人工智能”的概念提出以来,也随着行业技术的发展经历了巨大的起伏。即使中科大从这个专业毕业的学生,也有好些年都难以找到合适的工作。胡郁说,“当时能坚持不转行的人,现在很多都已经成了行业中重要的研发或者管理人员。2000年后,很多语音处理公司陆续倒闭,但讯飞坚持了下来。”不仅如此,当时的讯飞吸纳了大批从中科大毕业的研究人员,还凭借积累的技术优势,获得了2003年的“国家科技进步奖”。


随后,这个远离创新中心的技术型企业在内陆地快速发展,陆续获得了更多国家级和国际级的奖项,业务范围也开始逐渐扩展。近几年,互联网的快速发展和巨大的网民基数,给人工智能的发展提供了良好的土壤。计算性能大幅提升后,深度神经网络技术又在2006年左右以全新的方式回归。大数据让人工智能成为了可能,它和深度神经网络技术结合后,在语音识别方面,表现出了巨大的优势。以前食之无味弃之可惜的语音识别技术,迅速提升到个位数的错误率,有了极高的商业应用前景。凭借在前期积累的技术经验,讯飞借助这次的机会占领了中文智能语音市场的绝大部分份额,一跃成为BAT外,非常重要的一家人工智能企业。


“目前我们有上千人的技术团队在研究AI技术,”胡郁说,“在应用方面,国内研究人工智能的团队已经能和美国这些在人工智能技术领域领先的国家相比了。20世纪60年代的时候,我们技术积累薄弱,没办法和世界上最先进的国家竞争。在这一波人工智能的潮流中,国内或许能成长出一批国际性的科技公司。”


但是,要成为国际性的公司,按现在的市场规模和用户活跃度还有些距离,无论是技术爬坡还是市场规模的开拓,预设曲线都很陡。“我们是平台型公司”,胡郁反复强调,“每年申请上百件的专利,就是为了能给应用型的公司提供核心的技术。目前我们也会投资一些创业公司,加速推送物联网的发展,但并不代表着我们会做特别垂直的产品,自己去抢占这个市场。我相信机器人或者说人工智能的应用市场很难被几家大公司垄断,因为用户的需求变化太大,需要有很多公司来分别满足他们不同的需求。我们希望的,是这些公司在整合产品时,使用我们的核心技术,做出体验更好的产品,从而扩展我们的市场占额。”


胡郁陪着讯飞经历过行业的低谷,这一次,他们想趁胜追击。十几年积累的技术优势和平台优势,都像有待爆发野兽。他说,“5年内,在医学、教育、车载和智能家居等领域中,我们会把语音交互的使用次数提高10倍,达到40%的比例。到时候,就是一场新的交互革命。”



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多