分享

自然语言处理中有没有语法?

 汉上踏歌8z46b7 2018-02-11

关于这个问题,微软亚洲研究院副院长周明在 1.28-1.30 日由 DeepTech深科技举办的 EmTech China 全球新兴科技峰会上表示:

其实我个人是这么认为的,首先学术流派,大家是百花齐放、百家争鸣的,你也很难说,语言学知道就不顶用了,必须用数据驱动了深度学习。30年河东30年河西,有可能过一段时间,大家持之以恒发展基于人类知识的分析,也有可能他有很多的地方,反过来超越了你现在基于深度学习的方法。

所以,我是觉得,作为一个很好的研究人员,应该不待偏见,要包容合乎是鼓励不同……各自发展,甚至是竞争,最后走向合作的趋势。

举个例子,其实比如说机器翻译,原来都是基于规则的,后来有一派就基于统计和数据驱动,另一派的人就说我就不用,什么语言知识最好不用,越用越倒霉,越用越水平不高。但是,又发现过了一阵子加上树的结构,真的管事,所以又发现了一些基于数的模型。这个时候他就不说语言学知识没用了,他说语言学知识有用,只不过我们原来不知道怎么用。

现在神经网络这个也是一样,现在基于串对串、编码解码,还凑合,后来发现,编码的时候,它只考虑的相邻的二维码前后连接状态的制约,他们也考虑的跨越的。但是,对他产生影响的,是可以考虑到的。现在,也是说把数加到那个编码里面,也提升了翻译水平。

所以,我个人认为,就是说这两个流派的人应该都是包容的,还有的时候,在有一些数据很小的时候,比如说有一些语言就没有什么数据。用语言知识可以做一个冷启动的措施就到位了之后,因为你运行起来有用户用了,数据就来了。数据来了之后你仍然可以在重新用NMT或者是SMT,重新去一套你的系统,连原来的语言知识建立的系统,既帮你做冷启动,也可以把他的知识再柔和到你的数据驱动中。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多