分享

【ACL2018同期评测】5th中介语作文句法自动诊断CGED2018

 犁杖 2018-02-24

面向教育应用的自然语言处理工作坊(NLP Tech for Educational Application, NLPTEA):第五届中介语作文句法自动诊断评测CGED将于2018年7月19日在ACL2018(墨尔本)会期中举行。走过路过不要错过!


给歪果仁开发自动批改作文的程序还是很重要的一件事儿,这茬儿的baseline现在还很低,一起来beat!


~~欢迎参赛~~


NLP-TEA 2016 Shared Task: Chinese Grammatical Error Diagnosis,CGED



这是个啥任务?

我们就是给你一些洋人写中文作文的语料(中介语作文),然后请你(的系统)来诊断里面的句法错误。错误共有四类:多(字)词(Redundant)、缺(字)词(Missing)、错(字)词(Selection)和词序错误(Word Order)。我们将从三个方面来评测大家的系统性能:判断句子有错没错(detection level)、判断啥类型的错(identification level)、错误出现的位置(position level,最难啦~)。来看俩例子:

  • Example 1:
    Input: (sid=00038800464) 我真不明白。她们可能是追求一些前代的浪漫。
    Output: 00038800464, correct

  • Example 2:
    Input: (sid=00038801261) 人战胜了饥饿,才努力为了下一代作更好的、更健康的东西。
    Output: 00038801261, 9, 9, M
                 00038801261, 16, 16, S
    (Notes: '能' is missing. The word '作' should be '做'. The correct sentence is '才能努力为了下一代做更好的')


恍惚间,不敢想啊!今年已经是CGED评测的第五届啦~CGED2013@CFL、CGED2014@ICCE、CGED2015@ACL、CGED2016@COLING、CGED2017@IJCNLP


数据集

我们提供北京语言大学(曾)主办的汉语水平考试HSK作文批改数据。2018版训练集将开放1.1k个错误点。CGED2016、CGED2017版训练集和测试集共包含54.2k个错误点。2016、2017数据、历届评测报告、论文集和评测工具可在评测网站获取下载链接(www.cged.science)。


如何评测

  • Detection level

  • 告诉我们句子究竟有没有错

  • Identification level:

  • 告诉我们错误的类型(S、M、R还是W?)

  • Position level

  • 告诉我们错误的位置(指出错误从句首开始的字符偏移量)

  • Correction level:

  • 对于错(字)词和缺(字)词类型的错误,参赛队可给出0到3个推荐答案


每个评测侧面,都将评测精确率、召回率和F1值。


注意correction level中,系统可以根据对错误修改的置信度选择推荐答案的个数(0到3个之间)。显然推荐较多的答案会增大命中教师答案的可能性,但也会增大精确率中分母哦~


如何报名

电邮报名raogaoqi[爱特]blcu.edu.cn或cged2017[爱特]163.com

[爱特]==@


请在邮件中注明:

  • 团队的名称

  • 单位

  • 联系人和联系方式


走过路过不要错过!

  • 开始注册: February 6, 2018

  • 2018版训练集开放: February 26, 2018

  • 注册截止: April 20, 2018

  • 发布测试集: April 25, 2018

  • 参赛队伍提交结果: April 27, 2018

  • 公布评测成绩: April 30, 2018

  • 提交技术报告: May 14, 2018

  • 返回审稿结果: May 21, 2018

  • 终版提交: May 28, 2018

  • Workshop dates@ACL: July 19, 2018.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多