SuperCLUE,这一全球首个针对中文通用大模型的综合性评测基准,以其精准的测试和多维度的能力分析,为我们解答了一个焦点问题:在通用大模型风靡全球的今天,中文大模型究竟谁是王者? 经过激烈的角逐,首个榜单出炉!讯飞星火认知大模型荣登国内第一,总分达到53.58分,尽管与国际顶尖的GPT-4还有23个百分点的差距,但已在总分上领先gpt-3.5-turbo13个百分点。这一成绩可谓实至名归! 总榜单 更让人惊叹的是,讯飞星火认知大模型在对话、百科知识、角色模拟、计算能力、语义理解和逻辑推理六大方面,均达到了GPT 3.5的高峰水平。尤其在语义理解方面,讯飞星火认知大模型更是拿下100分的满分,超越了GPT-4,成为了国内最耀眼的新星。 基础能力榜单 SuperCLUE评测榜单包含三大部分:总榜单、基础能力榜单和中文特性榜单,涵盖了包括语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等10项基础能力,以及中学、大学与专业考试的50多项专业能力。同时还针对中文特点的任务,评估了中文成语、诗歌、文学、字形等10项多种能力。 中文特性榜单 榜单将定期更新,让我们共同期待更多优秀的中文大模型脱颖而出! 中国AI的繁荣不仅仅是一个国家的骄傲,更是全球智能科技发展的重要推动力。讯飞星火认知大模型的崛起,预示着未来在全球AI舞台上,中国将再次书写辉煌篇章! |
|