搜索

分享

QQ空间 QQ好友新浪微博微信

12个国产大模型大战高考数学，意外炸出个大bug

123xyz123 2024-06-08 发布于湖南

展开全文

金磊发自凹非寺

继国产大模型挑战高考作文之后，是时候再战一下高考数学了。

数学高考Ⅰ卷的题目，目前已经陆陆续续在网上有所公布（图片格式）。

12个国产大模型大战高考数学，意外炸出个大bug

那么现在，是时候考验国产大模型们的数学能力了。

有请“选手们”登场——

Kimi、通义千问、文心一言、豆包、智谱清言、百小应、讯飞星火、商量、腾讯元宝、天工、海螺AI、万知。

12个国产大模型大战高考数学，意外炸出个大bug

国产大模型 vs 高考数学选择题

根据数学题目类型的不同，我们先来小试牛刀一下选择题。

测评的方式是将题目（图片格式）“喂”给国产大模型们，要求它们给出相应题目的答案：

查看题目，给出第1题到第8题的答案。

接下来，我们就来一同看下国产大模型们的表现。

Kimi

12个国产大模型大战高考数学，意外炸出个大bug

通义千问

12个国产大模型大战高考数学，意外炸出个大bug

豆包

12个国产大模型大战高考数学，意外炸出个大bug

智谱清言

12个国产大模型大战高考数学，意外炸出个大bug

百小应

12个国产大模型大战高考数学，意外炸出个大bug

讯飞星火

12个国产大模型大战高考数学，意外炸出个大bug

商量

12个国产大模型大战高考数学，意外炸出个大bug

腾讯元宝

12个国产大模型大战高考数学，意外炸出个大bug

海螺AI

12个国产大模型大战高考数学，意外炸出个大bug

万知

12个国产大模型大战高考数学，意外炸出个大bug

不难看出，很多国产大模型还未做数学题，先败在了AI识图这个步骤，无法生成答案。

（PS：有几位选手测试时因为无法识别，未能完成答题，因此没有放出结果。）

那么我们最后来看下“踢馆选手”——GPT-4o。

12个国产大模型大战高考数学，意外炸出个大bug

国产大模型 vs 数学大题

鉴于一些国产大模型AI识图有点困难，我们这次直接先把这次高考的大题题目文字给copy出来，再让它们作答：

设n为正整数，数列 ( a1, a_2, \cdots, a{4m+2} ) 是公差不为0的等差数列。若从中抽去项 ( ai ) 和 ( a_j ) (i < j) 后剩余的 ( 4m ) 项可被平均分为 m 组，且每组的 4 个数都能构成等差数列，则称数列 ( a_1, a_2, \cdots, a{4m+2} ) 是 (i, j) - 可分数列。
(1) 写出所有的 (i, j) (1 ≤ i < j ≤ 6)，使得数列 ( a_1, a_2, a_3, a_4, a_5, a_6 ) 是 (i, j) - 可分数列；
(2) 当 ( m = 3 ) 时，证明：数列 ( a1, a_2, \cdots, a{13} ) 是 (2, 13) - 可分数列；
(3) 设 ( a1, a_2, \cdots, a{4m+2} ) 是 (i, j) - 可分数列。记数列 ( a1, a_2, \cdots, a{4m+2} ) 中任取两个数和 i (i < j)，则数列是 (i, j) - 可分数列的概率为 ( p_n )，证明：( p_n \geq \frac{1}{8} )。

12个国产大模型大战高考数学，意外炸出个大bug

接下来，我们再来看下国产大模型们的表现。

Kimi

12个国产大模型大战高考数学，意外炸出个大bug

通义千问

12个国产大模型大战高考数学，意外炸出个大bug

文心一言

12个国产大模型大战高考数学，意外炸出个大bug

豆包

12个国产大模型大战高考数学，意外炸出个大bug

智谱清言

12个国产大模型大战高考数学，意外炸出个大bug

百小应

12个国产大模型大战高考数学，意外炸出个大bug

讯飞星火

12个国产大模型大战高考数学，意外炸出个大bug

商量

12个国产大模型大战高考数学，意外炸出个大bug

腾讯元宝

12个国产大模型大战高考数学，意外炸出个大bug

天工

12个国产大模型大战高考数学，意外炸出个大bug

海螺AI

12个国产大模型大战高考数学，意外炸出个大bug

万知

12个国产大模型大战高考数学，意外炸出个大bug

最后，还是有请“踢馆选手”——GPT-4o。

12个国产大模型大战高考数学，意外炸出个大bug

那么，你觉得国产大模型们，识图+解数学题，哪家比较好一点呢？

最后，关于AI智能助手，这里也有一份最新用户数据分析报告供你参考：
https://mp.weixin.qq.com/s/sYxbvown5qLBnEs7zIR6Bg

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： 123xyz123 > 《其他》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

123xyz123

关注对话

TA的最新馆藏

如果没有发生抗日战争，民国能够实现工业化吗？是时候说出真相了
刘宅宅：实际上，在很多同行眼中，张爱玲差不多是“水分”最重的顶流作家
辽泽：被忽视的千年困局，中原难控辽东的元凶
爱生活的香瓜Vf：汉代无军功不得封列侯，非列侯不得为相。
破圈！理论物理最抽象、也最强大的工具，将破解“生物学”难题
他才是北宋抗辽战力的天花板：三败耶律休哥，战绩碾压杨家将！

喜欢该文的人也喜欢更多

热门阅读换一换