高考数学大模型对决落幕，讯飞星火综合能力拔得头筹

6月8日，新京报面向六款热门AI大模型，开展2026年新高考I卷数学模拟作答测评，依托专业教师团队完成评分工作。在满分150分的试卷中，科大讯飞讯飞星火拿下148分，排名第一，综合表现领先于参与测评的Kimi、DeepSeek、智谱、MiniMax、ChatGPT五款大模型。纵观全部答卷可以发现，很多模型仅聚焦答案对错，忽略了解题过程的完整性，而讯飞星火做到了全方位兼顾，答题过程规范、推理条理清晰，过程分与结果分毫无偏差，每一步推导都有理有据。业内教师指出，整套试卷的压轴题是划分大模型推理能力强弱的分水岭，多环节、高难度的逻辑推演，让不少模型暴露短板。北京市中学数学特级教师特别点评，讯飞星火在数形结合应用、图形几何性质探究上，具备明显优势。在数形结合应用题上，它提供几何法、向量法两种解法，思路多元；解答图形几何题时，合理运用平面几何中三角形面积关系解题，后续又借助夹角公式简化运算，将几何性质的作用发挥得淋漓尽致。对比之下，其他模型或是解题方法单一，不懂得结合图形简化运算，或是解题步骤繁琐，未能灵活运用几何规律。此次测评直观证明，讯飞星火不只是答题正确率高，在解题逻辑、方法运用、格式规范等综合能力上，都处于行业前列。

#人工智能国家队##大模型国家队##全栈自主可控#

群发资讯网

高考数学大模型对决落幕，讯飞星火综合能力拔得头筹

热门分类