6月8日,新京报面向六款热门AI大模型,开展2026年新高考I卷数学模拟作答测评,依托专业教师团队完成评分工作。在满分150分的试卷中,科大讯飞讯飞星火拿下148分,排名第一,综合表现领先于参与测评的Kimi、DeepSeek、智谱、MiniMax、ChatGPT五款大模型。纵观全部答卷可以发现,很多模型仅聚焦答案对错,忽略了解题过程的完整性,而讯飞星火做到了全方位兼顾,答题过程规范、推理条理清晰,过程分与结果分毫无偏差,每一步推导都有理有据。业内教师指出,整套试卷的压轴题是划分大模型推理能力强弱的分水岭,多环节、高难度的逻辑推演,让不少模型暴露短板。北京市中学数学特级教师特别点评,讯飞星火在数形结合应用、图形几何性质探究上,具备明显优势。在数形结合应用题上,它提供几何法、向量法两种解法,思路多元;解答图形几何题时,合理运用平面几何中三角形面积关系解题,后续又借助夹角公式简化运算,将几何性质的作用发挥得淋漓尽致。对比之下,其他模型或是解题方法单一,不懂得结合图形简化运算,或是解题步骤繁琐,未能灵活运用几何规律。此次测评直观证明,讯飞星火不只是答题正确率高,在解题逻辑、方法运用、格式规范等综合能力上,都处于行业前列。
#人工智能国家队##大模型国家队##全栈自主可控#

