接下来,让我们通过几道典型题目,看看这些大模型的表现如何。黑料社区 首先是选择题第一题,各家大模型均给出了正确答案,显示出它们在基础题目上的稳定表现。 选择题第五题是一道涉及函数的题目,所有大模型再次全部答对,进一步证明了它们在复杂题目上的解题能力。 然而,在选择题第八题中,豆包大模型和DeepSeek出现了错误,而其他模型均给出了正确答案。这道题目涉及对数函数,显示出部分模型在处理特定数学知识点时的局限性。 在解答题方面,我们以第16题为例,这是一道涉及数列和函数的题目。DeepSeek、通义千问、讯飞星火和豆包大模型均给出了正确的解题过程和答案,而文心X1和腾讯混元则出现了不同程度的错误。 最后,我们来看难度更高的第18题。讯飞星火、豆包大模型、DeepSeek、通义千问和GPT o3均获得了满分,而文心X1则因答案错误而失分。黑料网
|