世界焦点!微软华人团队发布全新基准AGIEva AI考公指日可待

来源:DoNews快讯 | 2023-05-11 10:36:22


(资料图)

微软研究人员发布了一个新的基准测试AGIEval,用于评估基础模型在人类认知任务中的表现,包括高考、公务员考试、法学院入学考试、数学竞赛和律师资格考试等。+++实验结果显示,GPT-4在一些任务中的表现超过了人类平均水平,但在需要复杂推理或特定领域知识的任务中不太熟练。评估推理能力可以确保模型在不同环境下的可靠性和可信度。(站长之家)

标签:

责任编辑:techtoutiao

本文相关推荐