OpenAI最新模型打不动了？GPT5.2因降智陷差评潮-乐居财经

OpenAI最新模型打不动了？GPT5.2因降智陷差评潮

原创 <{$news["createtime"]|date_format:"%Y-%m-%d %H:%M"}> 乐居财经 2991阅读 2025-12-15 22:16

Ai快讯 近日，OpenAI在十周年之际发布了GPT-5.2系列模型，官方数据显示其在GDPval等专业基准测试中超越人类专家，是迄今为止在“专业知识工作方面”表现最好的模型。据OpenAI官方披露，GPT-5.2在多领域实现技术突破：GDPval测试中覆盖44个职业的任务表现70.9%优于顶尖专家，SWE-bench Pro编程测试获55.6%的SOTA成绩，还将幻觉率较GPT-5.1降低38%。 SimpleBench常识推理测试显示，GPT-5.2得分低于Anthropic发布的Claude Sonnet 3.7，甚至在“garlic有几个r”的基础问题上反复出错——有用户三次测试仅一次答对，而谷歌的Gemini 3.0等竞品均稳定通关。该测试旨在评估大模型在处理普通人认为简单，但对机器而言充满挑战的逻辑推理任务的能力。前AWS总经理Bindu Reddy直言，“不值得从GPT-5.1升级”。（界面）

（AI撰文，仅供参考）

历史搜索

热门搜索

曹操出行(02643.HK)集团业务营运正常整体业务基本面未发生任何重大不利变化

晨鸣纸业拟33.36亿元出售目标公司全部股权

RAFFLESINTERIOR股东要求罢免多名现任董事及委任新董事 12月16日复牌

微创医疗(00853.HK)预期合并将于12月19日或前后完成

心通医疗-B设立战略委员会及商业化委员会

华夏幸福:华夏幸福股东会议事规则

华夏幸福:华夏幸福关于召开2025年第三次临时股东大会的通知

进深

家居K线

物业K线