2025版仪器采购宝典电子书

化工仪器网首页>资讯中心>项目成果>正文

OpenAI推出重磅o3推理模型!展现强大推理能力
2024年12月30日 11:34:03 来源:化工仪器网 点击量:4886

12月20日,美国开放人工智能研究中心(OpenAI)介绍了其最新的人工智能(AI)推理模型——o3及其轻量版o3-mini。

  12月20日,美国开放人工智能研究中心(OpenAI)介绍了其最新的人工智能(AI)推理模型——o3及其轻量版o3-mini。
 
  o3能够进行复杂任务的推理,在科学、编码、数学等领域的表现要优于前一代o1模型,同时花费的处理时间也会更长。以一项评估AI高级数学推理能力的测试EpochAI Frontier Math为例,以往所有模型都未达到2%的准确率,而o3准确率达到了创纪录的25%。
 
  在2024年美国数学邀请赛中,o3模型的准确率高达96.7%,仅答错了一个问题。而在OpenAI研究人员认为最严格的基准测试之一——Frontier Math中,o3也解决了25.2%的问题。尽管这一得分看似不高,但此前其他大型语言模型曾在此“集体翻车”,正确率均未超过2%。
 
  在对科学知识的掌握方面,o3的表现也超出一般博士水平。在GPQA Diamond(衡量模型在博士级科学问题上的表现,涵盖化学、物理和生物学方面的专业知识)基准测试中,o3的准确率达到87.7%,超过了人类博士的70%,也比之前o1表现高近10%。
 
  此外,o3的编码能力也比之前的o1系列更胜一筹。在 SWE-bench Verified(衡量AI模型解决现实世界软件问题的能力)基准上,o3的准确率约为71.7%,比o1高20%以上。在Codeforces编码竞赛平台中,o3的得分为2727,相当于榜单上第175名人类编程员的水平,而o1得分仅为1891。
 
  o3模型让OpenAI在通往AGI的道路上又迈前了一步。在相关基准测试ARC-AGI中,高配版o3得分为87.5%,低计算设置下o3得分为75.7%,是o1模型的三倍。但高计算模式需要花费极其昂贵的成本,每个任务高达数千美元,低计算模式则需要20美元左右。
关键词

相关阅读 Related Reading

查看更多+
  • 有效发明专利达到19.5万件 强化知识产权助力东北三省全面振兴

    截至今年4月底,东北三省一区发明专利有效量达到19.5万件,同比增长10.2%;有效注册商标量达到216.1万件,同比增长7.7%...
    2025-06-06 17:05:16
  • 预算422万元 巴彦淖尔市生态环境综合行政执法支队采购仪器设备

    巴彦淖尔市生态环境综合行政执法支队采购挥发性有机物专项执法能力建设项目,预算金额为422万元,项目编号为BSZCS-G-H-250...
    2025-06-06 14:03:01
  • 预算432万元 中国农业科学院生物技术研究所采购一批仪器设备

    中国农业科学院生物技术研究所中国农业科学院生物所农业微生物智能设计与合成平台提质增效仪器设备购置项目的预算为432万元。
    2025-06-06 10:14:53
  • 未来3年北京打造高端科学仪器产业集群

    为持续推动区块链占先,以区块链技术促进数字要素价值释放,加速构建新质生产力,近日,北京市科委中关村管委会、市发改委等多部门联合制定...
    2025-06-06 09:05:23
  • 预计突破30项以上数字计量关键核心技术 计量数字化转型攻坚行动方案发布

    《计量数字化转型攻坚行动方案》指出预计到2030年,重点突破30项以上数字计量关键核心技术,研制10项具有自主知识产权的数字计量装...
    2025-06-05 10:14:51
  • 江西省辐射环境监督站采购辐射监测仪器

    江西省辐射环境监督站辐射监测仪器采购项目04包(电磁环境在线自动监测系统) 的预算为53万元,项目编号为JXGZ2025-06-1...
    2025-06-05 10:14:37

版权与免责声明

  • 凡本网注明“来源:化工仪器网”的所有作品,均为浙江兴旺宝明通网络有限公司-化工仪器网合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其他方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:化工仪器网”。违反上述声明者,本网将追究其相关法律责任。
  • 本网转载并注明自其他来源(非化工仪器网)的作品,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。
  • 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
高精度压力测量及校准
关闭