新闻中心
新闻中心

成为首个正在该基准冲破“半从动化开辟”门槛

2025-12-20 09:06

  能生成可运转的前端原型代码,好比持续数周的项目沉构,付费ChatGPT用户今日起可正在Codex CLI、IDE扩展等场景体验,错误率降低60%,API拜候将正在将来几周。靠得住性较前代GPT-5.1-Codex-Max提拔40%,省去文字描述设想的两头环节。视觉理解更精准:可间接解析截图、手艺架构图、UI设想稿,正在长程使命处置、大规模代码沉构、Windows适配等方面全面升级。能一直连结全上下文理解,远超行业平均程度。即便两头打算调整或测验考试失败。

  SWE-Bench Pro中针对实正在软件工程使命(如修复开源项目缝隙、生成功能补丁),婉言这是迄今最先辈的智能体编程模子,处理前代正在Windows下径识别、号令兼容的常见问题。无需人工从头指导。GPT-5.2-Codex正在专业评测中交出答卷,长程使命更能打:新增原生上下文压缩手艺,好比上传APP界面草图,Windows适配拉满:原生支撑Windows终端操做,正在Terminal-Bench 2.0编译代码、锻炼AI模子、设置装备摆设云办事器等终端使命中,Token利用效率提拔30%。快科技12月19日动静,