
-5.4(57.7%)와 제미나이 3.1 프로(54.2%) 등 비교군 모델들을 앞질렀다. 깃허브(GitHub) 테스트에서는 오퍼스 4.6이나 소네트 4.6이 해결하지 못한 과제를 포함해 해결률이 13% 향상됐다. 라쿠텐(Rakuten)은 실제 생산 환경의 과제 해결 능력이 오퍼스 4.6 대비 3배 높아졌다고 평가했다.시각 정보 처리 능력인 비전(Vision)
任主裁判,另外两名裁判是Josh Tiven(58号)和Justin Van Duyne(64号),替补裁判是Brian Forte(45号)。
력에서 비약적인 발전을 이뤄냈다고 앤트로픽은 설명했다.가장 눈에 띄는 변화는 자율적인 코딩 능력의 강화다. 오퍼스 4.7은 스스로 논리적 결함을 파악하고 실행을 가속화하며, 복잡하고 긴 시간이 소요되는 작업을 일관성 있게 처리한다. 벤치마크 결과, 에이전트 코딩 성능을 측정하는 ‘SWE-bench Pro’에서 64.3%를 기록해 GPT-5.4(57.7%)와
当前文章:http://yet7m.fenshuqi.cn/cszr/oddb.html
发布时间:05:08:49