Anthropic, Claude Opus 4 Extended Thinking 정식 GA—복합 추론 태스크 성능 대폭 향상
Anthropic이 Claude Opus 4의 Extended Thinking 모드를 정식 GA로 전환하며 API를 통한 상용 사용을 전면 개방했다. 내부 사고 과정(thinking tokens)을 최대 32,000토큰까지 할당할 수 있어 복잡한 코드 아키텍처 설계, 수학적 증명, 다단계 비즈니스 로직 구현에서 기존 대비 정확도가 크게 향상됐다. 한국 개발자는 Messages API에서 `thinking` 파라미터를 활성화하는 것만으로 즉시 사용할 수 있다.
Extended Thinking이란 무엇인가
Extended Thinking은 모델이 최종 응답을 생성하기 전에 내부적으로 단계별 추론 과정을 수행하는 기능이다. 일반 응답 토큰과 별도로 thinking 전용 토큰 버짓을 지정할 수 있으며, 이번 GA에서는 최소 1,024토큰부터 최대 32,000토큰까지 설정 가능하다. 사용자는 응답 객체의 thinking 블록을 통해 모델의 중간 추론 흐름을 그대로 확인할 수 있어 디버깅과 감사(audit)에 유리하다.
API 사용법과 과금 구조
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-5",
max_tokens=16000,
thinking={
"type": "enabled",
"budget_tokens": 10000
},
messages=[{"role": "user", "content": "분산 시스템에서 분산 트랜잭션 없이 최종 일관성을 보장하는 이벤트 소싱 아키텍처를 설계해줘."}]
)
Thinking 토큰은 출력 토큰으로 과금되며, 정확한 단가는 공식 페이지 참조. 단, thinking 토큰은 캐싱 대상에서 제외되므로 반복 호출 시 비용 설계를 별도로 검토해야 한다.
한국 개발자 활용 시나리오
코드 리뷰 자동화: 대규모 PR에서 보안 취약점, 성능 병목, 아키텍처 안티패턴을 한 번에 분석할 때 thinking 버짓을 16,000토큰 이상으로 설정하면 단계별 근거가 명확한 리뷰 코멘트를 생성한다.
복잡한 비즈니스 로직 생성: 세금 계산, 배송비 정책, 멤버십 할인 중첩 적용처럼 조건 분기가 많은 로직을 구현할 때 thinking 과정에서 엣지 케이스를 자체적으로 탐색한다.
기술 문서 작성: API 레퍼런스나 아키텍처 결정 기록(ADR)처럼 논리적 일관성이 중요한 문서를 생성할 때 hallucination 빈도가 줄어드는 것이 내부 테스트에서 확인됐다.