Amazon Bedrock, Anthropic 고성능 코딩 모델 Claude 4 정식 출시

오늘 Anthropic에서 차세대 Claude 모델인 Opus 4와 Sonnet 4를 출시했습니다. 두 모델 모두 코딩, 고급 추론을 제공하며 유능한 자율적 차세대 AI 에이전트를 지원합니다. 이제 Amazon Bedrock에서 정식 출시되었으므로, 두 모델이 제공하는 고급 추론과 에이전트 기능을 바로 사용할 수 있습니다.

Amazon Bedrock은 Anthropic의 최첨단 모델로 AI 선택지를 넓혀 주며, 엔터프라이즈급 보안과 책임 있는 AI를 통해 혁신적인 애플리케이션을 자유롭게 빌드할 수 있도록 합니다. 두 모델 모두 태스크 계획, 도구 사용, 에이전트 조향성을 강화하여 AI 시스템의 잠재력을 더 넓혀 줍니다.

Opus 4의 고급 인텔리전스를 이용하면 대규모 코드베이스를 리팩터링하거나 여러 부서를 아우르는 엔터프라이즈 작업을 조율하는 등 실행 시간이 오래 걸리고 컨텍스트가 많은 태스크를 처리하는 에이전트를 빌드할 수 있습니다. Sonnet 4는 대규모 효율성에 최적화되어 있어 하위 에이전트로 사용하거나 코드 검토, 버그 수정, 프로덕션급 콘텐츠 생성 등 대규모 태스크에 매우 적합합니다.

생성형 AI로 빌드하는 경우, 수많은 개발자가 장기 태스크를 다룹니다. 이러한 워크플로에는 심층적이고 지속적인 추론이 필요하고, 대개 여러 단계의 프로세스를 거쳐야 하며, 폭넓은 컨텍스트에 걸쳐 계획을 수립하고, 오랫동안 다양한 입력 정보를 종합해야 하기도 합니다. 대규모 프로젝트의 리팩터링이나 변환을 지원하는 개발자 AI 에이전트가 이러한 워크플로의 좋은 예입니다. 기존 모델도 신속하고 능숙하게 응답할 수 있지만, 특히 코딩, 연구, 엔터프라이즈 워크플로와 같은 부문에서 오랫동안 일관성과 컨텍스트를 유지하는 것은 여전히 어려운 일일 수 있습니다.

Claude Opus 4
Claude Opus 4는 최소한의 감독으로 복잡한 작업을 추론, 계획 및 실행할 수 있는 정교한 AI 에이전트를 빌드하기 위해 설계된 Anthropic의 최고급 모델입니다. Anthropic 벤치마크에 따르면, 이 모델은 현재 시중에서 구할 수 있는 코딩 모델 중 단연 최고입니다. 특히 광범위한 컨텍스트, 심층 추론, 적응형 실행이 매우 중요한 소프트웨어 개발에 탁월한 성능을 발휘합니다. 개발자는 Opus 4로 프로젝트 전체에서 코드를 작성 및 리팩터링하고, 풀 스택 아키텍처를 관리하며, 상위 수준의 목표를 실행 가능한 여러 단계로 나누는 에이전트 시스템을 설계할 수 있습니다.

Opus 4는 SWE-bench 및 TAU-bench와 같은 코딩 및 에이전트 중심 벤치마크에서 탁월한 성능이 입증되어 다단계 개발 워크플로를 처리하는 에이전트를 빌드하는 데 적합합니다. 예를 들어 Opus 4는 기술 문서를 분석하고, 소프트웨어 구현을 계획하고, 필요한 코드를 작성한 다음 반복 작업을 통해 미세 조정할 수 있습니다. 이와 동시에 요구 사항과 아키텍처 관련 컨텍스트를 추적할 수도 있습니다.

Claude Sonnet 4
Claude Sonnet 4는 성능, 반응성과 비용의 균형을 맞추어 Opus 4를 보완하는 모델로, 대규모 프로덕션 워크로드에 적합합니다. 이 모델은 코드 검토를 지원하고 버그 수정을 구현하며 즉각적인 피드백 루프를 활용해 신기능 개발을 돕는 등 강화된 성능으로 일상적인 개발 태스크에 활용하도록 최적화되었습니다. 또한 실시간에 가까운 작업 환경에서 프로덕션 레디 AI 어시스턴트를 활용할 수 있습니다.

Sonnet 4는 Claude Sonnet 3.7의 드롭인(drop-in) 대체 모델입니다. Sonnet 4는 멀티 에이전트 시스템에서 태스크별 하위 에이전트로 우수한 성능을 제공합니다. 표적화된 코드 검토, 검색 및 가져오기와 같은 작업을 처리하거나 광범위한 파이프라인 내에서 분리된 기능 개발을 진행할 수 있습니다. 또한 높은 처리량과 개발자에 맞춘 출력을 유지하면서 지속적 통합/지속적 전송(CI/CD) 파이프라인을 관리하거나, 버그 분류를 수행하거나, API를 통합할 수 있습니다.

Opus 4와 Sonnet 4는 준즉각적 응답, 심층 추론을 위한 확장 사고라는 두 가지 모드를 제공하는 하이브리드 추론 모델입니다. 대화형 애플리케이션에는 준즉각적 응답을 선택하면 되고, 요청이 심층적인 분석과 계획이 필요한 경우 확장 사고를 사용하면 됩니다. 특히 소프트웨어 엔지니어링, 수학, 과학 연구와 같이 컨텍스트가 긴 태스크인 경우 사고 모드가 매우 유용합니다. 모델의 사고 예산을 구성하면(예: 최대 토큰 수 설정) 워크로드에 맞는 지연 시간과 답변 깊이 사이의 트레이드오프를 조정할 수 있습니다.

시작하기
Opus 4와 Sonnet 4의 실제 사용 사례를 확인하려면 AWS 계정에서 새 모델을 사용 설정하세요.

그런 다음 Bedrock Converse API를 사용해 코딩 작업을 시작합니다. Opus 4에는 anthropic.claude-opus-4-20250514-v1:0, Sonnet 4에는 anthropic.claude-sonnet-4-20250514-v1:0의 모델 ID를 사용하면 됩니다. Converse API는 메시지를 지원하는 모든 Amazon Bedrock 모델과 호환되는 일관된 API를 제공하므로 이 API를 사용하는 것이 좋습니다. 다시 말해, 코드를 한 번만 작성하면 여러 모델과 함께 사용할 수 있다는 뜻입니다.

예를 들어 코드 리포지토리에서 변경 사항을 병합하기 전에 코드를 검토하려고 에이전트를 하나 작성한다고 가정하겠습니다. 이 경우 저는 Bedrock Converse API를 사용해 다음과 같은 코드를 작성해서 시스템과 사용자 프롬프트를 보냅니다. 그러면 에이전트가 스트리밍된 결과를 사용합니다.

private let modelId = "us.anthropic.claude-sonnet-4-20250514-v1:0"

// Define the system prompt that instructs Claude how to respond
let systemPrompt = """
You are a senior iOS developer with deep expertise in Swift, especially Swift 6 concurrency. Your job is to perform a code review focused on identifying concurrency-related edge cases, potential race conditions, and misuse of Swift concurrency primitives such as Task, TaskGroup, Sendable, @MainActor, and @preconcurrency.

You should review the code carefully and flag any patterns or logic that may cause unexpected behavior in concurrent environments, such as accessing shared mutable state without proper isolation, incorrect actor usage, or non-Sendable types crossing concurrency boundaries.

Explain your reasoning in precise technical terms, and provide recommendations to improve safety, predictability, and correctness. When appropriate, suggest concrete code changes or refactorings using idiomatic Swift 6
"""
let system: BedrockRuntimeClientTypes.SystemContentBlock = .text(systemPrompt)

// Create the user message with text prompt and image
let userPrompt = """
Can you review the following Swift code for concurrency issues? Let me know what could go wrong and how to fix it.
"""
let prompt: BedrockRuntimeClientTypes.ContentBlock = .text(userPrompt)

// Create the user message with both text and image content
let userMessage = BedrockRuntimeClientTypes.Message(
    content: [prompt],
    role: .user
)

// Initialize the messages array with the user message
var messages: [BedrockRuntimeClientTypes.Message] = []
messages.append(userMessage)

// Configure the inference parameters
let inferenceConfig: BedrockRuntimeClientTypes.InferenceConfiguration = .init(maxTokens: 4096, temperature: 0.0)

// Create the input for the Converse API with streaming
let input = ConverseStreamInput(inferenceConfig: inferenceConfig, messages: messages, modelId: modelId, system: [system])

// Make the streaming request
do {
    // Process the stream
    let response = try await bedrockClient.converseStream(input: input)

    // Iterate through the stream events
    for try await event in stream {
        switch event {
        case .messagestart:
            print("AI-assistant started to stream")

        case let .contentblockdelta(deltaEvent):
            // Handle text content as it arrives
            if case let .text(text) = deltaEvent.delta {
                self.streamedResponse + = text
                print(text, termination: "")
            }

        case .messagestop:
            print("\n\nStream ended")
            // Create a complete assistant message from the streamed response
            let assistantMessage = BedrockRuntimeClientTypes.Message(
                content: [.text(self.streamedResponse)],
                role: .assistant
            )
            messages.append(assistantMessage)

        default:
            break
        }
    }

처음 시작하는 분들께 도움이 되도록 제 동료인 Dennis가 여러 가지 사용 사례와 다양한 프로그래밍 언어에 대한 광범위한 코드 예시를 제공하고 있습니다.

지금 Amazon Bedrock에서 이용 가능
이번 릴리스를 통해 개발자분들은 완전관리형 서버리스 서비스 Amazon Bedrock에서 Anthropic이 개발한 차세대 Claude 모델을 바로 사용할 수 있습니다. 이미 Amazon Bedrock에서 Claude로 빌드하고 있든, 이제 막 시작하는 단계든, 이렇게 모델에 원활하게 액세스할 수 있기 때문에 최첨단 파운데이션 모델을 사용해 더 빠르게 실험하고 프로토타입을 만들고 규모를 조정할 수 있으며, 인프라를 관리하거나 복잡한 통합을 거칠 필요가 없습니다.

Claude Opus 4는 북미: 미국 동부(오하이오, 버지니아 북부) 및 미국 서부(오리건) AWS 리전에서 사용할 수 있습니다. Claude Sonnet 4는 북미뿐만 아니라 APAC, 유럽 AWS 리전에서도 제공됩니다. 여기에는 미국 동부(오하이오, 버지니아 북부), 미국 서부(오리건), 아시아 태평양(하이데라바드, 뭄바이, 오사카, 서울, 싱가포르, 시드니, 도쿄) 및 유럽(스페인) 리전이 포함됩니다. 교차 리전 추론을 통해 두 모델에 액세스할 수 있습니다. 교차 리전 추론을 사용하면 사용자의 지역 내에서 추론 요청을 처리하기 가장 적합한 최적의 AWS 리전을 자동으로 선택할 수 있습니다.

Opus 4는 가장 까다로운 개발 태스크를 담당하고, Sonnet 4는 속도와 기능 간 최적의 균형을 맞춰 일상적인 작업을 처리하는 데 탁월합니다.

지금 바로 자세한 요금 정보와 Amazon Bedrock에서 이러한 새 모델을 사용하는 방법을 알아보세요.

— seb

Amazon Web Services 한국 블로그

Amazon Bedrock, Anthropic 고성능 코딩 모델 Claude 4 정식 출시

주요 링크 모음

팔로우하기