Meta, Llama 4 Scout 함수 호출 기능 정식 GA—에이전트 파이프라인 구축 가능
Meta가 Llama 4 Scout 모델에 Function Calling 및 Tool Use 기능을 정식 GA로 공개했다. 오픈소스 기반으로 로컬·클라우드 양쪽에서 에이전트 워크플로를 구성할 수 있어, 외부 API 의존도를 줄이려는 한국 개발팀에게 실질적 대안이 된다.
무엇이 달라졌나
Meta는 2026년 6월 21일 Llama 4 Scout(17B 활성 파라미터, 109B 전체 MoE 구조)의 Function Calling API를 정식 GA로 전환했다. 이전까지 베타로 제공되던 병렬 도구 호출(parallel tool calls)이 안정화되어, 단일 추론 요청에서 최대 8개 함수를 동시에 호출할 수 있다. JSON Schema 기반 함수 정의 방식은 OpenAI Tool Calling 포맷과 호환되도록 설계되어 기존 코드베이스 마이그레이션 부담이 낮다.
성능 수치와 스펙
- 컨텍스트 길이: 10M 토큰(Function Calling 모드에서도 전체 지원)
- 병렬 도구 호출: 최대 8개 동시 실행
- 추론 속도: A100 80GB 단일 노드 기준 약 42 tokens/s(FP8 양자화)
- 모델 가중치: Meta 공식 GitHub 및 Hugging Face에서 무료 다운로드 가능
- 상용 라이선스: Llama 4 Community License 적용, MAU 7억 명 이하 서비스 무료 사용 가능
- 클라우드 API 가격: 공식 페이지 참조
한국 개발자 적용 포인트
Function Calling GA로 LangChain, LlamaIndex, 자체 에이전트 프레임워크와의 통합이 안정화됐다. 특히 온프레미스 또는 프라이빗 클라우드 환경에서 고객 데이터를 외부로 전송하지 않고 도구 호출 에이전트를 구성해야 하는 금융·의료 도메인 팀에게 유의미하다. Ollama 최신 버전(0.3.x 이상)에서 llama4-scout:latest 태그로 즉시 풀 가능하며, ollama run llama4-scout 명령 한 줄로 로컬 테스트가 가능하다. Cursor나 Claude Code와 MCP(Model Context Protocol) 서버를 연동할 경우 Llama 4 Scout를 백엔드 실행 엔진으로 교체하는 구성도 지원된다.