Google Scion 완전 정리: 여러 AI 에이전트를 동시에 돌리는 멀티 에이전트 오케스트레이션

지난 1년의 코딩 에이전트 발전사는 한 줄로 요약된다. “한 명의 슈퍼 에이전트를 어떻게 더 똑똑하게 만들까.” Claude Code, Cursor, Codex가 그 방향이었다. 그런데 4월에 Google이 오픈소스로 푼 Scion은 다른 질문을 던진다. “왜 한 명만 써야 하지?”

Scion은 Google Cloud Platform이 GitHub에 공개한 멀티 에이전트 테스트베드다. 핵심 개념은 단순하다. Claude Code, Gemini CLI, OpenAI Codex 같은 서로 다른 코딩 에이전트를 각자의 컨테이너에서 동시에 띄우고, 그 결과물을 위에서 조율하는 레이어를 제공한다. 일부 개발자가 “에이전트의 하이퍼바이저”라고 부르기 시작한 이유가 여기에 있다.

왜 굳이 여러 명을 쓰나

단일 에이전트의 한계는 두 가지다. 첫째, 한 명이 백엔드 API 수정 → 프론트엔드 컴포넌트 업데이트 → 테스트 코드 작성을 순차로 처리하면 시간이 그대로 누적된다. 둘째, 각 작업에 가장 잘 맞는 모델이 다르다. 코드 리뷰는 Claude Opus 4.6의 추론 깊이가 좋고, 단순 코드 생성은 GLM-5.1이 비용 대비 효율적이고, 테스트 작성은 Gemini Flash로도 충분하다. 한 모델이 모든 영역에서 최적인 경우는 거의 없다.

멀티 에이전트는 이 두 한계를 동시에 푼다. 작업을 나눠 병렬로 돌리고, 작업별로 최적 모델을 매칭한다. 시간도 비용도 줄어든다.

구조 — 컨테이너 단위 격리

Scion Orchestrator
├── Agent Container A (Claude Code)
│     └── 담당: 백엔드 API 설계 + 구현
├── Agent Container B (Gemini CLI)
│     └── 담당: 테스트 코드 + 문서화
└── Agent Container C (Codex)
      └── 담당: 프론트엔드 컴포넌트

각 컨테이너는 독립된 파일시스템과 환경변수를 갖는다. 같은 코드베이스를 동시에 수정하면서도 충돌이 안 나는 이유는 Scion이 내부적으로 git 브랜치 전략을 관리하기 때문이다. 작업이 끝나면 머지 충돌을 해결하고 통합한다.

실제 실행

설치는 GitHub 클론 + Docker Compose다.

git clone https://github.com/GoogleCloudPlatform/scion
cd scion
cp .env.example .env
# .env에 각 에이전트 API 키 설정
docker compose up

워크플로는 YAML로 선언한다. 어떤 에이전트가 무엇을 담당하고, 어떤 작업이 어떤 작업에 의존하는지 단순한 문법으로 적어 두면 된다.

workflow:
  - agent: claude-code
    task: "백엔드 /api/users 엔드포인트 구현"
    branch: feat/backend
  - agent: gemini-cli
    task: "위 엔드포인트 단위테스트 작성"
    depends_on: claude-code
    branch: feat/tests

아직 실험 단계라는 점

Google 스스로 “experimental”이라고 표시해 둔 프로젝트다. 에이전트 간 컨텍스트 공유는 아직 제한적이고, 대형 코드베이스에서는 머지 충돌 해결 품질이 들쑥날쑥하다. 프로덕션 도입보다는 실험과 학습 목적으로 보는 게 정확하다. 단, 멀티 에이전트 협업이 1~2년 안에 표준이 될 가능성이 높은 만큼, 지금 손에 익혀 두는 가치는 크다.

한국 개발자에게 의미

Scion 자체를 당장 회사 인프라에 올리기는 이르다. 하지만 이 방향성은 분명하다. 머지않아 여러 에이전트를 조율하는 오케스트레이션 레이어가 개발 워크플로의 기본 인프라가 된다. 지금 Scion을 손으로 굴려 보는 건 그 흐름을 미리 익히는 작업이다. 비교 학습 대상으로 Paperclip AI나 LangGraph 같은 다른 오케스트레이션 프레임워크를 같이 봐 두면 멀티 에이전트 아키텍처에 대한 감이 더 빠르게 잡힌다.

지금 할 일

가장 가벼운 시작은 GitHub에서 Scion 레포를 클론해 Docker Compose 데모를 한 번 띄워 보는 것이다. 처음부터 4개 에이전트를 동시에 굴리지 말고 Claude Code + Gemini CLI 두 명만으로 단순한 분리 작업(예: 백엔드 함수 + 그 함수의 단위 테스트)을 돌려 보면 멀티 에이전트의 감이 가장 빠르게 잡힌다. 그 다음 단계로 Paperclip이나 LangGraph 같은 대안과 어떤 차이가 있는지 비교해 두면 자기 워크플로에 맞는 도구를 고르는 기준이 생긴다.

관련 글

출처