이번 달 들어 내 노트북에서 일어난 일이 좀 이상하다. Cursor 3 창을 띄우고, 그 안에서 Claude Code 터미널을 열고, Claude Code 안에서 OpenAI Codex 플러그인이 코드 리뷰를 돌린다. 한 화면에 세 회사의 에이전트가 동시에 일하고 있다.
2026년 4월, 누가 의도한 적도 없는 새 AI 코딩 스택이 그냥 모양을 잡아 가고 있다. The New Stack이 4월 초 기사로 정리한 바로 그 흐름이다. 일주일 정도 본격적으로 써 보고, 무엇이 새롭고 무엇이 과대평가인지 정리한다.
한 줄 그림: 오케스트레이션 / 실행 / 리뷰
각 툴이 같은 일을 두고 싸우던 시대가 끝났다. 지금은 역할이 갈린다.
| 레이어 | 대표 도구 | 역할 |
|---|---|---|
| 오케스트레이션 | Cursor 3 (agent-first UI) | 여러 에이전트·여러 작업의 병렬 진행 관리 |
| 실행 (의사결정·구현) | Claude Code | 주력 코드 작성·리팩토링·테스트 |
| 리뷰·대조 | OpenAI Codex (Claude Code 플러그인으로) | 독립 코드 리뷰, 적대적 검증(Adversarial), 백그라운드 태스크 위임 |
이 그림에서 핵심 사건은 OpenAI가 자기 Codex CLI를 Anthropic Claude Code의 플러그인 형태로 출시한 것이다. 시장 1위가 Claude Code라는 걸 OpenAI가 인정한 셈이다. 사용자가 Codex로 옮겨오길 기다리는 대신, Codex를 사용자가 있는 곳으로 보냈다.
실제로 써 보면 — 워크플로우 한 사이클
내 평일 작업 패턴이 이렇게 바뀌었다.
- Cursor 3에서 작업 분할. “API 리팩토링”, “테스트 보강”, “마이그레이션 스크립트” 세 가지를 병렬 에이전트로 띄운다. 옛날엔 한 번에 하나만 돌렸는데, 이제 세 개가 동시에 돈다.
- 각 에이전트는 Claude Code로 실행. 코드 변경의 80%는 여기서 일어난다. Claude의 컨텍스트 처리가 가장 안정적이다.
- 변경이 끝나면 Codex 플러그인을 호출해서 리뷰. “이 PR을 적대적으로 검토해라”라고 시키면, 자기가 작성하지 않은 코드라 더 인색하게 본다. 사람 시니어 한 명을 옆에 앉힌 효과가 난다.
- 리뷰 결과를 다시 Claude Code가 반영. 한 사이클 끝.
가장 효과가 컸던 건 “같은 모델이 작성도 하고 리뷰도 하면 똑같은 사각지대를 본다”라는 오래된 문제를 해소한 점이다. Codex가 Claude의 코드를 보면, 둘이 학습 데이터·정렬 방식이 달라서 잡아내는 결함이 다르다. 일주일 사용 기준, Codex 리뷰가 Claude 자기 리뷰가 놓친 결함을 의미 있는 빈도로 잡아냈다.
과대평가된 부분 — 솔직히
마케팅 글에서 빠지는 얘기 셋.
① 비용이 합산된다. Cursor 구독 + Anthropic Max + OpenAI API. 한 명 개인 개발자 기준 월 $80~$200 사이에서 시작한다. 회사 카드면 모르겠지만, 사이드 프로젝트만 하는 사람에겐 빡빡하다.
② “병렬 에이전트”는 자유의 대가가 있다. 세 개를 동시에 돌리면 충돌이 난다. 같은 파일을 두 에이전트가 건드리는 일이 1주일에 두세 번 있었다. Cursor 3가 잠금·머지 UX를 더 다듬어야 한다.
③ 플러그인 호출은 아직 거칠다. Codex 플러그인이 가끔 응답을 길게 잡아먹는다. 빠른 리뷰를 원하면 별도 터미널에서 Codex CLI 직접 호출이 더 빠를 때가 있다.
그래서 — 한국 개발자에게 달라지는 것
“어느 툴 하나로 정착할까”라는 질문은 이제 틀렸다. 1년 전엔 그게 맞는 질문이었지만 2026년 4월의 답은 “세 툴을 역할로 나눠 쓰는 워크플로우를 본인이 정의해야 한다”이다. 회사·팀·개인 단위로 그 조합이 다르다.
지금 바로 할 수 있는 것
- Claude Code 사용자라면 OpenAI Codex 플러그인을 일주일 깔아 본다. “이 PR을 adversarial하게 리뷰해 줘” 한 줄만 시켜 봐도 효용이 보인다.
- Cursor 1.x 쓰던 사람이라면 Cursor 3의 병렬 에이전트 모드를 작은 작업 2개로 시범 운영해 본다. 처음부터 3개는 충돌만 늘어난다.
- 팀이라면 “어느 레이어를 표준화할지”부터 합의한다. 모두 자유롭게 골라 쓰면 PR 리뷰 품질이 들쑥날쑥해진다.
관련 글
- Cursor 3 출시 AI 에이전트 IDE 핵심 기능·요금제·경쟁 구도
- Claude Code 처음 시작하는 법 설치부터 실전까지 2026 완전 가이드
- Kiro vs Cursor vs Claude Code 2026 AI 코딩툴 3파전 비교

