[태그:] codex

  • Cursor 3 + Claude Code + OpenAI Codex가 한 스택으로 합쳐졌다 — 일주일 사용기와 솔직한 한계

    Cursor 3 + Claude Code + OpenAI Codex가 한 스택으로 합쳐졌다 — 일주일 사용기와 솔직한 한계

    이번 달 들어 내 노트북에서 일어난 일이 좀 이상하다. Cursor 3 창을 띄우고, 그 안에서 Claude Code 터미널을 열고, Claude Code 안에서 OpenAI Codex 플러그인이 코드 리뷰를 돌린다. 한 화면에 세 회사의 에이전트가 동시에 일하고 있다.

    2026년 4월, 누가 의도한 적도 없는 새 AI 코딩 스택이 그냥 모양을 잡아 가고 있다. The New Stack이 4월 초 기사로 정리한 바로 그 흐름이다. 일주일 정도 본격적으로 써 보고, 무엇이 새롭고 무엇이 과대평가인지 정리한다.

    한 줄 그림: 오케스트레이션 / 실행 / 리뷰

    각 툴이 같은 일을 두고 싸우던 시대가 끝났다. 지금은 역할이 갈린다.

    레이어 대표 도구 역할
    오케스트레이션 Cursor 3 (agent-first UI) 여러 에이전트·여러 작업의 병렬 진행 관리
    실행 (의사결정·구현) Claude Code 주력 코드 작성·리팩토링·테스트
    리뷰·대조 OpenAI Codex (Claude Code 플러그인으로) 독립 코드 리뷰, 적대적 검증(Adversarial), 백그라운드 태스크 위임

    이 그림에서 핵심 사건은 OpenAI가 자기 Codex CLI를 Anthropic Claude Code의 플러그인 형태로 출시한 것이다. 시장 1위가 Claude Code라는 걸 OpenAI가 인정한 셈이다. 사용자가 Codex로 옮겨오길 기다리는 대신, Codex를 사용자가 있는 곳으로 보냈다.

    실제로 써 보면 — 워크플로우 한 사이클

    내 평일 작업 패턴이 이렇게 바뀌었다.

    1. Cursor 3에서 작업 분할. “API 리팩토링”, “테스트 보강”, “마이그레이션 스크립트” 세 가지를 병렬 에이전트로 띄운다. 옛날엔 한 번에 하나만 돌렸는데, 이제 세 개가 동시에 돈다.
    2. 각 에이전트는 Claude Code로 실행. 코드 변경의 80%는 여기서 일어난다. Claude의 컨텍스트 처리가 가장 안정적이다.
    3. 변경이 끝나면 Codex 플러그인을 호출해서 리뷰. “이 PR을 적대적으로 검토해라”라고 시키면, 자기가 작성하지 않은 코드라 더 인색하게 본다. 사람 시니어 한 명을 옆에 앉힌 효과가 난다.
    4. 리뷰 결과를 다시 Claude Code가 반영. 한 사이클 끝.

    가장 효과가 컸던 건 “같은 모델이 작성도 하고 리뷰도 하면 똑같은 사각지대를 본다”라는 오래된 문제를 해소한 점이다. Codex가 Claude의 코드를 보면, 둘이 학습 데이터·정렬 방식이 달라서 잡아내는 결함이 다르다. 일주일 사용 기준, Codex 리뷰가 Claude 자기 리뷰가 놓친 결함을 의미 있는 빈도로 잡아냈다.

    과대평가된 부분 — 솔직히

    마케팅 글에서 빠지는 얘기 셋.

    ① 비용이 합산된다. Cursor 구독 + Anthropic Max + OpenAI API. 한 명 개인 개발자 기준 월 $80~$200 사이에서 시작한다. 회사 카드면 모르겠지만, 사이드 프로젝트만 하는 사람에겐 빡빡하다.

    ② “병렬 에이전트”는 자유의 대가가 있다. 세 개를 동시에 돌리면 충돌이 난다. 같은 파일을 두 에이전트가 건드리는 일이 1주일에 두세 번 있었다. Cursor 3가 잠금·머지 UX를 더 다듬어야 한다.

    ③ 플러그인 호출은 아직 거칠다. Codex 플러그인이 가끔 응답을 길게 잡아먹는다. 빠른 리뷰를 원하면 별도 터미널에서 Codex CLI 직접 호출이 더 빠를 때가 있다.

    그래서 — 한국 개발자에게 달라지는 것

    “어느 툴 하나로 정착할까”라는 질문은 이제 틀렸다. 1년 전엔 그게 맞는 질문이었지만 2026년 4월의 답은 “세 툴을 역할로 나눠 쓰는 워크플로우를 본인이 정의해야 한다”이다. 회사·팀·개인 단위로 그 조합이 다르다.

    지금 바로 할 수 있는 것

    1. Claude Code 사용자라면 OpenAI Codex 플러그인을 일주일 깔아 본다. “이 PR을 adversarial하게 리뷰해 줘” 한 줄만 시켜 봐도 효용이 보인다.
    2. Cursor 1.x 쓰던 사람이라면 Cursor 3의 병렬 에이전트 모드를 작은 작업 2개로 시범 운영해 본다. 처음부터 3개는 충돌만 늘어난다.
    3. 팀이라면 “어느 레이어를 표준화할지”부터 합의한다. 모두 자유롭게 골라 쓰면 PR 리뷰 품질이 들쑥날쑥해진다.

    관련 글

    출처

  • OpenAI, ChatGPT·Codex·브라우저를 하나로 합친다: 슈퍼앱 전략의 의미

    OpenAI가 앱을 너무 많이 만들었다

    2026년 3월 19일, 월스트리트저널이 OpenAI 내부 메모를 입수해 보도했다. 메모 작성자는 Fidji Simo, OpenAI 애플리케이션 부문 CEO. 내용은 직설적이다. “우리는 너무 많은 앱과 스택에 노력을 분산시켰고, 단순화해야 한다.”

    그 결과가 OpenAI 슈퍼앱이다. ChatGPT 채팅, Codex 코딩 에이전트, Atlas AI 브라우저—세 개의 분리된 앱을 하나의 데스크탑 앱으로 통합하는 프로젝트다. 정식 출시 일정은 미공개지만, 내부 소식통은 “수개월 내”로 예측하고 있다.

    세 앱이 합쳐지면 무엇이 달라지는가

    단순한 UI 통합이 아니다. 각 컴포넌트의 역할이 재정의된다.

    ChatGPT는 오케스트레이션 레이어가 된다. 사용자가 자연어로 지시하면 ChatGPT가 Codex에 코드 작성을 맡기고, Atlas에 웹 탐색을 지시하고, 결과를 종합한다. 기존 ChatGPT의 메모리 시스템—세션을 넘나드는 컨텍스트 유지—이 슈퍼앱 전체에 적용된다.

    Codex는 코딩 에이전트에서 범용 생산성 에이전트로 확장된다. 슈퍼앱 맥락에서 Codex는 소프트웨어 개발뿐 아니라 데이터 분석, 문서 자동화, 반복 업무 처리를 담당하는 실행 레이어가 된다.

    Atlas 브라우저는 AI의 눈과 손이다. 사용자가 “경쟁사 가격 조사해줘”라고 하면 Atlas가 실제 웹을 탐색하고, 데이터를 수집해 ChatGPT로 전달한다. 사용자가 직접 브라우저를 열 필요가 없다.

    왜 지금인가: Anthropic과의 정면 승부

    OpenAI의 슈퍼앱 발표 타이밍은 우연이 아니다. Anthropic은 2026년 1월 Cowork—비개발자용 GUI 에이전트—를 리서치 프리뷰로 출시했고, 3월에는 Claude Computer Use Agent를 공개했다. 한 앱 안에서 파일을 열고, 클릭하고, 워크플로를 자동 완수하는 기능이다.

    OpenAI 입장에서 ChatGPT, Codex, Atlas가 따로따로 운영되는 건 경쟁 열위다. Anthropic의 통합된 에이전트 경험에 대응하려면 OpenAI도 단일 인터페이스를 내놔야 한다. Simo의 메모는 그 위기의식의 표출이다.

    모바일 ChatGPT 앱은 변경되지 않는다. 슈퍼앱은 데스크탑 전략이다—그 자체로 의미 있는 선택이다. 복잡한 에이전트 작업은 모바일보다 데스크탑에서 이뤄진다.

    한국 개발자·직장인에게 의미하는 것

    슈퍼앱이 나오면 ChatGPT 사용 패턴이 근본적으로 바뀐다. 지금은 “ChatGPT에게 물어보고, 코드는 Cursor로, 검색은 따로”라는 분산 워크플로가 일반적이다. 슈퍼앱은 이 과정을 단일 인터페이스 안으로 끌어당긴다.

    개발자라면 Codex 에이전트가 Atlas 브라우저와 결합됐을 때의 가능성을 상상해볼 만하다. “이 GitHub 이슈를 분석하고, 관련 스택오버플로우 솔루션을 찾아서, PR 초안을 만들어줘”—이런 멀티스텝 작업이 단일 명령으로 처리된다.

    직장인이라면 Atlas의 웹 자동화와 ChatGPT의 문서 처리가 결합된 시나리오가 현실적이다. 경쟁사 동향 모니터링, 뉴스 수집 후 요약 보고서 자동 생성 같은 반복 작업이 타깃이다.

    다만 아직은 ‘계획 단계’다. 출시 전까지는 Anthropic Cowork(현재 사용 가능)가 유일한 통합 에이전트 데스크탑 앱이다.

    지금 바로 할 수 있는 것

    • ChatGPT Pro 사용자: 슈퍼앱 출시 전까지 Codex와 ChatGPT를 병행 사용하는 워크플로 정리. 어떤 작업을 어느 앱에서 처리하는지 기록해두면 슈퍼앱 전환 시 체계적으로 이전 가능.
    • Anthropic Cowork 비교 체험: Claude.ai Pro/Max 구독 후 Cowork 리서치 프리뷰 신청. 슈퍼앱 나오기 전 Cowork로 에이전트 데스크탑 경험을 먼저 확인.
    • Atlas 브라우저 현황 확인: 현재 Atlas는 일부 ChatGPT 구독자에게 제한 공개 중. 슈퍼앱 통합 전 Atlas 단독 기능을 먼저 테스트해볼 수 있다.

    관련 글


    출처

  • OpenAI Codex, 드디어 Windows 상륙 — AI 코딩 에이전트가 일상이 된다

    오늘의 핵심 한 줄: Mac 전용이었던 OpenAI Codex 앱이 Windows에 출시되며, AI 코딩 에이전트가 전체 개발자 시장으로 확장됐다.


    무슨 일인가

    2026년 3월 4일, OpenAI가 Codex 앱 Windows 버전을 정식 출시했다. Mac 버전 출시 직후부터 50만 명 이상의 개발자가 대기 중이었고, Windows 출시 시점 기준 주간 활성 사용자는 이미 160만 명을 넘어섰다.

    Windows 버전은 단순 포팅이 아니다. Windows 개발 환경을 위해 처음부터 새로 설계됐다. 네이티브 샌드박스, PowerShell 지원, 병렬 에이전트 실행, 태스크별 워크트리와 diff 리뷰 기능을 갖췄다. Visual Studio, Rider, PhpStorm, Git Bash, GitHub Desktop, WSL, Sublime Text 등 주요 IDE와 통합도 지원된다.

    세션 기록은 OpenAI 계정에 저장되어 Mac에서 시작한 작업을 Windows에서 이어받을 수 있다. ChatGPT Free, Go, Plus, Pro 플랜 모두 사용 가능하며, Windows 10 버전 19041.0 이상에서 Microsoft Store를 통해 설치된다.


    왜 중요한가

    숫자가 말해준다. Stack Overflow 2025년 조사에 따르면 개발자의 약 50%가 업무용으로, 55% 이상이 개인 용도로 Windows를 사용한다. Mac에서만 돌아가는 AI 코딩 에이전트는 절반의 개발자에게 닿지 못했다. Windows 출시는 Codex의 실질적인 시장 확장이다.

    기술적으로도 의미가 있다. OpenAI는 Windows용 네이티브 에이전트 샌드박스를 처음부터 새로 구축했다. OS 수준의 제어, 파일시스템 ACL, 전용 샌드박스 사용자 구조를 적용해 WSL이나 가상머신 없이도 안전하게 동작한다. 이 샌드박스 구현체는 오픈소스로 공개돼 다른 AI 툴들도 참고할 수 있게 됐다.


    실무자 관점 코멘트

    나는 지금 Claude Code를 주력으로 쓰고 있다. 터미널 기반 워크플로에 잘 맞고, 코드베이스 전체를 컨텍스트로 잡는 방식이 실제 업무에서 체감 차이가 크다.

    Codex Windows 출시를 반기는 이유는 경쟁 심화 때문이다. 요즘 AI 코딩 툴이 쏟아지고 있지만, 솔직히 아직 해결 안 된 문제가 있다. AI가 내 컴퓨터나 브라우저에 직접 접근해서 실제로 일을 처리하는 것, 즉 진짜 의미의 에이전트 동작이 아직 매끄럽지 않다. 문제는 기술만이 아니다. AI에게 무언가를 시키는 입력 자체가 아직 불편하다. 장치 수준에서도, UX/UI 수준에서도 아직 갈 길이 멀다.

    경쟁이 심화되면 이 부분이 빠르게 개선될 것이라고 본다. Codex가 Windows 시장으로 확장하고, Claude Code, Copilot Workspace가 맞불을 놓는 구도가 되면 결국 수혜는 개발자에게 돌아온다. 툴이 많아지는 것보다, 툴을 쓰는 경험 자체가 나아지는 것이 지금 이 시장에서 진짜 필요한 발전이다.

    ( 뉴럴링크, 메타 글래스, 애플 글래스 와 같은 input장치가 필요하고 작고 가볍고 편리해 지면 좋겠다는 생각.)


    관련 맥락

    현재 Codex의 기본 모델은 GPT-5.3-Codex다. GPT-5.2-Codex 대비 25% 빠르고, 코딩 성능과 추론 능력을 동시에 끌어올린 모델로 SWE-Bench Pro와 Terminal-Bench 2.0에서 최고 성능을 기록했다.

    Skills 기능도 주목할 만하다. 명령어, 리소스, 스크립트를 묶어 Codex가 팀의 워크플로에 맞게 도구를 재사용할 수 있게 한다. Figma 디자인을 프로덕션 UI 코드로 변환하거나, Linear에서 버그를 트리아지하거나, Cloudflare·Vercel 등에 직접 배포하는 스킬이 기본 제공된다.


    앞으로 어떻게 될까

    OpenAI는 Codex를 현재의 개발자 도구를 넘어 비기술 직군까지 확장하는 엔터프라이즈 표준 에이전트로 만들겠다는 방향을 밝혔다. AI 코딩 에이전트가 개발자 전용 툴에서 업무 자동화 플랫폼으로 진화하는 그림이다.

    경쟁 구도도 빠르게 재편되고 있다. Claude Code, GitHub Copilot Workspace 등 주요 플레이어들이 모두 에이전트 방향으로 이동 중이다. Codex의 Windows 상륙은 이 경쟁의 무대를 전체 개발자 시장으로 넓혔다는 점에서 분기점이 될 수 있다.

    여러분은 현재 어떤 AI 코딩 툴을 주로 사용하고 계신가요?


    참고 출처