[태그:] AI모델비교

  • Claude Mythos 유출, DeepSeek V4 출시: 2026년 AI 모델 대전의 현재

    앤트로픽이 실수로 다음 모델을 공개했다

    2026년 3월 말, 보안 연구자가 앤트로픽 CMS의 잘못 설정된 스토리지에서 약 3,000개의 내부 파일에 인증 없이 접근할 수 있다는 걸 발견했다. 그 안에 있었던 것—Claude Mythos, 내부 코드명 Capybara의 사양 문서.

    유출된 내용은 명확하다. Mythos는 “Opus 모델보다 크고 더 지능적인 새로운 계층”이다. 코딩·학술 추론·사이버보안 벤치마크에서 Claude Opus 4.6보다 “극적으로 높은 점수”를 기록했다. 앤트로픽은 이것이 “우리 모델 역사에서 가장 큰 능력 도약”이라는 표현을 내부 문서에 썼다.

    하지만 아직 일반 출시는 없다. 이유도 유출됐다. “서비스 비용이 매우 높고, 일반 출시 전 효율성을 대폭 개선해야 한다.”

    Mythos가 어느 정도인가

    벤치마크 수치는 일부만 공개됐다. 유출 문서에 따르면 Mythos는 현재 공개된 모든 모델을 앞서며, 특히 사이버보안 취약점 분석과 멀티스텝 코딩 작업에서 격차가 크다. 앤트로픽은 내부적으로 이 모델이 “전례 없는 사이버보안 리스크”를 동반할 수 있다고 경고했다—아이러니하게도 그 경고 문서 자체가 유출됐다.

    현재 Mythos는 소수의 선별된 고객과 얼리 액세스 테스트 중이다. API 기준 가격은 미공개지만, 유출 문서의 “매우 비쌀 것”이라는 표현으로 보아 Opus 4.6($5/$25 per M tokens)보다 상당히 높을 것으로 예상된다.

    같은 시기에 나온 DeepSeek V4

    Claude Mythos가 예고편이라면, 2026년 3월 3일 이미 출시된 DeepSeek V4는 현재 진행형이다. V4는 새로운 MODEL1 아키텍처—계층형 KV 캐시 시스템—를 도입해 메모리 사용량 40% 감소, 추론 속도 1.8배 향상을 달성했다. Sparse FP8 디코딩 방식으로 비용 효율성을 크게 개선했다.

    DeepSeek의 패턴은 일관적이다. 중국 AI 연구소가 오픈소스로 공개하고, 성능은 최상위권 클로즈드 모델과 경쟁하면서, 가격은 그 수분의 일이다. V4는 AI 코딩 벤치마크에서 Claude Opus 4.6, GPT-5.4와 경쟁하는 수준으로 평가된다.

    GPT-5.5는 언제 오는가

    OpenAI는 3월 5일 GPT-5.4 “Thinking”을 출시한 직후다. 내부 소식통 기준으로 GPT-5.5는 4월 출시 후보로 거론되고 있지만, 공식 확인은 없다. OpenAI의 최근 패턴—GPT-5.2에서 5.4까지 약 6주 간격—을 보면 5.5는 4월 중하순이 가능한 시점이다.

    한 가지 주목할 변수는 OpenAI 슈퍼앱이다. ChatGPT·Codex·Atlas를 통합하는 슈퍼앱 출시와 GPT-5.5 공개를 묶어 발표할 가능성이 있다. 제품 통합과 모델 업그레이드를 동시에 선보이는 것이 마케팅 임팩트를 극대화하기 때문이다.

    지금 어떤 모델을 써야 하나

    모델 전쟁이 가속되는 시기에 가장 흔한 실수는 ‘다음 모델을 기다리다 아무것도 안 하는 것’이다. 현실적인 판단 기준을 제시한다.

    지금 당장 최고 성능이 필요한 작업이라면 Claude Opus 4.6이다. 코딩·에이전트·추론에서 현재 가장 높은 성능을 기록하고 있으며, API로 바로 사용 가능하다.

    비용 효율이 우선이라면 DeepSeek V4다. 오픈소스로 자체 호스팅이 가능하고, API 비용도 클로즈드 모델 대비 낮다. 코딩 보조, 문서 분석 같은 반복 작업에 실용적이다.

    Claude Mythos는 기다려야 한다. 효율성 개선이 완료될 때까지 일반 출시 계획이 없다. 2026년 하반기 출시 가능성이 높다는 것이 업계의 공통된 전망이다.

    지금 바로 할 수 있는 것

    • Claude Opus 4.6 API 테스트: claude-opus-4-6로 Adaptive Thinking 모드(thinking: {type: "adaptive"}) 활성화. 복잡한 추론 작업에서 비용 대비 성능을 먼저 검증.
    • DeepSeek V4 벤치마킹: 자체 업무에 DeepSeek V4를 적용해 Claude/GPT와 직접 비교. 같은 프롬프트로 세 모델 결과를 나란히 놓고 판단하는 것이 가장 빠른 선택 기준이 된다.
    • Claude Mythos 얼리 액세스 신청: Anthropic 공식 웹사이트에서 엔터프라이즈 얼리 액세스 신청 가능. 우선순위 접근을 원한다면 지금 등록.

    관련 글


    출처

  • GPT-5.4 완전 분석: ChatGPT 요금제별로 뭐가 달라지나

    GPT-5.4 완전 분석: ChatGPT 요금제별로 뭐가 달라지나

    ChatGPT를 열었더니 모델 목록이 또 바뀌어 있다. GPT-5.4 Thinking, GPT-5.4 Pro, GPT-5.4 mini… “이게 다 뭔데, 내가 쓰던 건 어디 갔지?” 2026년 3월 5일 OpenAI가 공개한 GPT-5.4는 단순한 버전 업이 아니다. GPT-5.3-Codex의 코딩 역량을 통합하고 추론·멀티태스크를 하나로 합친 새로운 주력 모델이다. 요금제마다 쓸 수 있는 모델이 다르기 때문에, 내 플랜에서 뭐가 달라지는지 정확히 이해해야 한다.

    GPT-5.3 vs GPT-5.4: 무엇이 달라졌나

    GPT-5.4의 가장 큰 변화는 코딩 전문 모델(GPT-5.3-Codex)의 역량을 메인라인으로 흡수했다는 점이다. 기존에는 추론이 필요한 작업과 코딩 작업에 모델을 따로 골라야 했지만, GPT-5.4부터는 하나로 처리된다.

    항목 GPT-5.3-Codex GPT-5.4
    출시일 2026년 2월 5일 2026년 3월 5일
    OSWorld 벤치마크 64% 75% (인간 기준선 72.4% 초과)
    컨텍스트 윈도우 100만 토큰
    사실 오류 기준 33% 감소
    특화 분야 코딩 전문 코딩 + 추론 + 멀티태스크

    추론 강도를 5단계(none·low·medium·high·xhigh)로 직접 설정할 수 있는 것도 새로운 기능이다. 간단한 질문은 빠르게, 복잡한 분석은 깊게 — 작업에 따라 골라 쓸 수 있다.

    출처: Introducing GPT-5.4 | OpenAI

    실제로 써보니: 코딩·문서·추론 체감 차이

    코딩에서는 GPT-5.3-Codex 수준의 정확도를 유지하면서 맥락 이해가 개선됐다. 여러 파일에 걸친 리팩토링 요청에서 일관성이 눈에 띄게 향상됐다는 평가가 많다. 특히 Computer Use API가 추가되어 GPT-5.4가 화면을 인식하고 앱을 직접 조작하는 에이전트 작업이 가능해졌다.

    문서·리서치에서는 100만 토큰 컨텍스트 덕분에 긴 보고서나 계약서 전체를 한 번에 분석할 수 있다. 사실 오류 33% 감소는 정보 검증 작업에서 체감 차이가 크다.

    추론에서는 국내 수능 테스트에서 Gemini 3.1 Pro에 이어 사실상 만점을 기록했다. 복잡한 다단계 논리 문제에서 중간에 방향을 잃는 경우가 줄었다는 피드백이 많다.

    출처: GPT-5.4 출시일, 기능 및 가격 | NxCode

    요금제별 접근 가능 모델

    내 플랜에서 GPT-5.4를 쓸 수 있는지 확인하자. 모델에 따라 접근 권한이 다르고, 한도도 제각각이다.

    요금제 월 요금 사용 가능 모델
    Free 무료 GPT-5.3 (5시간당 10회 제한)
    Go GPT-5.3, GPT-5.4 mini
    Plus $20 GPT-5.3 Instant + GPT-5.4 Thinking (주 3,000회)
    Pro $200 GPT-5.4 Thinking + GPT-5.4 Pro 무제한
    Business/Enterprise 별도 GPT-5.4 Pro 포함 전체 접근

    주의할 점이 있다. GPT-5.2 Thinking은 2026년 6월 5일부로 서비스 종료된다. Plus 이상 구독자라면 지금 모델 선택기에서 GPT-5.4 Thinking으로 바꾸는 것이 좋다.

    출처: GPT-5.3 and GPT-5.4 in ChatGPT | OpenAI Help Center

    So What: 지금 ChatGPT 구독자는 어떻게 해야 하나

    무료 사용자라면 당장 변화는 없다. GPT-5.3이 기본이고, GPT-5.4는 접근 불가다. 코딩·추론이 필요한 작업이 많다면 Plus 전환을 검토할 시점이다.

    Plus 구독자($20/월)라면 지금 당장 모델 선택기에서 GPT-5.4 Thinking으로 바꾸자. 주 3,000회 한도가 있지만, 일반 업무 용도라면 충분하다. 단순 대화는 GPT-5.3 Instant를 쓰고, 복잡한 분석은 GPT-5.4 Thinking을 쓰는 방식으로 한도를 아끼면 된다.

    Pro 구독자($200/월)라면 GPT-5.4 Pro까지 무제한으로 사용 가능하다. 장시간 에이전트 작업이나 대용량 문서 분석에 적합하다.

    지금 바로 할 수 있는 것

    1. 모델 선택기 확인 — ChatGPT 접속 후 입력창 위 모델명 클릭 → GPT-5.4 Thinking 선택 가능 여부 확인 (Plus 이상 필요)
    2. GPT-5.2 Thinking 대체 준비 — 2026년 6월 5일 종료 예정. 지금 GPT-5.4 Thinking으로 전환해 차이를 미리 체감해두자
    3. 무료 사용자는 Perplexity 병행 활용perplexity.ai 무료 플랜에서 최신 정보 검색 + 요약을 보완적으로 활용하면 GPT-5.4 없이도 상당 부분 커버 가능