Claude Code가 복잡한 작업에서 망가졌다: 2월 업데이트 이후 무슨 일이

“Claude Code is unusable for complex engineering tasks.” 4월 7일 HackerNews 1위에 오른 글의 제목이다. 701점. 단순한 불만 글이 아니라 데이터로 무장한 분석이었고, 그게 모두를 멈추게 한 이유다. 6,852개 Claude Code 세션 파일에서 17,871개 thinking 블록과 23만 4,760개 tool call을 뜯어본 결과를 GitHub에 공개했다. 이건 여론이 아니라 측정값이다.

2월 이후 Claude Code를 매일 쓰는 사람들이 느꼈던 막연한 위화감의 정체가 이번 분석으로 드러났다.

2월 12일에 무슨 일이 있었나

2026년 2월 12일, Anthropic은 Claude Code에 thinking redaction 업데이트를 조용히 배포했다. 모델이 답변하기 전에 내부적으로 “생각”하는 토큰들을 외부로 노출하지 않도록 가린 변경이다. 안전성·비용 절감·IP 보호 등 여러 이유가 추정되지만 공식 설명은 없었다. 문제는 이 변경이 복잡한 엔지니어링 작업의 결과물 품질에 직접적인 영향을 줬다는 점이다.

측정 데이터가 그리는 곡선

  • thinking redaction 비율이 1주일 만에 단계적으로 올라갔다: 1.5% → 25% → 58% → 100%
  • 품질 저하 보고가 가장 집중된 날짜는 3월 8일 — redacted thinking 블록이 50%를 넘긴 정확히 그 날
  • 같은 작업을 시키면서도 API 요청은 약 80배, 출력 토큰은 약 64배 증가했는데도 결과물 품질은 더 나빠짐
  • 모델 행동 패턴이 ‘research-first'(먼저 조사 후 수정)에서 ‘edit-first'(바로 수정)로 옮겨짐

마지막 항목이 가장 무거운 단서다. 이전 Claude Code는 코드베이스를 둘러본 다음 수정에 들어가는 패턴이 강했다. redaction 이후로는 그 단계가 옅어졌고, 곧바로 편집부터 시작하는 행동으로 바뀌었다. 복잡한 작업에서는 이 차이가 결과물 전체를 흔든다.

어떤 작업에서 가장 두드러지나

모든 작업이 망가진 건 아니다. 단순 코드 생성, 짧은 함수 수정, 한 파일 내 변경은 여전히 잘 돌아간다. 문제가 두드러지는 영역은 명확하다.

  • 여러 파일에 걸친 의존성 분석과 수정
  • 장시간 세션에서 컨텍스트를 끝까지 유지해야 하는 작업
  • 기존 코드베이스의 패턴과 컨벤션을 파악해 일관성 있게 수정
  • 복잡한 알고리즘 구현이나 성능 최적화

한마디로 시니어 개발자가 Claude Code를 쓰는 가장 큰 이유 — ‘맥락을 이해하고 일관성 있게 손보는’ 작업이 가장 큰 타격을 받았다. 단순 자동완성 수준 작업에는 영향이 적어서 일반 사용자 일부는 변화를 체감하지 못했을 수도 있다.

Anthropic의 반응

GitHub 이슈에 Anthropic 직원이 등장해 “피드백을 모니터링 중”이라고 답했지만, 공식 입장이나 롤백 계획은 발표되지 않았다. 일부 사용자는 thinking redaction이 API 비용 절감 목적이라고 추정한다. 사실 여부는 알 수 없지만, redaction이 실제로 모델 동작에 영향을 줬다는 측정값이 공개된 이상 어떤 형태로든 대응이 나올 가능성이 높다.

지금 할 수 있는 우회법

Anthropic의 후속 조치를 기다리는 동안 작업 방식 자체로 일정 수준의 손실을 막을 수 있다. 첫째, 긴 세션을 짧게 쪼갠다. 한 번에 큰 작업을 시키지 말고 단계로 분리한다. 둘째, CLAUDE.md를 적극적으로 활용한다. 프로젝트 구조, 컨벤션, 자주 쓰는 패턴을 파일로 명시해 매 세션 시작 시 모델이 동일한 컨텍스트로 출발하게 만든다. 셋째, 컨텍스트가 부풀기 전에 /compact를 적극적으로 쓴다. 넷째, 복잡한 작업을 한 줄로 던지지 말고 단계별 지시로 나눈다.

이 네 가지를 적용하면 redaction 영향을 완전히 없애지는 못해도 체감 품질을 유지할 수 있다.

망한 건 아니다, 다만 패턴이 바뀌었다

Claude Code가 통째로 망했다는 결론은 과장이다. 단순·중간 복잡도 작업에서는 여전히 가장 강력한 코딩 에이전트 중 하나다. 다만 대규모 엔지니어링 작업에서는 한계가 분명히 생겼고, 그에 맞춰 작업 방식을 조정해야 하는 시점이다. Anthropic이 이 문제를 인식하고 있는 만큼 조만간 개선이 나올 가능성이 높지만, 그때까지는 운영 관점에서 우회 전략이 필요하다.

지금 할 일

복잡한 작업을 자주 시키는 사람이라면 가장 먼저 CLAUDE.md를 정리한다. 프로젝트 구조와 컨벤션을 한 화면에 담고, 자주 쓰는 패턴 예시를 같이 적어 둔다. 이게 가장 큰 차이를 만든다. 다음으로 세션을 길게 끌지 말고 중간중간 /compact를 누르는 습관을 만들자. 마지막으로 GitHub Issues #42796를 즐겨찾기에 두고 Anthropic의 후속 코멘트를 모니터링하면 롤백이나 개선 시점을 가장 빨리 알 수 있다.

관련 글

출처

대표이미지 출처: Anthropic 공식 블로그