[카테고리:] 비즈니스

  • Anthropic Managed Agents 발표 직후 SaaS 주가 폭락 — “소프트웨어는 이제 투자 불가인가” 논쟁 완전 정리

    Anthropic Managed Agents 발표 직후 SaaS 주가 폭락 — “소프트웨어는 이제 투자 불가인가” 논쟁 완전 정리

    4월 11일 미국 증시에서 이상한 장면이 연출됐다. Akamai가 16.6%, Cloudflare가 13.5%, DigitalOcean이 13.4% 빠졌다. 실적 악재가 나온 것도, 규제 이슈가 터진 것도 아니었다. 방아쇠는 사흘 전 Anthropic이 공개한 Claude Managed Agents였다.

    왜 이 회사들이 맞았나

    Managed Agents가 판매하는 건 에이전트 “실행 환경”이다. 샌드박스 코드 실행, 호스팅, 네트워크, 크리덴셜 관리까지. 공교롭게도 이 목록은 Cloudflare Workers, Akamai 엣지, DigitalOcean 드로플릿이 각자 팔던 품목을 합쳐 놓은 것과 겹친다.

    투자자 입장에서 계산은 단순했다. “AI 에이전트가 앱의 실행자로 자리 잡으면, 개발자가 별도로 CDN·엣지·서버리스를 계약할 이유가 줄어든다.” 24/7 Wall St.는 이를 두고 “소프트웨어 산업을 투자 불가 영역으로 보내는 방아쇠”라고 표현했다. 과장된 헤드라인이지만, 숫자만 보면 엄살은 아니다.

    이번이 처음이 아니다 — “SaaS-pocalypse”의 재현

    2월에도 같은 일이 있었다. Claude Cowork 플러그인 발표 당일, 소프트웨어 섹터 시가총액이 하루 만에 약 3,000억 달러 증발했다. 트레이더들이 이걸 “SaaS-pocalypse”라고 부르기 시작했고, 4월 8일 Managed Agents 발표는 그 두 번째 파고였다.

    다만 동일한 리포트에서 Cloudflare는 여전히 2026년 매출 가이던스를 28~29% 성장으로 유지했고, DigitalOcean은 오히려 21%로 상향했다. 실제 사업이 무너진 것이 아니라, 미래 할인율 가정이 한번에 깎이는 중이라고 보는 편이 정확하다.

    무엇이 진짜로 바뀌고 있는가

    핵심은 “좌석당 SaaS”라는 수익 모델 자체다. 사람이 로그인해서 쓰는 구독이 지난 15년 소프트웨어 성장의 엔진이었다면, 에이전트가 대신 쓰는 시대엔 “세션 시간당” 과금이 위로 올라온다. 이 축이 돌아가기 시작하면 CDN·엣지뿐 아니라 세일즈포스급 앱 벤더들도 재평가 대상이 된다.

    CNBC는 이번 사태를 “AI 위협이 소프트웨어 주식을 끝도 없이 채찍질하는 현재진행형”이라고 썼다. 키워드는 현재진행형이다.

    So What?! — 한국 시장 관점

    세 가지 짚을 지점.

    • 국내 SaaS 사업자 — “좌석당 월 요금” 외에 “에이전트 실행 시간 기반 요금”을 병행할 시뮬레이션이 필요하다. Notion·Asana가 먼저 바꾸면 벤치마크가 그쪽으로 기운다.
    • 국내 클라우드·CDN(네이버클라우드, NHN Cloud, 토스페이먼츠 등) — Managed Agents 같은 “번들 에이전트 런타임”을 한국어·리전·컴플라이언스로 방어할 포지션을 지금 잡는 게 맞다. 발표 후 따라가면 늦는다.
    • 기술리더·CTO — 내부 도구 스택을 보면서 “이걸 Managed Agents 한 통으로 대체 가능한가”를 분기마다 체크하는 습관이 필요하다. 매 분기 답이 달라진다.

    지금 바로 할 수 있는 것

    1. 포트폴리오 점검 — 보유한 SaaS 계정(모니터링, 협업, CI/CD 등)을 리스트업하고, 각 계정이 “사용자 수” 기준으로 과금되는지 “실행량” 기준인지 구분해 본다. 전자 비중이 높을수록 향후 단가 압박이 크다.
    2. Managed Agents 베타 체험 — 팀에서 반복 작업 하나를 골라 직접 돌려 보고, 지금 쓰는 SaaS 대비 기능·비용을 비교 노트로 남긴다. 숫자가 있어야 회의에서 밀린다.
    3. 시세는 천천히 — SaaS 섹터 전체 매도로 접근하기보다, “실행 레이어로 전환 가능한가” 여부로 종목을 나눠 보는 편이 실익이 크다. 단순 패닉 매도는 2월 반등에서 이미 학습된 결과가 나왔다.

    관련 글

    출처

    대표이미지 출처: 24/7 Wall St.

  • AI 툴 4개부터 생산성이 떨어진다 — 집중 효율 60%, 3년 최저치의 진짜 원인

    AI 툴 4개부터 생산성이 떨어진다 — 집중 효율 60%, 3년 최저치의 진짜 원인

    “AI 툴을 많이 쓸수록 생산성이 오른다”는 가설이 흔들리는 리포트가 이번 주 나왔다. ActivTrak의 2026 State of the Workplace를 Asanify가 정리한 결과인데, 한 줄 요약하자면 이렇다. AI 툴 3개까지는 효율이 오르고, 4개부터 떨어진다.

    숫자가 말하는 것

    조사에서 가장 눈에 띄는 수치는 집중 효율(focus efficiency) 60%다. 일하는 시간 중 방해 없이 몰입한 시간 비중인데, 3년 만의 최저다. 2023년만 해도 이 지표는 70%대 후반이었다.

    • AI 툴을 3개 이하 쓰는 직원: 효율이 향상됐다고 자체 보고
    • 4개 이상 쓰는 직원: 효율이 오히려 하락
    • 동시 기간 이메일 처리 시간은 2배 증가, 몰입 작업 세션은 9% 감소 (Fortune 보도)

    HBR이 같은 주 “AI는 일을 줄이지 않는다, 더 빡세게 만든다”는 제목의 글을 실은 것도 우연이 아니다. 툴이 늘면 컨텍스트 전환 비용이 동시에 늘고, 회의는 2024년 대비 2배가 됐다.

    왜 3개를 넘으면 떨어지는가

    직관적으로는 “더 많은 툴 = 더 많은 자동화 = 더 많은 산출”이어야 맞다. 현실은 정반대다. 원인을 정리하면 이렇다.

    첫째, 툴마다 입력 방식이 다르다. Slack 스레드에서 Notion AI로, 다시 Claude로, 다시 Copilot으로 옮겨 다니면서 같은 맥락을 세 번 네 번 다시 설명하게 된다. 실제 작업보다 AI에 일 시키는 일이 더 오래 걸리는 순간이 온다.

    둘째, “혹시 더 좋은 답이 있을까?”라는 비교 강박이 붙는다. ChatGPT에 물어보고, 또 Gemini에 물어보고, Claude에도 돌려본다. 답을 고르는 과정 자체가 집중을 깎는다.

    셋째, 알림이다. AI 툴들은 대부분 자기 결과를 “당신에게 보여주고 싶어 한다.” 푸시·배지·대시보드가 포커스 타임을 조각낸다.

    그럼 몇 개가 적정인가

    리포트의 경험칙은 “가급적 3개 이하”다. 역할별로 나눠보면 대략 이렇게 읽힌다.

    • 지식 노동자 일반: 대화형 1개(ChatGPT 또는 Claude) + 문서 1개(Notion AI 또는 Google Gemini in Workspace) + 선택적 전문 툴 1개
    • 개발자: 코딩 에이전트 1개(Cursor 또는 Claude Code) + 대화형 1개 + 문서·검색 1개
    • PM·기획: 대화형 1개 + 회의 기록 1개(Granola 등) + 조사/리서치 1개(Perplexity 등)

    핵심은 “한 툴이 한 업무를 끝까지 책임지게” 구도를 잡는 것이다. 같은 업무를 여러 툴로 돌려 보는 습관이 가장 비싼 비용을 만든다.

    So What?!

    한국 직장인에게 이 리포트가 주는 메시지는 명확하다. “도입한 AI 툴 개수”가 KPI가 되면 안 된다. 회사가 MS Copilot·ChatGPT Enterprise·Notion AI·Claude까지 네 개 구독을 다 사주는 곳이라면, 오히려 개인 차원에서 셋으로 줄이는 규율이 성과로 돌아온다. “이 작업에는 이 툴 하나만”이라는 결정 규칙이 당신의 집중 효율을 지킨다.

    반대로 회사가 아직 1~2개만 허용하는 상황이라면, 서둘러 네 번째를 신청할 이유가 줄어든다. 조직 레벨에서도 “툴 숫자 경쟁” 대신 “집중 시간 확보” 쪽으로 프레임을 바꾸는 편이 낫다.

    지금 바로 할 수 있는 것

    1. 내 AI 툴 리스트 감사 — 지난 한 달 실제 한 번이라도 연 툴을 적어본다. 4개 이상이면 가장 적게 쓰고 역할이 중복되는 것부터 삭제한다.
    2. 업무별 단일 툴 매핑 — “코드 = X, 문서 = Y, 대화 = Z” 식으로 책임자를 하나씩 지정하고, 작업 중에는 그 외 툴을 의식적으로 닫는다.
    3. 알림 정리 — 모든 AI 툴의 푸시·이메일·Slack 봇 알림을 한 번씩 끈다. 필요한 결과는 내가 직접 열어보는 방식으로 돌려놓는다. 이것만 해도 집중 시간이 눈에 띄게 복구된다.

    관련 글

    출처

    대표이미지 출처: Asanify

  • OpenAI가 실리콘밸리판 SportsCenter TBPN을 산 진짜 이유 — AI 회사가 미디어를 사는 시대

    OpenAI가 실리콘밸리판 SportsCenter TBPN을 산 진짜 이유 — AI 회사가 미디어를 사는 시대

    4월 2일, OpenAI가 미디어 회사를 샀다. 11명짜리 토크쇼 하나에 “수억 달러대(low hundreds of millions)”를 썼다. 월스트리트저널 보도 기준 추정치다. 모델도, GPU도, 칩 제조사도 아닌 — 텔레비전 방송이다.

    CNBC는 사설에서 한 단어로 정리했다. “Chasing vibes.” 분위기를 사고 있다는 뜻이다. 이 거래가 한국 비즈니스 의사결정자에게 의미하는 바를 셋으로 정리한다.

    거래의 전말 — 무엇을 샀나

    항목 내용
    인수 발표일 2026년 4월 2일
    대상 TBPN (Technology Business Programming Network)
    형태 일일 라이브 토크쇼, 평일 11–14시 PT 방송
    창업자·진행자 Jordi Hays, John Coogan
    출범 2025년 3월 라이브 토크쇼 데뷔
    규모 직원 11명, 회당 평균 약 7만 시청
    가격 “low hundreds of millions” 달러 (WSJ 보도)
    주체 Fidji Simo (CEO of AGI Deployment) 주도, 보고는 Chris Lehane(글로벌 어페어스 책임자)
    편집권 독립 유지(공식 발표)

    주목할 부분은 가격이 아니라 보고 라인이다. 이 자산은 제품 조직이 아닌 정책·커뮤니케이션 라인으로 들어갔다. 즉 OpenAI는 TBPN을 수익 사업이 아니라 영향력 사업으로 본다는 신호다.

    OpenAI의 첫 미디어 인수가 의미하는 것 3가지

    ① “AI 내러티브”가 인프라가 됐다. GPU·데이터센터·칩과 같은 등급의 자산이라는 뜻이다. 시청자 7만 명짜리 일일 토크쇼가 수억 달러 가치인 이유는, 그 시청자가 정확히 “창업자·VC·기업 의사결정자”이기 때문이다. 광고 도달이 아니라 정책·여론 도달이다.

    ② 챗봇 회사가 “유통 채널”을 사기 시작했다. Salesforce·Adobe·SAP가 옛날에 컨퍼런스·미디어·교육 사업을 묶어 만든 그림과 닮았다. AI 회사가 같은 길을 9개월 만에 간다는 뜻이고, OpenAI는 그 한 발을 4월 2일에 뗐다.

    ③ “편집 독립” 약속의 유효 기간은 보통 짧다. 미디어 인수 사례에서 약속과 실제의 거리는 대체로 18~24개월에 좁혀진다. TBPN이 OpenAI 비판 보도를 얼마나 자유롭게 할지 — 그 첫 시험 케이스가 6~12개월 안에 온다.

    한국 비즈니스에 직접 닿는 신호

    여기서 한국으로 가져올 함의 셋.

    먼저, B2B AI 영업의 진입점이 바뀐다. 미국 의사결정자 다수가 평일 점심에 TBPN을 본다. 한국 AI 스타트업·SaaS가 미국 진출을 준비한다면, 이제 “OpenAI 생태계의 미디어 채널”이 잠재 고객 도달 경로의 하나가 된다. 좋든 싫든 경쟁 환경이 그쪽으로 기운다.

    둘째, 한국 AI 회사도 “오리지널 콘텐츠”를 자산으로 보기 시작할 시점이다. 카카오·네이버·SKT가 이미 자체 미디어를 갖고 있지만, “AI 내러티브 전용 채널”은 아직 비어 있다. 이 자리는 누군가 잡는다. 늦으면 외부에서 정의된 내러티브를 받아쓰는 입장이 된다.

    셋째, “AI 회사의 PR이 곧 정책”이라는 인식을 가져야 한다. Lehane 산하라는 사실이 그 점을 못 박는다. 한국에서도 AI 규제·정책 라운드테이블이 늘고 있는데, 그 자리에 누가 어떤 미디어와 함께 앉느냐가 1~2년 안의 정책 결과를 결정한다.

    그래서 — 의사결정자에게 달라지는 것

    AI 시대의 경쟁은 더 이상 “더 좋은 모델 vs 더 싼 모델”이 아니다. 1년 전엔 그게 핵심이었지만 2026년 2분기의 진짜 게임은 “누가 의사결정자의 일상 시간을 점유하는가”이다. 제품·유통·미디어가 한 줄에서 묶인다.

    지금 바로 할 수 있는 것

    1. 본인 회사가 미국·유럽 향 매출이 있다면, 의사결정자 페르소나의 “일상 정보 식단”을 한 페이지로 정리한다. TBPN·Stratechery·The Information이 거기 들어가는지부터 본다. 들어간다면 거기 광고·콘텐츠 협업 예산 한 줄이 필요하다.
    2. 한국 본사·자회사 차원에서 “AI 내러티브 자산”을 만들 의사가 있는지 1시간짜리 회의로 정한다. 1년 안에 누군가는 이 자리를 잡는다.
    3. 임원진과 함께 TBPN 에피소드 하나를 본다. OpenAI가 왜 이 채널에 수억 달러를 썼는지, 30분 보면 본능적으로 이해된다. 보고서 10페이지보다 빠르다.

    관련 글

    출처

  • Stop hiring humans — HumanX 2026이 보여준 AI 일자리 패닉, 한국 직장인 생존 매뉴얼

    Stop hiring humans — HumanX 2026이 보여준 AI 일자리 패닉, 한국 직장인 생존 매뉴얼

    샌프란시스코 출장에서 돌아온 친구 메시지가 한 줄이었다. “건물 입구에 ‘Stop hiring humans’라고 쓰여 있더라.”

    찾아보니 진짜였다. 4월 9~12일에 열린 HumanX 2026 컨퍼런스. 4일간 약 6,500명의 투자자·창업자·임원이 모인 자리에서, 한 AI 채용 자동화 회사가 컨퍼런스장 정문에 저 문구를 광고로 걸었다. AFP·디지털저널이 12일자로 받아 적었고, 같은 날 한국어 커뮤니티에서도 빠르게 퍼졌다.

    처음엔 그냥 마케팅 자극이라고 생각했다. 그런데 같은 무대에서 나온 발언들을 모아 보면, 이게 단순한 도발이 아니다.

    이베이 코리아에 재직했었을때도 가끔 본사에서 비슷한 얘기들을 들은적이 있다.

    “아침에 출입증이 먹통이 되었는데, …”

    무대 위에서 실제로 나온 말들

    AI 글쓰기 플랫폼 Writer의 CEO 메이 하빕(May Habib)은 메인 스테이지에서 이렇게 말했다. “포춘 500대 기업의 보스들이 지금 ‘AI가 고용에 미치는 영향’에 대해 집단적 패닉 어택을 겪고 있다.”

    같은 주에 발표된 두 건의 인사 뉴스가 그 말을 뒷받침했다.

    • Salesforce: 고객지원 인력 4,000명 감원. “AI가 업무의 50%를 처리한다”고 공식 발표.
    • Block(잭 도시): 전사 인력을 거의 절반으로 줄이겠다고 발표. 사유는 “지능 도구(intelligence tools)가 회사 운영 방식을 근본적으로 바꿨기 때문”.

    이게 4일간의 컨퍼런스 무대에서 동시에 흘러나왔다. 사람들이 패닉 어택을 겪고 있다는 말이 농담이 아닌 셈이다.

    그런데 — 한 발 떨어져서 보면

    전부 액면 그대로 받을 필요는 없다. 같은 기사에서 일부 경제학자들은 이렇게 짚었다. 지금의 감원은 “AI 때문”이 아니라 “지난 3년간의 과잉 채용 정리 + 향후 인프라 투자(데이터센터·GPU)에 쓸 현금 확보”가 본질이고, “AI”는 IR과 언론에 쓰기 좋은 명분이라는 것이다.

    나도 이 해석에 좀 더 무게를 둔다. 25년 일하면서 본 패턴이다. 기업이 어려운 결정을 할 때 가장 먼저 찾는 건 “사회적으로 이해받기 좋은 라벨”이다. 2001년엔 닷컴 거품, 2008년엔 금융위기, 2020년엔 팬데믹, 2026년엔 AI다.

    다만 라벨이 명분이라는 사실이 “내 일자리는 안전하다”를 의미하진 않는다. 명분이 있다는 건, 회사가 그 명분을 한 번 써먹기로 결정했다는 뜻이고, 그 결정의 칼날 위에 누가 서 있는지가 다음 질문이다.

    그래서 나는 조직을 리드할때는, Value Chain의 기본에 대해서 자주 언급한다. 이것은 어떻게든 목표를 우상향으로 바라보고, 벌고 남는 이익을 투자하려는 성질탓에 기업이 건강해질수 있는 유일한 길이라고 믿기 때문이다.

    한국 직장인이 봐야 할 3가지 신호

    1. “직군 단위 자동화”가 무대에서 처음 공식화됐다. 지금까지는 “AI가 보조한다”였는데, Salesforce 발표는 “고객지원 직군의 50%를 AI가 한다”는 직군 단위 선언이다. 한국에서도 콜센터·1차 CS·기초 영업 지원이 가장 먼저 신호를 받는다.

    2. “중간 관리자”가 두 번째 표적이 된다. Block의 잭 도시가 정리하겠다고 한 인력 중 상당수가 미들 매니저·조정자 역할이다. AI가 1차 업무를 하면, 그걸 모아 보고하던 층이 가장 빨리 얇아진다.

    3. 한국 대기업은 6~12개월 시차로 따라온다. 미국 발표가 한국 컨설팅 보고서가 되고, 그 보고서가 한국 임원회의로 들어가는 데 보통 6~12개월이 걸린다. 즉 지금이 그 시차 안쪽이다.

    그래서 — 오늘 뭘 해야 하나

    “AI를 배우자”는 말은 너무 막연하다. 좀 더 좁혀 보면 이렇다. 본인의 업무를 “AI가 70% 한다고 가정”하고, 남는 30%가 무엇인지 한 문장으로 설명할 수 있어야 한다. 그 30%가 본인의 다음 1~2년 커리어 자산이다.

    지금 바로 할 수 있는 것

    1. 본인 업무를 한 페이지로 적고, 각 항목 옆에 “AI가 가능 / 부분 가능 / 불가능”을 표시해 본다. 30분이면 끝난다. 결과를 보면 이 글의 어떤 통계보다 무섭다.
    2. “부분 가능” 항목을 1개 골라 이번 주 안에 ChatGPT·Claude로 직접 자동화해 본다. 안 해 본 사람과 해 본 사람의 격차가 6개월 뒤엔 직군 차이가 된다.
    3. 이력서·링크드인의 직무 설명을 “관리·조율” 중심에서 “판단·결정·맥락”으로 다시 쓴다. 자동화되는 단어와 안 되는 단어가 다르다.

    관련 글

    출처

  • OpenAI·Anthropic·Google 프론티어 동맹 — 중국 AI 카피 1,600만 회 적발의 진짜 의미

    OpenAI·Anthropic·Google 프론티어 동맹 — 중국 AI 카피 1,600만 회 적발의 진짜 의미

    2026년 4월 8일, 블룸버그가 한 줄짜리 기사로 분위기를 바꿨다. OpenAI·Anthropic·Google이 Frontier Model Forum이라는 비영리 기구를 통해 “중국 모델이 우리 모델을 어떻게 베껴 가는지” 공격 데이터를 서로 공유하기 시작했다는 소식이다. 2023년에 출범하고 거의 잊혀졌던 이 포럼이, 3년 만에 처음으로 의미 있는 결과물을 낸 셈이다.

    경쟁사 셋이 한 테이블에 앉을 정도면 사안이 가볍지 않다. 한국 기업·개발자에게 어떤 영향이 오는지 차분히 정리해 본다.

    1. 사건 요약 — 1,600만 회의 “위장 질의”

    발단은 두 달 전이다. 2026년 2월 23일 Anthropic이 자체 보고서에서 약 24,000개의 위장 계정으로 1,600만 회의 Claude 대화가 이뤄졌고, 그 배후로 중국 3개사를 직접 지목했다.

    기업 대화 수(추정) 주요 표적
    MiniMax 약 1,300만 건 광범위한 능력 추출
    Moonshot (Kimi) 약 340만 건 에이전트 추론·툴 사용·코딩·컴퓨터 사용
    DeepSeek 약 15만 건 정합성·안전·정책 응답

    이 방식이 적대적 디스틸레이션(Adversarial Distillation)이다. 비싼 모델에 똑똑한 질문을 반복적으로 던져 답을 모은 뒤, 그 답을 학습 데이터 삼아 싸구려 모델을 길러 낸다. 업계에선 비용 차이를 이렇게 본다.

    • 프론티어 모델 1개 학습: 약 10억 달러
    • 잘 짜인 디스틸레이션 1회: 약 10~20만 달러

    약 5,000~1만 배 차이다. 합법·불법을 떠나, 경제적 인센티브가 너무 크다는 게 동맹 결성의 진짜 이유다.

    2. Frontier Model Forum이 실제로 하는 일

    이번에 공유되는 데이터는 단순한 “차단 IP 명단”이 아니다. 세 회사가 관측한 위장 계정의 행동 패턴, 우회 결제 수단, 프록시 인프라, 그리고 모델별로 어떤 능력을 표적으로 삼았는지의 메타데이터다. 한쪽에서 막힌 패턴이 다음날 다른 회사에서 그대로 등장하는 일을 줄이려는 것이다.

    달리 말하면, AI 회사들이 처음으로 “플랫폼 보안 공조”를 시작했다. 클라우드 회사들이 DDoS 공격 정보를 공유하던 것과 비슷한 그림이다.

    3. 한국 기업·개발자에 직접 닿는 변화 3가지

    ① API 어뷰즈 탐지가 강해진다. 위장 계정 패턴이 학습되면, VPN·중계 서버·다중 계정으로 우회해 쓰던 일부 한국 스타트업·연구실의 사용 패턴도 같이 잡힐 수 있다. 정상 트래픽이면 문제없지만, “대량 합성 데이터 만들려고 우회하던” 케이스는 위험하다.

    ② 중국 오픈소스 모델의 “혈통” 논쟁이 본격화된다. DeepSeek·Kimi 계열 모델을 사내에서 쓰는 곳이 늘었는데, 공급망(Supply Chain) 관점에서 “이 모델 가중치가 어디서 왔는가”가 컴플라이언스 이슈가 될 수 있다. 특히 미국 향 SaaS를 제공한다면, 고객사가 모델 출처를 묻는 일이 곧 일상화된다.

    ③ 미국 수출 통제와 모델 라이선스 조건이 같이 조여 온다. 디스틸레이션을 막는 가장 빠른 길은 약관·라이선스·결제 수단 검증이다. 한국 법인도 미국 모델 API를 쓸 때 KYC가 늘어나고, 일부 고급 모델은 국가·도메인 단위로 게이팅될 가능성이 높다.

    4. 그래서 — 한국 독자에게 달라지는 것

    기술 뉴스로 보면 “미·중 모델 전쟁의 새 챕터” 정도지만, 일하는 입장에서 핵심은 “내가 쓰는 모델의 출처와 약관을 처음으로 진지하게 봐야 하는 시점”이라는 데 있다. 한 줄로 정리하면 이렇다. 2026년부터 AI는 “성능”만큼 “공급망”이 평가 항목이 된다.

    지금 바로 할 수 있는 것

    1. 사내에서 쓰는 LLM 목록을 한 장으로 정리한다. 모델명, 호스팅 위치, 약관(상업적 이용·재학습 금지 조항), 데이터 송수신 방향까지. 이게 곧 컴플라이언스 자료가 된다.
    2. OpenAI·Anthropic·Google API를 쓴다면 결제 수단·법인 KYC를 정리해 둔다. 우회·중계 결제는 향후 계정 정지 사유가 될 수 있다.
    3. 오픈소스 모델(DeepSeek·Kimi·MiniMax 등)을 프로덕션에 쓰고 있다면, 미국·EU 향 고객이 출처 증빙을 요구할 가능성을 시나리오로 정리해 둔다.

    관련 글

    출처

  • Cursor 60조 밸류에이션 해부: 지금 계속 써야 하는가 5가지 판단 프레임워크

    Cursor 60조 밸류에이션 해부: 지금 계속 써야 하는가 5가지 판단 프레임워크

    Cursor 만드는 회사 Anysphere의 밸류에이션이 1년 만에 6배 가까이 뛰었다. 2025년 초 $9.9B, 2025년 11월 Series D에서 $29.3B, 그리고 2026년 3월 기준 새 라운드 논의에서 $50~60B이 언급된다. 매출은 2025년 5월 ARR $500M → 10월 $1B → 2026년 2월 $2B을 돌파했다. 숫자만 보면 실리콘밸리 역사상 가장 빠른 성장 곡선 중 하나다.

    그런데 Fortune이 3월 21일 커버스토리에서 붙인 제목은 흥미롭게도 “Cursor’s crossroads: the rapid rise, and very uncertain future“였다. 뭐가 불확실하다는 걸까. 이 글은 숫자와 헤드라인이 아니라, Cursor 유료 구독자/팀 도입 담당자가 “지금 계속 써야 하는지, 갈아타야 하는지”를 판단할 수 있도록 5가지 관점으로 구조화한 프레임워크다.

    관점 1. 가격 구조 — Claude Code의 역공

    Fortune이 “pricing problem”으로 명시한 부분이다. Cursor의 비즈니스 구조는 단순하다. Anthropic·OpenAI·Google 모델을 API로 호출해서 구독료와의 차액을 먹는 모델이다. 문제는 Claude Code. Anthropic이 자체 모델을 자체 툴로 제공하니 원가 구조부터 Cursor가 따라갈 수 없다. 2026년 들어 Claude Code가 Cursor보다 낮은 가격대로 비슷한 경험을 제공하기 시작했다.

    판단 기준: 본인의 월 Cursor 비용이 $20 Pro로 충분히 감당되면 전환 필요성 낮음. 팀 플랜($40/사용자 × 사용자 수)을 쓰거나 usage 초과로 월 청구가 들쭉날쭉하다면, Claude Code + OpenClaw 같은 대안과의 비교가 실질적 선택지가 된다.

    관점 2. 워크플로우 잠금 — 에디터냐 에이전트냐

    Cursor 3는 Agent 중심으로 재설계되었지만, 여전히 강점은 “VS Code 포크 기반의 풍부한 에디터 경험”에 있다. 반대로 Claude Code는 터미널 네이티브라 에디터 UI가 약하다. 여기서 갈라지는 포인트가 명확하다. 본인의 개발 루틴이 (a) 에디터 안에서 생각하고 수정하는 흐름 중심인지, (b) 에이전트에 태스크만 던지고 결과를 리뷰하는 흐름 중심인지.

    판단 기준: 하루 작업의 절반 이상이 에디터에서 벌어지면 Cursor 유지. 절반 이상이 “태스크 위임·결과 검토”라면 Claude Code나 Codex 기반 도구가 효율적. 이 두 흐름을 섞어야 하는 팀이라면 둘 다 쓰는 게 비용 대비 생산성 측면에서 타당할 수 있다.

    관점 3. 모델 의존성 리스크

    Cursor의 가장 큰 구조적 약점은 “본인들이 모델을 안 만든다”는 것이다. 2026년 현재 Anthropic, OpenAI, Google 모두 자체 코딩 툴을 밀고 있고, 이들이 언제든 Cursor에 가는 API 단가를 조정할 수 있다. Anysphere는 최근 자체 모델 개발을 시사했지만, 인프라 투자는 OpenAI/Anthropic과 비교도 안 되게 작다.

    판단 기준: Cursor가 2026년 안에 자체 모델이나 주요 파트너십(예: Nvidia+Cursor 프리미엄 계약)을 발표하면 긍정 신호. 반대로 “Claude 3.7만 Pro 전용” 같은 식의 모델 차등 제한이 반복되면 API 의존 구조가 불리하게 돌아가는 신호다.

    관점 4. 팀 도입 관점 — 계약/보안 친화성

    Fortune 보도 이후 한국 대기업·금융권·공공 고객이 Cursor 도입을 재검토하는 움직임이 있다. 이유는 두 가지. 첫째, 밸류에이션이 높아질수록 엔터프라이즈 계약 조건이 공격적으로 변할 가능성. 둘째, 데이터 처리·보안 감사 기준에서 “어떤 모델이 호출되는지, 로그는 어디 남는지”를 명확히 해야 하는 기업 요구사항.

    판단 기준: 개인 개발자·스타트업은 가격·품질만 보면 된다. 50명 이상 팀이나 민감 코드베이스를 다루는 조직은 Business/Enterprise 티어 계약서를 다시 읽어보고, 보안 부서와 함께 “코드가 어떤 모델 호출을 거쳐 어디에 저장되는지” 구체적으로 확인해둬야 한다. 이건 Cursor만의 이슈는 아니고 Copilot·Claude Code도 마찬가지다.

    관점 5. 커뮤니티·생태계 성숙도

    Cursor의 가장 견고한 자산은 이미 자리잡은 커뮤니티다. JetBrains 1만 명 조사(2026년)에서 Cursor는 상위권을 유지했고, 한국 개발자 커뮤니티에서도 “일단 Cursor부터 써본다”가 기본값이 됐다. 이건 단기간에 뒤집히지 않는다. Reddit r/cursor, YouTube 튜토리얼, 프롬프트 라이브러리, 내장 rules 파일 생태계까지 합치면 이동 비용이 꽤 크다.

    판단 기준: 지금 Cursor로 생산성을 내고 있고, .cursorrules나 팀 컨벤션이 잘 녹아 있다면, 가격·경쟁 이슈에도 불구하고 2~3개월은 유지하면서 시장을 관찰하는 게 합리적. 갈아타는 비용이 당장 얻을 절감액보다 클 가능성이 높다.

    그래서 한국 유저에게 뭐가 달라지나

    밸류에이션 논의가 한국 유저에게 직접 영향을 주지는 않는다. 하지만 그 뒤의 질문 — “Cursor가 앞으로도 본인 포지션을 지킬 수 있을까” — 은 실질적 구독 결정과 직결된다. 세 가지 시나리오가 가능하다.

    • 시나리오 A (유지): Cursor가 자체 모델 또는 차별화 UX로 반격에 성공. 현재 구독 유지.
    • 시나리오 B (조용한 잠식): 가격·품질에서 Claude Code·Copilot Agent Mode가 Cursor를 슬며시 앞서기 시작. 이 경우 6개월쯤 뒤 자연스럽게 전환.
    • 시나리오 C (급변): 파트너십 붕괴나 대규모 가격 인상. 이땐 즉시 전환 결정.

    현재 한국 개발자에게 가장 실용적인 포지션은 “Cursor를 유지하되 Claude Code와 Copilot Agent Mode를 나란히 셋업해두는 것”이다. 전환 비용은 한 달 전에 준비해두면 없는 것과 같고, 유지 비용은 $20/월 수준이다. 결정이 필요한 순간이 왔을 때 바로 움직일 수 있는 준비가 진짜 경쟁력이다.

    지금 바로 할 수 있는 것

    • 월 Cursor 비용 파악 — Pro/Business 티어 청구서 지난 3개월치를 꺼내서 usage 초과 여부를 본다.
    • 대안 하나 병행 셋업 — Claude Code 또는 Copilot Agent Mode 중 하나를 사이드 프로젝트에 설치해본다. 전환 시나리오의 리허설이다.
    • 팀 도입 담당자는 계약서 재확인 — 2026년 상반기 중 Cursor 쪽 가격 조정 가능성을 염두에 두고, 자동 갱신 조건과 보안 조항을 다시 본다.

    관련 글

    출처

  • F/ai 완전 정리: OpenAI·구글·메타·MS·앤트로픽이 한 액셀러레이터에 모인 이유

    F/ai 완전 정리: OpenAI·구글·메타·MS·앤트로픽이 한 액셀러레이터에 모인 이유

    경쟁사가 같은 사무실에 책상을 나란히 놓는 일은 거의 없다. 그런데 OpenAI, Anthropic, Google, Meta, Microsoft, 그리고 Mistral까지 — 미국·유럽 주요 AI 랩이 한 액셀러레이터 프로그램에 동시에 멘토로 들어왔다. 이름은 F/ai. 파리의 거대 스타트업 캠퍼스 Station F가 운영하고, 처음으로 빅테크 6사가 한 테이블 위에서 초기 단계 AI 스타트업을 직접 키우기로 했다.

    F/ai의 정체: 6개 빅테크가 동시에 들어온 첫 사례

    F/ai는 Station F가 주관하는 3개월짜리 AI 전문 액셀러레이터다. 매년 두 차례 코호트를 운영하며, 한 회차에 20개 팀을 받는다. 일반 공모는 없다. 후보는 추천(recommendation-only) 방식으로만 들어오고, 기술·연구 베이스가 탄탄하면서 상업화 경로가 분명한 팀만 추린다. 첫 봄 코호트는 1월 13일에 시작했고, 20개 팀이 이미 합쳐서 €34M(약 530억 원) 가까이 조달한 상태다.

    특이한 건 결승 무대다. 통상 액셀러레이터는 마지막 날 투자자를 모아놓고 데모데이를 한다. F/ai는 대신 “deal day”를 연다. 발표가 아니라, 대기업과의 파트너십·계약을 그 자리에서 사인하는 형식이다. 프로그램이 노골적으로 노리는 KPI도 매출이다 — 6개월 안에 €1M ARR 도달.

    스타트업이 받는 것: 자금 대신 모델·컴퓨트·엔지니어

    F/ai는 직접 투자하지 않는다. 대신 모델 호출, GPU 컴퓨트, 클라우드 서비스 크레딧을 합쳐 한 팀당 100만 달러 이상을 지원한다. 더 중요한 건 사람이다. 프로그램에 들어가면 OpenAI·Anthropic·Google·Meta·Microsoft·Mistral 엔지니어링 팀과 직접 워크숍을 한다. 평소 NDA를 뚫지 않고는 만나기 어려운 라인이다.

    구성으로 보면 Y Combinator의 유럽판이라기보다, 빅테크가 각자 가진 모델 위에서 돌아갈 “다음 세대 앱” 후보들을 모으는 공동 사냥터에 가깝다. Sequoia, General Catalyst, Mistral, OpenAI는 별도 펀드 구조로 일부 팀에 후속 투자를 실어주는 라인도 같이 깔았다.

    왜 모였나: 유럽 + 미국, Y Combinator 견제, 그리고 모델 의존도

    이 그림이 처음 잡혔을 때 가장 놀라운 건 “왜 한 자리에 모였는가”였다. 세 가지 이유가 겹친다. 첫째, 유럽 AI 스타트업 풀이 무시할 수 없는 수준으로 두꺼워졌다. Mistral, Black Forest Labs 같은 사례가 반복되면서, 미국 빅테크 입장에서 유럽에 멘토 라인을 박아두는 비용이 무시할 게 됐다.

    둘째, Y Combinator가 사실상 OpenAI 진영에 가까운 통로가 되면서, 다른 진영도 자기 모델 위에 앱을 올릴 통로가 필요해졌다. 셋째 — 그리고 가장 솔직한 이유 — 누가 어느 모델을 쓰느냐가 향후 5년 매출 곡선에 직결된다. 빅테크는 이제 “내 모델을 쓰는 앱이 6개월 안에 매출을 내는지”를 직접 보고 싶어 한다.

    그래서 한국 입장에서 뭐가 달라지나

    F/ai는 한국 팀에게도 닫혀 있는 구조는 아니다. 추천 기반이라 평소 글로벌 VC·빅테크 채널에 노출돼 있어야 한다는 단점이 있지만, 반대로 말하면 한국에 본사를 둔 팀도 미국 법인이나 EU 거점만 있으면 후보군에 들어갈 수 있다. 더 큰 시그널은 다른 데 있다. 빅테크가 “투자보다 매출 KPI”를 내걸었다는 점이다. 6개월 안에 €1M ARR. AI 시장이 더는 데모데이로 평가받지 않는다는 뜻이다.

    한국 AI 스타트업이 그 동안 익숙했던 “프리시드 받고 PoC 돌리며 1년 버티는” 패턴은 글로벌 무대에서 점점 뒤로 밀린다. 이번 F/ai 같은 프로그램이 보내는 메시지는 단순하다 — “모델은 우리가 줄게, 너는 매출 가져와.”

    지금 바로 할 수 있는 것

    • Station F F/ai 페이지에서 코호트 구성과 deal day 운영 방식 한 번 훑어보기. 직접 지원 못 해도 글로벌 AI 액셀러레이터가 어떤 KPI를 보는지 감이 잡힌다.
    • 현재 우리 팀이 만드는 AI 제품이 “6개월 안에 €1M ARR” 기준에서 어디쯤에 있는지 솔직하게 적어보기. 거리감이 보일수록 다음 분기 우선순위가 분명해진다.
    • 국내 액셀러레이터·VC 미팅 때 “모델 크레딧과 엔지니어링 액세스를 함께 줄 수 있는가”를 한 번 물어보기. 글로벌 기준이 바뀌고 있다.

    관련 글

    출처

    대표이미지 출처: STATION F

  • SaaS-pocalypse: ServiceNow 46% 폭락·Oracle 반격, Anthropic이 SaaS를 깨고 있다

    SaaS-pocalypse: ServiceNow 46% 폭락·Oracle 반격, Anthropic이 SaaS를 깨고 있다

    ServiceNow 주가가 연초 대비 46% 빠졌다. 4월 10일에는 하루에만 -8.98%. Cloudflare, CrowdStrike, Salesforce, Snowflake도 같이 주저앉았다. 시장이 부르는 이름은 점점 굳어지고 있다 — “SaaS-pocalypse”. 그리고 사람들은 한 회사를 손가락으로 가리킨다. Anthropic.

    무엇이 무너지고 있는가

    SaaS가 지난 15년 동안 쌓아 올린 해자는 단순했다. 데이터를 보관하고, 워크플로우를 정의하고, 사용자가 매달 자동으로 결제한다. 한 번 들어가면 잘 안 빠져나간다. 그런데 Anthropic의 Claude Managed Agents가 공개 베타로 풀린 직후, 시장은 다른 그림을 그리기 시작했다.

    핵심 가설은 이것이다 — AI 에이전트가 기존 SaaS의 UI 레이어를 우회한다. 사용자는 ServiceNow 화면에서 티켓을 끊지 않고, Claude에게 “이 장애 해결 워크플로우를 돌려”라고 말한다. 에이전트가 ServiceNow API를 호출해 같은 일을 한다. 결과적으로 ServiceNow는 데이터를 들고는 있지만, 사용자 인터랙션의 대부분이 에이전트로 옮겨간다. 좌석당 라이선스 모델은 그 순간 무너진다.

    UBS는 ServiceNow 목표가를 내렸고, 한 달 만에 시가총액 수십조 원이 증발했다. 시장이 보고 있는 건 일시적 하락이 아니라 구조적 압박이다.

    ServiceNow의 반격: 구독 + 토큰 하이브리드 가격제

    ServiceNow는 손 놓고 있지 않다. 회사가 새로 들고나온 가격 모델은 좌석당 월 구독료에 AI 사용량 기반 토큰 비용을 얹는 하이브리드 구조다. “사람이 많으면 비싸다”에서 “AI가 일을 많이 하면 비싸다”로 청구 기준 자체가 옮겨간다.

    CEO Bill McDermott는 “SaaS가 죽고 있다는 게 아니라 기회”라고 말했다. 4년 전부터 AI에 베팅해온 자사가 지금이야말로 점유를 늘릴 시점이라는 것이다. 메시지는 분명한데, 시장은 아직 못 믿는 분위기다 — 하이브리드 가격제는 단기적으로 매출 인식 패턴을 흔들고, 기존 좌석당 라이선스 매출을 잠식할 수 있어서다.

    Oracle의 반격: Systems of Record에서 Systems of Outcomes로

    Oracle은 더 큰 쪽을 친다. 회사가 새로 발표한 Fusion Agentic Applications는 한 줄로 요약된다 — 데이터베이스 안에 에이전트를 박아둔다. 에이전트가 외부에서 API로 들어와 데이터를 바꾸는 게 아니라, DB 엔진과 같은 레벨에서 트랜잭션을 만들고 감사 로그를 남긴다.

    Oracle이 쓰는 표현이 정확하다. “Systems of Record(기록 시스템)에서 Systems of Outcomes(결과 시스템)으로.” 기존 ERP는 사람이 입력하면 기록을 남기는 게 일이었다. 에이전트가 들어오면 사람을 거치지 않고 결과 — 인보이스 발행, 재고 조정, 예산 재배분 — 자체를 만들어낸다. Oracle은 자사 ERP 위에 에이전트를 직접 얹어 이 흐름을 잡으려 한다.

    진짜 종말인가

    SaaS가 사라진다는 서사는 자극적이지만 지나치게 단순하다. 짚어둘 세 가지가 있다.

    첫째, 에이전트도 결국 어떤 시스템 위에서 돈다. 데이터 자체와 권한·감사·SOC2 컴플라이언스 레이어는 여전히 누군가가 들고 있어야 한다. ServiceNow·Salesforce·Oracle이 이걸 놓을 가능성은 낮다.

    둘째, 가격 모델은 흔들리지만 매출 자체는 꼭 줄지 않는다. 하이브리드 가격제는 “사람 100명 × 월 50달러”가 “사람 30명 × 월 30달러 + AI 토큰 월 5,000달러”로 모양만 바뀌는 식이 될 수 있다. 합계는 더 커질 수도 있다.

    셋째, 정말로 위협받는 건 “워크플로우 UI에만 가치가 있던” SaaS다. 데이터 통합·도메인 컴플라이언스·산업 특화 로직이 약한 서비스부터 잘려 나간다. 시장은 지금 “어디부터 잘릴까”를 가격에 반영하는 중이다.

    그래서 한국 기업이 지금 점검해야 할 것

    한국 기업의 SaaS 청구서는 보통 매년 자동 갱신된다. 올해는 그 자동 갱신을 한 번 멈춰볼 가치가 있다. 미국에서 벌어지는 가격 모델 재편은 한국 기업 청구서에도 1~2분기 안에 들어온다. 좌석당 단가는 내려가고 사용량 기반 라인이 새로 붙는 형식이 표준이 될 가능성이 높다. 갱신 협상 테이블에서 이걸 미리 알고 들어가는 것과 모르고 들어가는 것의 차이는 크다.

    지금 바로 할 수 있는 것

    1. 현재 사용 중인 SaaS 리스트와 좌석 수를 한 페이지로 정리. 분기마다 한 번씩 “이 좌석 중 몇 %가 AI 에이전트로 대체 가능한가”를 추정해본다.
    2. 다음 SaaS 갱신 협상 전에, 공급사에 “하이브리드 가격제 옵션이 있는지”를 명시적으로 묻기. 없다면 1년만 계약하고 6개월 후 재협상 조항을 넣는다.
    3. 핵심 워크플로우 1~2개를 골라 자체 에이전트로 PoC. ROI 비교는 “구독료 절감”이 아니라 “처리 건수 × 인건비 절감”으로 잡는다.

    관련 글

    출처

    대표이미지 출처: Oracle

  • Microsoft MAI-Transcribe-1 완전 분석: Whisper 넘어선 음성인식 API 가격·성능·사용법

    Microsoft MAI-Transcribe-1 완전 분석: Whisper 넘어선 음성인식 API 가격·성능·사용법

    $0.36/시간. 25개 언어. Whisper-large-v3보다 낫다는 주장. 4월 2일 Microsoft가 Azure AI Foundry를 통해 공개한 음성인식 모델 MAI-Transcribe-1이 내건 숫자다. 자체 발표인 만큼 그대로 믿기 어려운 부분도 있지만, 가격대만 놓고 보면 무시하기 힘든 카드가 등장했다는 건 분명하다.

    같은 날 Microsoft는 OpenAI에 의존하지 않는 자체 모델 3종을 한꺼번에 공개했다. 음성합성 MAI-Voice-1, 이미지 생성 MAI-Image-2, 그리고 오늘의 주인공 MAI-Transcribe-1. 이 중 STT 쪽이 가장 빠르게 실무 영향이 가능한 영역이다.

    핵심 주장 세 줄

    MAI-Transcribe-1은 Azure AI Foundry 위에서 돌아가는 음성인식(STT) API다. Microsoft가 내세우는 키 메시지는 단순하다. 25개 언어 — 그중 한국어 포함 — 전 영역에서 OpenAI Whisper-large-v3를 앞선다는 것. 기존 경쟁 모델 대비 GPU 비용 50% 절감. 그리고 시간당 $0.36, 분당으로 환산하면 약 $0.006다.

    한국어 WER(단어 오류율)이 Whisper 대비 낮다는 게 자체 벤치마크 결과인데, 이건 독립 검증 전까지는 어디까지나 마케팅 숫자다. 실제 한국어 콜센터 녹음, 회의 음성 같은 실전 데이터로 직접 돌려 봐야 진짜 차이가 보인다.

    경쟁사와 단순 비교

    서비스 가격 한국어 특징
    MAI-Transcribe-1 $0.36/시간 O 실시간+배치, Azure 통합
    OpenAI Whisper API $0.006/분 ($0.36/시간) O 배치 전용
    Google STT v2 $0.016/분 ($0.96/시간) O 스트리밍
    AWS Transcribe $0.024/분 ($1.44/시간) O AWS 통합
    네이버 CLOVA 별도 문의 한국어 특화 한국어 최적화

    표만 보면 결론은 분명하다. Google과 AWS 대비 가격이 압도적으로 싸다. Whisper API와는 가격이 같은데 성능이 정말로 더 높다면, STT 워크로드를 옮길 이유가 생긴다. 키 포인트는 “정말로”다.

    실제 사용 — Azure 계정 있으면 5분

    Azure 구독이 있다면 AI Foundry에서 MAI-Transcribe-1 엔드포인트를 바로 배포할 수 있다. Python SDK 기준 코드는 군더더기가 없다.

    from azure.ai.inference import AudioTranscriptionClient
    from azure.core.credentials import AzureKeyCredential
    
    client = AudioTranscriptionClient(
        endpoint="https://[your-resource].services.ai.azure.com",
        credential=AzureKeyCredential("[API-KEY]")
    )
    
    with open("audio.mp3", "rb") as f:
        response = client.transcribe(
            body={"file": f, "language": "ko"}
        )
    
    print(response.text)

    기존에 Azure Cognitive Services STT를 쓰고 있던 환경이라면 엔드포인트와 모델명만 갈아 끼우면 된다. 마이그레이션 부담이 사실상 없다는 뜻이다.

    나머지 두 모델 짧게

    같은 발표에 끼어 나온 MAI-Voice-1은 텍스트 → 음성 변환 모델이다. 감정과 억양을 자연스럽게 표현하는 게 핵심 자랑거리고, 가격은 아직 공개 전, Azure AI Foundry 베타로 접근 가능하다. OpenAI TTS와 정면 충돌 포지션이다. MAI-Image-2는 이미지 생성 쪽이다. DALL-E 3 대비 사실적 인물 묘사와 텍스트 렌더링이 개선됐다는 주장이고, Microsoft Designer와 통합 예정이다. 둘 다 STT만큼 즉시 효과를 내는 영역은 아니지만, Microsoft가 OpenAI 의존도를 줄이려는 큰 그림은 분명히 보인다.

    그래서 — 옮길 가치가 있는가

    이미 Azure 위에 인프라가 올라가 있는 한국 기업이라면, MAI-Transcribe-1은 즉시 파일럿할 만하다. 콜센터 녹음 분석, 회의록 자동화, 자막 생성 — STT 워크로드가 매월 수백 시간을 넘어가는 팀이라면 Google·AWS 대비 비용 차이가 분기 단위 예산에서 체감된다. 다만 한 가지를 잊지 말자. Microsoft가 발표한 벤치 숫자는 자기 측정값이다. 한국어 실전 데이터로 Whisper API와 직접 WER을 비교해 본 다음에 결정하는 것이 안전하다.

    지금 할 일

    Azure 계정이 있다면 ai.azure.com에 들어가 MAI-Transcribe-1 엔드포인트를 1시간 안에 띄울 수 있다. 평소 자주 다루는 한국어 음성 파일 5~10개를 골라 Whisper API와 같은 조건으로 돌려 비교해 보자. WER 차이가 5% 이상 나면 옮길 가치가 있고, 1~2% 차이라면 가격 우위만으로 결정 근거가 충분하다.

    관련 글

    출처

  • Anthropic, Google TPU 21조 원 베팅: Claude 인프라 확장

    Anthropic, Google TPU 21조 원 베팅: Claude 인프라 확장

    21조 원. 4월 6일 Anthropic이 Google·Broadcom과 발표한 인프라 딜의 규모다. 단순 투자 뉴스가 아니다. AI 회사 한 곳이 한 번에 베팅한 컴퓨팅 인프라 규모로는 최상위에 속한다. 이 숫자가 무엇을 의미하는지를 풀어 보면, Claude의 다음 1~2년 방향성이 거의 그대로 드러난다.

    딜의 뼈대

    핵심은 Google의 차세대 AI 칩 TPU v7p 약 100만 개를 Broadcom이 제공하는 패키징·네트워킹과 함께 Anthropic에 공급하는 구조다. 두 단계로 나뉘어 진행됐다.

    • 1차: 100억 달러 (약 13조 원), 2025년 3분기
    • 2차: 110억 달러 (약 14조 원), 2025년 4분기 추가 계약
    • 합계: 약 210억 달러 — 발표 시점 환율 기준 약 28조 원

    2027년부터 약 3.5GW(기가와트) 규모의 AI 컴퓨팅 용량이 Anthropic에 공급된다. 감을 잡으려면 이 숫자를 다른 단위로 보면 된다. 현재 전 세계 AI 데이터센터의 총 용량이 약 10GW 수준이다. 한 회사가 그중 3분의 1에 해당하는 용량을 미리 잠근 셈이다.

    왜 Nvidia GPU가 아니라 Google TPU인가

    Anthropic은 이미 Amazon AWS와 깊은 파트너십을 맺고 있다. 그런데 이번 추가 인프라는 Google TPU를 골랐다. 흥미로운 선택의 배경에는 두 가지 현실이 있다.

    첫째, 공급 안정성. Nvidia GPU는 수요 폭발로 공급 일정이 늘 불안정하다. 2025년 내내 어떤 회사도 원하는 만큼의 H100/H200을 받지 못했다. Google TPU는 Google이 직접 설계·생산하기 때문에 공급 변수를 자기가 통제한다. 둘째, 비용·전력 효율. TPU는 추론 워크로드에 특화 설계돼 동일 처리량 대비 전력 소비가 낮다. 모델 호출 당 비용을 줄여야 하는 Anthropic의 입장에서 정확히 맞는 카드다.

    한 가지 더. Anthropic은 한 클라우드에 종속되는 위험도 줄이고 있다. AWS + Google TPU의 조합은 자연스러운 분산이 된다. 한쪽에서 문제가 생겨도 다른 쪽으로 워크로드를 옮길 수 있는 여지가 생긴다.

    Anthropic이 이런 베팅을 할 수 있는 이유

    이 정도 규모의 인프라 투자는 매출이 받쳐 주지 않으면 불가능하다. Anthropic의 최근 성장 곡선이 바로 그 답이다.

    • 연환산 매출 약 300억 달러 (약 40조 원). 2025년 말 90억 달러에서 3배 이상 증가
    • 연간 100만 달러 이상 지출하는 기업 고객 수 1,000개 돌파 — 2월 대비 두 배

    이런 곡선이라면 21조 원짜리 인프라 베팅은 무모한 도박이 아니라 다음 1~2년의 성장을 받쳐 주는 사전 투자에 가깝다.

    한국 사용자 입장에서 본 의미

    당장 다음 주에 Claude가 두 배 빨라지는 일은 없다. 하지만 2027년부터 본격 가동되는 3.5GW 용량은 몇 가지 변화를 의미한다. 응답 속도가 점진적으로 개선될 가능성이 높고, Claude Pro에서 간헐적으로 발생하던 사용량 한도 제한도 완화될 여지가 있다. 그리고 더 중요한 한 가지 — 충분한 컴퓨팅이 뒷받침돼야 더 큰 모델을 서비스할 수 있다는 점이다. 다음 세대 Claude의 사이즈와 응답 품질이 바로 이 인프라 위에서 결정된다.

    큰 그림에서 보면 이번 딜은 Anthropic이 OpenAI와의 장기전을 위한 인프라를 미리 잠갔다는 신호다. Claude를 업무에 본격 도입하려는 한국 기업 입장에서, 공급사의 장기 안정성 측면에서 한 가지 변수가 줄었다는 뜻이기도 하다.

    지금 할 일

    일반 사용자 입장에서 당장 바뀌는 건 없다. 다만 Claude Pro를 이미 구독하고 있다면 같은 요금에 포함된 Claude Code를 같이 굴려 보지 않은 사람이 의외로 많다. 별도 결제 없이 코딩 에이전트가 따라온다는 점은 챙겨 둘 만하다. 기업 도입을 검토 중이라면 이번 발표를 단발 뉴스로 보지 말고, 향후 1~2년 공급사 안정성 평가 자료로 한 줄 메모해 두자. Anthropic 공식 발표 페이지에 전체 내용이 정리돼 있다.

    관련 글

    출처

    대표이미지 출처: Anthropic 공식 블로그