[작성자:] kevin

  • 화웨이 Ascend 950PR · Nvidia H20 2.87배 성능 · 바이트댄스 7.8조 원 베팅 — 중국 AI칩 자립 시대

    화웨이 Ascend 950PR · Nvidia H20 2.87배 성능 · 바이트댄스 7.8조 원 베팅 — 중국 AI칩 자립 시대

    Nvidia 독주에 제동? 화웨이 AI칩이 바꾸는 판도

    2026년 3월, 화웨이가 새로운 AI 추론 칩 Ascend 950PR을 공개했습니다. Nvidia의 중국용 칩 H20 대비 2.87배 성능을 주장하며, 바이트댄스(틱톡 모회사)는 올해 화웨이 칩에 56억 달러(약 7.8조 원)를 투입할 계획입니다. 미국의 AI칩 수출 규제 속에서, 중국은 자체 반도체 생태계를 빠르게 구축하고 있습니다.

    Ascend 950PR — 스펙으로 보는 실력

    화웨이 차이나 파트너 컨퍼런스 2026에서 공개된 Atlas 350 가속기 카드의 핵심 사양입니다.

    • 연산 성능: FP4 기준 1.56 PFLOPS — Nvidia H20의 약 2.8배
    • 메모리 대역폭: 1.4TB/s (H20 대비 1.5배)
    • 소비 전력: 600W (TDP)
    • 특징: 중국산 칩 중 유일하게 FP4 저정밀도 추론 지원
    • 자체 HBM: 인하우스 고대역폭 메모리 탑재 — 외국 의존도 축소

    특히 화웨이는 CANN Next라는 소프트웨어 프레임워크로 Nvidia CUDA 호환성을 구현해, 기존 CUDA 기반 AI 모델을 쉽게 이식할 수 있도록 했습니다(WCCFTech).

    바이트댄스 7.8조 원 · 알리바바도 대량 주문

    로이터에 따르면, 바이트댄스와 알리바바는 Ascend 950PR의 CUDA 호환성 확인 후 대량 주문을 결정했습니다. 바이트댄스는 2026년 화웨이 칩에 56억 달러 이상을 지출할 예정입니다. 이전 세대(910B)에서 지적된 호환성 문제가 해결되면서, 중국 빅테크의 화웨이 칩 신뢰도가 크게 올랐습니다(AInvest).

    2026년 75만 대 출하 · 양산 임박

    화웨이는 2026년 1월 샘플을 배포했고, 4월 양산을 시작합니다. 하반기 본격 출하로 올해 총 75만 대를 공급할 계획입니다. 이는 중국 AI 인프라의 자립도를 한 단계 끌어올릴 수치입니다(TrendForce).

    So What — 한국에 미치는 영향

    • 삼성·SK하이닉스 HBM 시장 변화: 화웨이가 자체 HBM을 탑재했다는 것은, 중국향 고대역폭 메모리 수요가 줄어들 수 있다는 신호입니다. 한국 반도체 기업에게는 위협 요소입니다.
    • AI 하드웨어 다변화: Nvidia 독점이 깨지면, AI 서비스 가격 경쟁이 심화되어 한국 AI 스타트업에게는 인프라 비용 절감 기회가 될 수 있습니다.
    • 미중 기술 패권 경쟁 심화: 수출 규제에도 불구하고 중국이 자체 칩을 만들어내고 있어, 글로벌 AI 생태계가 미국·중국 두 블록으로 분리될 가능성이 높아지고 있습니다.

    지금 바로 할 수 있는 것

    1. 반도체 산업 동향 팔로우: TrendForce, DigiTimes 등 반도체 전문 매체를 구독해 AI칩 경쟁 동향을 추적하세요.
    2. AI 인프라 비용 비교: 클라우드 서비스별 GPU 가격을 정기적으로 비교하고, 화웨이 칩 기반 중국 클라우드(알리바바 클라우드 등)의 가격 변화를 모니터링하세요.
    3. 투자 관점: 삼성전자·SK하이닉스 투자자라면, 중국 자체 HBM 개발이 수요에 미칠 영향을 주시하세요.

    관련 글


    출처:

  • AI가 하루 1시간을 절약해 준다 · 그런데 기업 80%는 아직 미도입 — 골드만삭스 보고서

    AI가 하루 1시간을 절약해 준다 · 그런데 기업 80%는 아직 미도입 — 골드만삭스 보고서

    AI가 하루 1시간을 돌려준다 — 그런데 왜 80%는 아직 모를까?

    ChatGPT를 업무에 쓰는 직장인은 하루 평균 40~60분을 절약하고 있습니다. 50명 팀이면 매일 33~50시간이 회복되는 셈입니다. 그런데 골드만삭스의 2026년 3월 AI 도입 추적 보고서에 따르면, 미국 기업의 81% 이상이 아직 AI를 도입하지 않았습니다. 왜 이런 격차가 벌어지고 있을까요?

    하루 1시간 절약 — 숫자로 보는 AI 생산성

    OpenAI가 공개한 엔터프라이즈 데이터에 따르면, ChatGPT 기업용 계정을 사용하는 직원들의 생산성 변화는 뚜렷합니다.

    • 일일 절약 시간: 40~60분
    • 새로운 업무 수행: 75%가 이전에 불가능했던 업무를 완수
    • 학술 연구 평균: 생산성 23% 향상, 기업 사례로는 33% 향상

    포춘(Fortune)은 “이것은 단순한 편의가 아니라, 팀 단위로 환산하면 매일 수십 시간의 생산성 회복”이라고 평가했습니다(Fortune).

    그런데 도입률은 19% — 왜 느릴까?

    골드만삭스의 2026년 3월 AI Adoption Tracker에 따르면, 미국 사업장의 AI 도입률은 19% 미만입니다. 전월 대비 거의 변화가 없으며, 향후 6개월 내 22.3%까지 상승할 전망입니다. S&P 500 기업의 70%가 실적 발표에서 AI를 언급했지만, 실제로 AI의 구체적 영향을 수치화한 기업은 10%, 수익 영향까지 측정한 곳은 1%에 불과합니다(Fortune).

    효과가 확실한 2가지 영역: 고객지원·개발

    골드만삭스는 경제 전체 수준에서는 AI와 생산성 사이에 의미 있는 관계를 찾지 못했습니다. 하지만 두 가지 특정 영역에서는 중위 기준 30% 생산성 향상을 확인했습니다.

    • 고객 지원(Customer Support): 응답 시간 단축, 해결률 향상
    • 소프트웨어 개발(Software Development): 코드 작성·디버깅·리뷰 가속

    “AI 만능론”보다는 잘 정의된 업무에 집중 투입하는 것이 현실적인 전략입니다(Yahoo Finance).

    So What — 한국 직장인에게 의미하는 것

    • 지금이 격차 벌리기 좋은 시점: 80%가 미도입 상태라는 건, 지금 AI를 쓰기 시작하면 경쟁 우위를 가질 수 있다는 의미입니다.
    • 전사 도입보다 핵심 업무 먼저: 골드만삭스도 “전체 경제 효과는 미미하지만, 특정 업무에서는 30% 효과”라고 결론지었습니다. 모든 업무에 AI를 적용하려 하지 말고, 고객 응대·개발·문서 작성 등 효과가 입증된 영역부터 시작하세요.
    • 측정이 핵심: AI 도입만으로는 부족합니다. “몇 시간 절약되었는가”를 추적해야 투자 대비 효과를 증명할 수 있습니다.

    지금 바로 할 수 있는 것

    1. 이번 주 반복 업무 3개 선정: 회의록 정리, 이메일 초안, 데이터 정리 등 매일 반복하는 업무에 ChatGPT/Claude/Gemini를 적용해 보세요.
    2. 절약 시간 기록: 1주일간 AI 사용 전후 소요 시간을 비교해 기록해 두면, 팀 도입 제안 시 강력한 근거가 됩니다.
    3. 팀 파일럿 제안: 5~10명 규모의 소규모 파일럿을 운영하고, 결과를 수치로 정리해 경영진에게 보고하세요.

    관련 글


    출처:

  • OpenAI 1,220억 달러 사상 최대 투자 유치 · 기업가치 1,200조 원 · IPO 초읽기

    OpenAI 1,220억 달러 사상 최대 투자 유치 · 기업가치 1,200조 원 · IPO 초읽기

    역대 최대 투자 유치, OpenAI에 무슨 일이?

    2026년 3월 31일, OpenAI가 1,220억 달러(약 170조 원)라는 사상 최대 규모의 투자를 유치했습니다. 기업가치는 8,520억 달러(약 1,200조 원)로, 비상장 기업으로서는 역사상 가장 높은 밸류에이션입니다. 단순한 AI 스타트업이 아니라, 글로벌 빅테크와 어깨를 나란히 하는 기업이 된 셈입니다.

    아마존 50B·엔비디아 30B·소프트뱅크 30B — 초대형 투자자 총출동

    이번 라운드의 주요 투자자 구성이 놀랍습니다.

    • 아마존(Amazon): 500억 달러 투자 (이 중 350억 달러는 OpenAI의 IPO 또는 AGI 달성 조건부)
    • 엔비디아(Nvidia): 300억 달러
    • 소프트뱅크(SoftBank): 300억 달러 (공동 리드 투자자)
    • 기타: 앤드리슨 호로위츠(a16z), D.E. Shaw, MGX, TPG, T. Rowe Price 등

    특히 개인 투자자도 은행 채널을 통해 30억 달러를 투자하며 최초로 리테일 참여가 이뤄졌습니다(TechCrunch).

    월 매출 2조 8천억 원, ChatGPT 주간 9억 명

    OpenAI의 현재 실적도 투자를 뒷받침합니다.

    • 월 매출: 20억 달러(약 2.8조 원) — 2024년 말 분기 10억 달러에서 급성장
    • ChatGPT 주간 활성 사용자: 9억 명 이상
    • 유료 구독자: 5,000만 명 이상

    이 자금은 AI 칩 확보, 데이터센터 건설, 통합 AI ‘슈퍼앱’ 개발에 투입될 예정입니다(CNBC).

    IPO 초읽기 — 언제, 어떻게?

    아마존의 350억 달러 투자 중 상당 부분이 OpenAI IPO 또는 AGI 달성을 전제 조건으로 합니다. 이는 사실상 IPO가 기정사실화되었다는 신호입니다. 블룸버그에 따르면, OpenAI는 올해 안에 상장을 추진할 가능성이 높으며, 상장 시 시가총액은 1조 달러를 넘길 수 있습니다(Bloomberg).

    So What — 한국 독자에게 의미하는 것

    이번 투자는 단순한 숫자 놀음이 아닙니다.

    • AI 인프라 독점 심화: OpenAI가 칩·데이터센터·모델을 수직 통합하면, 한국 AI 스타트업이 경쟁할 수 있는 공간은 더 좁아집니다.
    • ChatGPT 유료 구독의 가치 상승: 170조 원의 자금이 모델 성능 향상에 투입됩니다. 현재 ChatGPT Plus/Team 구독자라면 앞으로 더 강력한 기능을 같은 가격에 쓸 수 있습니다.
    • IPO 투자 기회: OpenAI 상장 시 국내 해외 주식 투자자에게 새로운 기회가 됩니다.

    지금 바로 할 수 있는 것

    1. ChatGPT 엔터프라이즈/팀 플랜 검토: 회사에서 아직 도입 전이라면, 월 매출 2조 원 규모의 서비스가 계속 강화될 것이므로 지금이 도입 적기입니다.
    2. OpenAI IPO 동향 추적: 증권사 해외주식 앱에서 OpenAI를 관심 종목으로 등록해 두세요.
    3. 경쟁 서비스 비교: Claude, Gemini 등 대안 서비스와 비교하며 자신에게 맞는 AI 툴을 선택하세요.

    관련 글


    출처:

  • Figure AI: 멜라니아 트럼프가 초대한 로봇, 백악관 첫 휴머노이드의 등장

    2026년 3월 25일, 백악관 역사상 최초의 휴머노이드 로봇 손님이 등장했다. 멜라니아 트럼프 여사가 AI·교육 정상회의 Fostering the Future Together Global Coalition Summit에 Figure 3 로봇과 나란히 입장했다. 로봇은 다국어로 인사를 건네며 자신을 이렇게 소개했다. “I’m Figure 03, a humanoid built for the United States of America.” SF 영화의 장면이 현실이 됐다.

    Figure 3는 어떤 로봇인가

    Figure AI가 개발한 Figure 3는 키 약 173cm(5’8″), 몸무게 약 61kg의 인간형 로봇이다. 메시 소재로 덮인 몸통에는 손바닥 카메라와 촉각 센서가 내장돼 있다. 단순한 전시용 로봇이 아니다. 식기세척기에 그릇 넣기, 빨래, 장난감 정리, 옷 개기 등 실제 가사 작업을 수행할 수 있도록 설계됐다.

    멜라니아 트럼프는 이 자리에서 “AI는 휴대폰에서 실용적인 휴머노이드로 진화할 것”이라고 말했다. 미 행정부가 휴머노이드 로봇을 공식 행사에 등장시킨 것 자체가 미국의 로봇·AI 경쟁력 과시 메시지로 읽힌다.

    출처: CNBC — Figure AI 백악관 방문, Fortune — Figure 3 소개

    Figure AI, 실리콘밸리에서 가장 뜨거운 로보틱스 스타트업

    베이 에어리어(Bay Area) 기반의 Figure AI는 현재 Series D에서 기업가치 480억 달러(약 64조 원)를 인정받은 휴머노이드 로봇 분야 최대 스타트업이다. OpenAI, Microsoft, 엔비디아, BMW 등 쟁쟁한 파트너들과 협력 관계를 구축하고 있으며, 자동차 공장과 물류 창고 환경에서 상업적 배치를 늘려가고 있다.

    2026년 휴머노이드 로봇 섹터에는 올 한 해에만 200억 달러(약 27조 원) 이상의 투자가 몰릴 것으로 전망된다. Figure AI 외에도 Neura Robotics(1.2조 원 조달 추진), Sunday AI(가정용 로봇 Memo, 기업가치 1.15조 원) 등이 경쟁 중이다.

    출처: SiliconANGLE — Neura Robotics, TechCrunch — Sunday AI

    왜 지금 휴머노이드 로봇인가 — 기술적 전환점

    2024~2025년까지 휴머노이드 로봇은 기술 시연 수준에 머물렀다. 2026년이 다른 이유는 세 가지다. 첫째, 대형 언어모델(LLM)과 로봇 제어의 결합이다. OpenAI의 모델이 로봇의 “두뇌” 역할을 맡으면서 자연어 명령으로 복잡한 작업을 수행할 수 있게 됐다. 둘째, 센서 및 액추에이터 가격 하락으로 양산 비용이 급감하고 있다. 셋째, BMW·Mercedes 같은 전통 제조업체들이 파일럿 프로그램을 확대하며 실제 수요가 검증되고 있다.

    출처: Crunchbase — 휴머노이드 로봇 투자 트렌드

    그래서 한국 독자에게 뭐가 달라지나

    국내 삼성전자·현대자동차·LG전자가 모두 로봇 사업을 확대 중이다. 현대차는 Boston Dynamics를 보유하고 있고, 삼성은 가정용 로봇 개발에 수천억을 투자했다. 미국의 Figure AI가 백악관에서 존재감을 과시한 지금, 글로벌 휴머노이드 경쟁에서 한국 기업의 포지션이 어디인지 주목해야 할 시점이다.

    소비자 입장에서는 아직 수년 후의 이야기다. 하지만 가사 보조 로봇이 에어컨·세탁기처럼 가전제품화되는 흐름은 이미 시작됐다. 2026년 백악관 행사는 그 전환점으로 기억될 가능성이 높다.

    지금 바로 할 수 있는 것

    1. Figure AI 공식 채널 팔로우figure.ai에서 최신 영상으로 실제 동작 수준을 확인해본다.
    2. 국내 로봇 ETF 확인 — 글로벌 휴머노이드 로봇 섹터 투자 흐름이 궁금하다면 ROBO, IRBO 등 로보틱스 ETF를 참고해본다.
    3. AI + 로봇 결합 트렌드 추적 — OpenAI의 로봇 파트너십 동향을 주시하면 다음 Big Thing을 미리 포착할 수 있다.

    관련 글


    출처: CNBC · Fortune · NBC News · TechCrunch

    대표이미지 출처: CNBC

  • #QuitGPT: ChatGPT 삭제 295% 급증·Claude 앱스토어 1위, 하루 만에 뒤집힌 AI 판도

    2026년 2월 28일, OpenAI가 미 국방부(DoD)와 기밀망 AI 배치 계약을 체결하자 예상치 못한 일이 벌어졌다. ChatGPT 삭제율이 하루 만에 295% 폭등했다. 수백만 명이 앱을 지우고 ‘#QuitGPT’라는 해시태그를 달았다. 반대로 그 계약을 거절한 Anthropic의 Claude는 미국 앱스토어 1위에 올랐다. AI 업계 판도가 단 하루 만에 뒤집혔다.

    무슨 일이 있었나 — OpenAI 국방부 계약의 내막

    OpenAI는 2026년 2월 28일 미 국방부와 Claude가 아닌 GPT 모델을 기밀 네트워크에 배치하는 공식 계약을 맺었다. 문제는 계약의 범위였다. 계약서는 미군이 AI를 “모든 합법적 용도(all lawful use)”에 활용할 수 있도록 허용했다. 여기에는 대규모 민간 감시와 자율 무기 시스템 운용이 포함될 수 있다는 해석이 나왔다.

    Sam Altman 본인도 이후 인터뷰에서 계약 발표 방식이 “기회주의적이고 엉성해 보였다(opportunistic and sloppy)”고 인정했다. 뒤늦은 사과였지만, 이미 불은 번졌다.

    출처: TechCrunch — ChatGPT 삭제 295% 급증, TechRadar — Sam Altman 인터뷰

    #QuitGPT 운동 — 2.5백만 명이 동참한 AI 불매 운동

    시민들은 소셜미디어에서 빠르게 조직됐다. #QuitGPT 운동 주최 측은 온라인 참여자가 250만 명을 넘었다고 발표했다. 요구사항은 명확했다. OpenAI가 법적 구속력 있는 공개 선언을 통해 (1) 대규모 국내 감시 도구 개발 거부, (2) 완전 자율 무기 시스템 참여 거부를 약속하라는 것이었다.

    앱 분석 기업 Appfigures 데이터에 따르면 2월 28일 당일 Claude가 미국 내 일일 다운로드에서 처음으로 ChatGPT를 추월했고, 3월 2일에는 미국 앱스토어 무료 앱 전체 1위에 올라 3월 첫 주 내내 유지됐다.

    출처: Let’s Data Science — QuitGPT 참여자 통계, Euronews — QuitGPT 운동

    Anthropic은 왜 계약을 거절했나

    Anthropic은 국방부와 협상 테이블에 앉았지만, 두 가지 조건을 지키려 했다. Claude가 미국 시민 대규모 감시에 쓰이지 않을 것, 그리고 완전 자율 무기에 사용되지 않을 것. 국방부가 이를 거부하고 “모든 합법적 용도” 사용 허가를 요구하자 Anthropic은 협상을 결렬시켰다.

    국방부는 이에 대한 보복으로 Anthropic을 “국가 안보에 대한 허용 불가한 위험(unacceptable risk to national security)”으로 지정하고 기존 정부 계약을 전면 취소했다. Anthropic은 연방 법원에 소송을 제기하며 맞섰다.

    출처: Open Magazine — QuitGPT와 OpenAI 신뢰 붕괴

    그래서 한국 ChatGPT 사용자는 어떻게 봐야 하나

    한국은 직접적인 당사자는 아니다. 하지만 이 사건은 AI 서비스를 고를 때 기업의 윤리 기준과 계약 조건이 제품 성능만큼 중요해지고 있음을 보여준다. 직장에서 ChatGPT로 민감한 내부 문서를 처리하고 있다면, 해당 서비스가 어떤 기관과 어떤 조건으로 계약을 맺는지 알 필요가 있다.

    단기적으로는 Claude의 기업용 채택이 빨라질 가능성이 높다. Anthropic의 ‘거절’이 브랜드 자산이 된 사례다.

    지금 바로 할 수 있는 것

    1. Claude 체험claude.ai에서 ChatGPT와 직접 비교해본다. Claude 앱스토어 1위의 실체를 확인할 차례다.
    2. 사용 중인 AI 서비스 약관 확인 — 데이터 처리 방침과 제3자 제공 조건을 한 번쯤 읽어볼 것을 권한다.
    3. AI 윤리 동향 팔로우 — Future of Life Institute, AI Now Institute 등의 뉴스레터를 구독하면 이런 변화를 사전에 파악할 수 있다.

    관련 글


    출처: TechCrunch · Euronews · Let’s Data Science · TechRadar

    대표이미지 출처: Euronews

  • 경쟁사가 편든 소송: Anthropic vs 국방부, Jeff Dean과 Microsoft가 Anthropic 편에 선 이유

    AI 군사화를 둘러싼 법정 싸움에서 이례적인 장면이 펼쳐졌다. 경쟁사인 OpenAI와 Google DeepMind 직원 30여 명이, 그것도 Google 수석 과학자 Jeff Dean을 포함해, Anthropic의 편에 서서 법원에 의견서를 제출했다. 미 국방부를 상대로 한 Anthropic의 소송에 적군이 아군이 됐다. 실리콘밸리 AI 업계가 하나의 원칙을 두고 내부에서 갈라지는 순간이었다.

    소송의 시작 — 국방부가 Anthropic을 ‘국가 안보 위협’으로 지정

    사건의 발단은 계약 결렬이었다. Anthropic은 미 국방부(DoD)와 AI 활용 계약을 협상하며 두 가지 조건을 고수했다. Claude가 미국 시민 대규모 감시에 사용되지 않을 것, 완전 자율 무기에 사용되지 않을 것. 국방부가 “모든 합법적 용도(all lawful use)” 허용을 요구하며 거부하자 Anthropic이 먼저 협상을 결렬시켰다.

    국방부의 대응은 강경했다. Anthropic을 “국가 안보에 대한 허용 불가한 위험(unacceptable risk to national security)”이자 AI 공급망 위험 기업으로 지정하고, 기존의 모든 정부 계약을 취소했다. Anthropic은 이에 맞서 샌프란시스코 연방 법원에 트럼프 행정부를 상대로 소송을 제기했다.

    출처: TechCrunch — OpenAI·Google 직원들의 Anthropic 지지, State of Surveillance — 국방부의 Anthropic 지정 배경

    경쟁사 직원들이 Anthropic 편에 선 이유

    OpenAI와 Google DeepMind 직원 30명이 연명한 법원 의견서(amicus brief)의 핵심 논지는 이것이다. “정부가 윤리 기준을 이유로 특정 AI 기업을 공급망 위험으로 지정하는 것은 권력 남용이며, 미국 AI 산업 전체를 위협한다.”

    서명자 중 한 명인 Google DeepMind 수석 과학자 Jeff Dean은 파일링에서 이렇게 밝혔다. “이 조치는 미국의 AI 산업·과학 경쟁력에 심각한 결과를 초래할 것이다.” OpenAI 직원들 역시 회사가 DoD 계약을 맺은 상황에서도 동료 기업을 방어하는 의견서에 서명했다.

    이 외에도 Microsoft가 별도의 amicus brief를 제출했고, 퇴역 장교 22명도 Anthropic 편에 서서 “자율 무기에 대한 AI 기업의 윤리적 거부는 정당하다”는 의견을 냈다.

    출처: Fortune — Google·OpenAI 직원 의견서, Data Center Dynamics — Microsoft amicus brief

    AI 군사화 논쟁 — 어디까지 허용해야 하나

    이 소송의 핵심은 AI 기업이 ‘어떤 조건으로 정부와 계약해야 하는가’라는 근본 질문이다. 현재 실리콘밸리의 입장은 두 갈래로 나뉜다.

    • 협력론 (OpenAI, Google 일부): 미국이 중국보다 AI 군사력에서 앞서야 한다. 책임 있는 기업이 참여해 내부에서 통제하는 것이 낫다.
    • 거부론 (Anthropic, 일부 연구자): 자율 무기와 대규모 감시는 AI의 근본적 위험이다. 어떤 조건에서도 이를 가능하게 하는 계약은 맺을 수 없다.

    두 입장 모두 논리가 있다. 하지만 이번 소송은 법원이 AI 군사 계약의 한계를 처음으로 판단하게 된다는 점에서 전례 없는 사건이 될 전망이다.

    출처: Axios — AI 기업들의 국방부 계약 딜레마

    그래서 한국 독자에게 뭐가 달라지나

    이 소송의 결과는 전 세계 AI 기업이 정부와 계약하는 방식에 선례를 남긴다. 한국도 국방부·경찰청 등이 AI를 도입하는 속도가 빨라지고 있다. 어떤 윤리적 레드라인을 계약서에 명시할 것인가, 그리고 그 기준을 어기는 기업에 어떤 제재를 가할 것인가는 한국도 곧 마주할 질문이다.

    당장은 Anthropic의 소송 결과를 주목하자. 이 판결이 글로벌 AI 계약 표준을 바꿀 수 있다.

    지금 바로 할 수 있는 것

    1. 소송 경과 추적CourtListener에서 Anthropic v. DoD 케이스를 검색하면 판결문 전문을 무료로 열람할 수 있다.
    2. AI 윤리 가이드라인 확인 — 우리 조직이 AI를 도입할 때 “자율 의사결정 허용 범위”를 계약서에 명시하고 있는지 점검해본다.
    3. Anthropic 헌법 AI 읽기 — Anthropic이 공개한 Constitutional AI 논문을 읽으면 이 회사가 왜 이 원칙을 포기하지 않는지 이해할 수 있다.

    관련 글


    출처: TechCrunch · Fortune · Data Center Dynamics · Axios

    대표이미지 출처: Fortune

  • AI 가격 전쟁 2026: Gemini 3.1 Flash-Lite bash.25/1M 토큰, 지금 개발자가 써야 할 모델은?

    2026년 AI 모델 시장에 가격 전쟁이 터졌다. Google이 3월 초 Gemini 3.1 Flash-Lite를 입력 토큰 100만 개당 0.25달러(약 340원)에 출시하며 사실상 선전포고를 했다. 1년 전만 해도 GPT-4 수준 성능에 이 가격은 상상도 못 할 수준이었다. 개발자 입장에서는 지금이 AI 모델 선택의 골든타임이다.

    Gemini 3.1 Flash-Lite — 가장 저렴한 고성능 모델의 등장

    Google이 2026년 3월 3일 공개한 Gemini 3.1 Flash-Lite는 전작(Gemini 2.5 Flash) 대비 세 가지가 달라졌다.

    • 가격: 입력 $0.25/1M 토큰, 출력 $1.50/1M 토큰 (2.5 Flash 대비 각각 17%, 40% 인하)
    • 속도: 첫 응답 토큰 생성 속도(TTFT) 2.5배 향상, 출력 속도 45% 향상
    • 접근성: Google AI Studio에서 개발자 즉시 사용 가능, Vertex AI로 기업 배포 지원

    실측 기준으로 초당 약 190~380 토큰을 출력한다. 실시간 챗봇, 대량 문서 처리, 반복 자동화 작업에 최적화된 모델이다.

    출처: Google 공식 블로그 — Gemini 3.1 Flash-Lite 출시, Artificial Analysis — 성능 벤치마크

    2026년 주요 AI 모델 가격 비교

    지금 개발자가 알아야 할 주요 모델의 API 가격을 정리했다. (2026년 3월 기준, 1M 토큰당 달러)

    모델 입력 출력 특징
    Gemini 3.1 Flash-Lite $0.25 $1.50 최저가·고속, 대량 처리 최적
    Gemini 2.5 Flash $0.30 $2.50 Flash-Lite 대비 추론 강화
    Claude Sonnet 4.6 $3.00 $15.00 코딩·분석 최강, Claude Code ARR $2.5B
    GPT-5.4 (API) $2.50 $10.00 멀티모달·함수 호출 강점

    가격 차이는 최대 12배에 달한다. 동일한 작업에 어떤 모델을 쓰느냐에 따라 월 API 비용이 수십 배 달라질 수 있다.

    출처: Google AI 개발자 — Gemini API 공식 가격표, MetaCTO — Gemini 가격 완전 가이드

    어떤 모델을 언제 써야 하나 — 실용 선택 가이드

    모든 작업에 비싼 모델이 필요하지 않다. 용도별로 모델을 나눠 쓰는 ‘계층화 전략’이 비용 최적화의 핵심이다.

    • 대량 자동화·분류·요약 → Gemini 3.1 Flash-Lite ($0.25/1M)
      고객 리뷰 감성 분석, 대량 문서 태깅, 이메일 자동 분류 등에 적합
    • 챗봇·고객 응대 → GPT-5.4 또는 Gemini 2.5 Flash
      자연스러운 대화와 함수 호출이 필요한 경우
    • 코딩·복잡한 추론 → Claude Sonnet 4.6
      가격이 높지만 코드 품질과 정확도에서 압도적 우위. 개발자 도구, Claude Code 연동

    스타트업이라면 Flash-Lite로 프로토타입을 만들고, 실제 서비스에서 정확도가 부족한 부분만 Sonnet이나 GPT-5.4로 교체하는 방식을 추천한다.

    그래서 한국 개발자·스타트업에게 뭐가 달라지나

    AI API 비용이 낮아진다는 것은 한국 스타트업에게 진입 장벽 하락을 의미한다. 6개월 전만 해도 AI 기능을 서비스에 넣으면 API 비용이 수백~수천만 원씩 나오는 경우가 있었다. Gemini 3.1 Flash-Lite 수준이면 같은 규모의 서비스를 10분의 1 이하 비용으로 운영할 수 있다.

    반대로 이 가격에서는 AI 기능 자체가 차별화 요소가 되기 어렵다. 모든 경쟁사도 동일한 저가 모델을 쓸 수 있기 때문이다. 결국 어떤 데이터와 프롬프트 엔지니어링으로 차별화하느냐가 핵심 역량이 된다.

    지금 바로 할 수 있는 것

    1. Gemini 3.1 Flash-Lite 무료 체험Google AI Studio에서 API 키 없이 바로 테스트해볼 수 있다.
    2. 현재 API 비용 감사 — 지금 쓰는 AI API 청구서를 꺼내 어떤 작업에 얼마를 쓰는지 분석한다. 대량 처리 작업이 있다면 Flash-Lite로 교체해보자.
    3. 모델 벤치마크 비교Artificial Analysis에서 최신 모델별 속도·정확도·가격 비교를 무료로 확인할 수 있다.

    관련 글


    출처: Google 공식 블로그 · Google AI 가격표 · Artificial Analysis · Build Fast with AI

    대표이미지 출처: Google 공식 블로그 (공식 이미지)

  • AI 직원을 고용하다: Paperclip으로 혼자 회사 운영하는 오픈소스 플랫폼

    AI 에이전트 하나를 다루는 건 이제 어렵지 않다. 진짜 문제는 여러 에이전트가 협력해서 일하도록 만드는 것이다. Paperclip은 바로 이 문제를 푼다. Claude, Codex, Cursor 등 다양한 AI 에이전트를 “직원”으로 고용하고, 조직도를 만들어 회사처럼 운영하는 오픈소스 플랫폼이다. 2026년 3월 기준 GitHub 스타 3만 5천 개를 넘기며 AI 에이전트 오케스트레이션 분야에서 가장 주목받는 프로젝트가 됐다.

    Paperclip이란? “AI 에이전트 조직도” 플랫폼

    Paperclip의 철학은 단순하다. “어떤 에이전트든, 어떤 런타임이든, 하나의 조직도로(Any agent, any runtime, one org chart)” 관리한다는 것이다.

    기존에는 AI 에이전트를 쓸 때 각각 따로 프롬프트를 입력하고 결과를 복사해 붙여넣는 방식이었다. Paperclip은 이걸 바꾼다. Claude에게는 콘텐츠 기획을 맡기고, Codex에게는 코드 작성을, Cursor에게는 코드 리뷰를 맡기는 식으로 역할을 분리하고, 각 에이전트가 서로의 결과물을 받아 이어서 작업하게 만든다.

    핵심 구성 요소는 세 가지다. 첫째, 하트비트(Heartbeat) — 에이전트를 정해진 일정에 자동으로 깨워 작업을 실행한다. 둘째, 티켓 시스템 — 모든 대화, 의사결정, 도구 호출이 감사 로그로 남는다. 셋째, 예산 관리 — 에이전트별 월간 비용 한도를 설정해 예상치 못한 과금을 막는다.

    출처: Paperclip 공식 사이트

    실제 어떻게 쓰나 — 혼자 스타트업 운영하기

    설치는 터미널 명령어 한 줄이면 끝난다.

    npx paperclipai onboard --yes

    설치 후 대시보드에서 “회사”를 만들고, 에이전트를 “채용”한다. 각 에이전트에게 역할(Role), 목표(Goal), 예산(Budget)을 설정하면 조직도가 완성된다. 예를 들어 1인 SaaS 운영자라면 이렇게 구성할 수 있다.

    • CEO (나) — 전략 승인 및 이사회 역할
    • Claude 에이전트 — 블로그 콘텐츠 작성, 고객 이메일 답변 초안
    • Codex 에이전트 — 버그 수정 PR 자동 생성
    • Cursor 에이전트 — 코드 리뷰 및 테스트 작성

    에이전트들은 하트비트 스케줄에 따라 자동으로 깨어나 작업을 처리하고, 완료 후 다시 대기 상태로 돌아간다. 예산 초과 시 자동으로 멈추기 때문에 새벽에 에이전트가 혼자 수백만 원짜리 API를 호출하는 사태를 막을 수 있다.

    2026년 3월 출시된 v2026.318.0에서는 플러그인 시스템이 추가돼, Gemini CLI 어댑터를 포함한 서드파티 에이전트 연결이 더 쉬워졌다.

    출처: Paperclip GitHub, MrDelegate Paperclip 리뷰

    장점과 한계 — 도입 전 알아야 할 것

    장점:

    • 완전 오픈소스 (MIT 라이선스) — 소스 코드 공개, 자체 서버에 무료 설치 가능
    • 에이전트 종류 무관 — Claude, Codex, Cursor, 직접 만든 HTTP 웹훅 에이전트도 연결 가능
    • 예산 및 거버넌스 내장 — 에이전트별 비용 추적, 승인 게이트, 롤백 기능
    • 상태 지속성 — 서버 재시작 후에도 에이전트가 같은 컨텍스트로 작업 재개

    한계:

    • 셀프 호스팅 필수 — Node.js + PostgreSQL 서버를 직접 운영해야 함. 관리 부담이 있다.
    • 오류 증폭 위험 — 에이전트끼리 결과물을 주고받을 때 초기 실수가 연쇄적으로 커질 수 있다. Flowtivity가 실제로 대량 발송 에이전트가 3건 대신 23건을 처리한 사례를 보고했다.
    • 클라우드 서비스 없음 — 관리형 SaaS 버전이 없어, 비개발자가 도입하기는 아직 어렵다.

    출처: Flowtivity — Zero-Human Companies 분석

    그래서 한국 개발자·1인 창업자에게 뭐가 달라지나

    Paperclip이 흥미로운 이유는 단순히 “자동화 툴”이 아니라 “AI로 조직을 구성하는 방식”을 제안하기 때문이다.

    지금까지 AI 도구는 내가 매번 프롬프트를 입력해야 했다. Paperclip은 그 반복을 없앤다. 한 번 설정한 조직도가 24시간 돌아가며 루틴 업무를 처리한다. 블로그 발행, 버그 수정 PR, 고객 응대 초안 — 이런 반복적인 작업을 에이전트에게 위임하고, 나는 승인과 전략만 담당할 수 있다.

    GitHub 스타 3만 5천 개, 3월 한 달에만 세 번의 major 릴리즈라는 모멘텀을 보면 이 프로젝트는 일회성이 아니다. 지금 배워두면 AI 에이전트 오케스트레이션 흐름의 최전선에 설 수 있다.

    지금 바로 할 수 있는 것

    1. GitHub 즐겨찾기github.com/paperclipai/paperclip 에서 Star를 눌러 업데이트를 추적한다.
    2. 로컬 설치 테스트 — Node.js 환경이 있다면 npx paperclipai onboard --yes 한 줄로 로컬 데모를 실행해볼 수 있다.
    3. 에이전트 목록 정리 — 지금 내가 반복적으로 하는 AI 작업 3가지를 적고, 어떤 에이전트에게 위임할 수 있을지 생각해본다.

    관련 글


    출처: Paperclip 공식 사이트 · GitHub paperclipai/paperclip · MrDelegate 리뷰 · Flowtivity 분석

    대표이미지 출처: Paperclip GitHub (MIT License)

  • 갤럭시 S26에서 Gemini가 앱을 직접 조작한다: 한국 동시 출시, 지금 쓸 수 있는 것

    말 한마디로 배달을 시킨다

    2026년 3월 12일, 갤럭시 S26 사용자들이 처음 경험했다. Gemini에게 “스타벅스에서 아메리카노 한 잔 주문해줘”라고 말하면, Gemini가 스타벅스 앱을 열고, 메뉴를 선택하고, 주소를 입력하고, 결제 직전 화면까지 진행한 뒤 멈춘다. 사용자가 확인 버튼을 누르면 끝이다.

    이것이 Gemini 스크린 자동화다. AI가 앱을 대신 조작한다. 이 기능의 첫 출시 국가는 미국과 한국, 두 나라뿐이다.

    어떻게 작동하는가

    기술적으로는 AI가 화면을 보고 터치를 흉내낸다. 가상 창(virtual window) 안에서 앱이 실행되고, Gemini가 각 단계를 진행하는 과정이 사용자 눈에 보인다. 중간에 멈추거나 직접 개입하는 것도 언제든 가능하다.

    작동 조건이 있다. One UI 8.5와 2026년 2월 보안 패치가 설치돼 있어야 한다. 개인 Google 계정만 지원된다. 직장·학교 계정은 제외된다. 현재 영어만 지원된다.

    출시 시점에 지원되는 앱은 Uber, Lyft, DoorDash, Grubhub, Uber Eats, Starbucks다. Instacart는 곧 추가 예정이다. AppFunctions라는 개발자 프레임워크가 열려 있어, 향후 더 많은 앱이 지원될 수 있다.

    사용 한도와 요금

    무제한이 아니다. 구글은 일일 사용 한도를 플랜별로 나눴다.

    • 무료: 하루 5회
    • Google AI Plus (월 $7.99): 하루 12회
    • Google AI Pro (월 $19.99): 하루 20회
    • Google AI Ultra (월 $249.99): 하루 120회

    일반 사용자라면 하루 5회면 충분하다. 점심 배달, 퇴근길 택시, 저녁 커피—세 번이면 하루 쓸 만한 기능을 커버한다. 무거운 사용자라면 AI Pro를 고려할 만하다.

    안전 장치는 어디에 있는가

    결제는 항상 사람이 확인한다. Gemini는 결제 직전 단계에서 반드시 멈추고 사용자 승인을 요청한다. AI가 돈을 직접 쓰는 구조가 아니다. 실수로 원하지 않는 주문이 완료되는 일은 설계상 불가능하다.

    작업 중 언제든 중단 가능하고, 사용자가 직접 개입해 수정할 수도 있다. Gemini가 판단하기 어려운 경우엔 사용자에게 결정을 넘긴다.

    갤럭시 S26이 없어도 되는가

    Pixel 10도 3월 말 같은 기능을 받았다. 단, Pixel 10 버전은 현재 미국만 지원이다. 한국에서 이 기능을 쓰려면 갤럭시 S26 시리즈가 필요하다.

    S25나 이전 기기는 현재 미지원이다. 향후 One UI 업데이트로 확장될 가능성은 있지만 공식 일정은 없다.

    그래서 얼마나 실용적인가

    솔직하게 말하면, 지금 당장은 “쓸 수 있는” 수준이다. 지원 앱이 아직 미국 기반 서비스 중심이다. 한국에서 쿠팡이츠, 배달의민족, 카카오T에서 쓸 수 없다는 뜻이다. 그러나 AppFunctions 프레임워크가 열려 있는 만큼, 국내 앱 지원이 추가되면 실용성이 크게 올라간다.

    더 중요한 포인트는 방향이다. 스마트폰 AI가 “답변해주는 것”에서 “대신 해주는 것”으로 바뀌는 첫 번째 실제 사례다. 갤럭시 S26으로 직접 써볼 수 있다.

    지금 바로 할 수 있는 것

    • 갤럭시 S26 사용자: 설정 → 소프트웨어 업데이트에서 One UI 8.5 + 2026년 2월 패치 확인 후 설치. Gemini 앱을 열고 “Uber로 [목적지] 가줘”로 테스트 시작.
    • 구글 계정 플랜 확인: 현재 무료 계정이라면 하루 5회 한도 안에서 충분히 활용 가능. 하루 20회 이상이 필요한 경우에만 AI Pro($19.99/월) 업그레이드 검토.
    • 갤럭시 S26이 없는 경우: AppFunctions 개발자 문서 확인(developer.android.com). 자신의 앱에 Gemini 스크린 자동화 연동을 준비해두면 지원 앱 리스트 확장 시 바로 활용 가능.

    관련 글


    출처

  • 아마존 프라임 2억 명에게 AI 주치의가 생겼다: Health AI 에이전트 출시

    아마존이 주치의를 만들었다

    2026년 3월 11일, 아마존이 미국 프라임 회원 2억 명에게 Health AI를 무료로 열었다. 증상을 물으면 의료 기록을 참조해 답한다. 검사 결과를 올리면 해석해준다. 처방전이 떨어지면 갱신을 처리한다. 진료가 필요하면 One Medical 의사와 연결한다.

    24시간, 대기 없이.

    이것이 AI 에이전트가 의료에 들어왔을 때 어떤 모습인지 가장 구체적으로 보여주는 사례다.

    어떻게 작동하는가

    Health AI는 Amazon Bedrock 위에 구축된 멀티에이전트 시스템이다. 단일 모델이 아니다. 네 종류의 에이전트가 동시에 작동한다.

    Core Agent가 환자와 대화한다. 증상, 질문, 요청을 받아 처리한다. 여기까지는 일반 AI 챗봇과 같다.

    다른 점은 뒤에 있다. Sub-Agent들이 특정 업무를 분담 처리한다. 처방전 갱신, 진료 예약, 검사 결과 해석 같은 각각의 작업이 전문화된 에이전트에게 배정된다. Auditor Agent는 대화 내용을 실시간으로 검토한다. Sentinel Agent는 전체 시스템을 감시하며 문제 발생 시 사람 의사에게 에스컬레이션한다.

    Health AI는 환자의 의료 기록, 검사 결과, 현재 복용 약물에 접근한다. 주(州) 건강정보 교류소를 통해 데이터를 가져온다. 일반적인 증상 검색이 아니라 실제 내 기록을 기반으로 한 개인화된 답변이 나온다.

    프라임 회원이 얻는 것

    기본 혜택은 명확하다. Health AI 사용 자체는 무료다. 여기에 소개 혜택으로 30개 이상 증상에 대해 One Medical 의사와의 직접 메시지 상담 5회 무료가 제공된다. 감기, 독감, 알레르기, 결막염, 요로감염 등 흔한 증상이 포함된다.

    One Medical 멤버십을 유지하면 더 깊은 기능을 쓸 수 있다. 프라임 회원 기준 연 99달러(일반가 199달러)다. AI가 처리하기 어려운 경우 화상 진료나 대면 진료로 자연스럽게 연결된다.

    AI 의료의 한계는 어디인가

    Health AI는 진단을 내리지 않는다. 이 점이 중요하다. “당신은 X 질환입니다”가 아니라 “이런 증상이 있을 때 일반적으로 이렇게 합니다, 더 확인이 필요하면 의사와 연결하겠습니다”가 작동 방식이다.

    최종 결제나 중요한 의료 결정에는 반드시 사람 확인이 필요한 구조다. Sentinel Agent가 위험 신호를 감지하면 AI는 개입을 멈추고 의사에게 넘긴다. 자율적으로 진단·처방하는 것이 아니라 의사의 접근성을 높이는 레이어로 설계됐다.

    한국에서는 언제 가능한가

    현재 미국 프라임 회원 전용이다. 한국 직접 출시 일정은 공개되지 않았다. 다만 이 구조 자체가 중요하다. 아마존이 만든 것이 아니라도, 같은 방식으로 의료 AI가 작동할 수 있다는 청사진이 나왔다.

    한국에서는 의료법상 AI의 진단 행위에 제한이 있다. 그러나 Health AI의 포지션은 진단이 아닌 정보 제공 + 예약 + 처방전 관리 + 의사 연결이다. 이 범위는 한국에서도 기술적·법적으로 가능한 영역이다. 카카오헬스케어, 네이버 클라우드, 대형 병원 앱에서 유사한 서비스가 나올 가능성이 있다.

    지금 바로 할 수 있는 것

    • 미국 거주자·교포: Amazon Prime 가입 후 Amazon Health 앱 또는 health.amazon.com에서 Health AI 활성화. One Medical 멤버십 없이도 기본 AI 상담 사용 가능.
    • 헬스케어 스타트업 개발자: Amazon Bedrock의 멀티에이전트 아키텍처(Core + Sub + Auditor + Sentinel) 구조를 레퍼런스로 참고. AWS Bedrock Agent 문서에서 유사 구조 구현 가능.
    • AI 에이전트에 관심 있는 기획자: Health AI의 “AI가 처리 → 위험 시 사람에게 에스컬레이션” 구조는 어떤 산업에도 적용 가능한 패턴이다. 자신의 서비스에 같은 패턴을 적용할 수 있는지 검토해볼 것.

    관련 글


    출처