[태그:] Gemini

  • AI 가격 전쟁 2026: Gemini 3.1 Flash-Lite bash.25/1M 토큰, 지금 개발자가 써야 할 모델은?

    2026년 AI 모델 시장에 가격 전쟁이 터졌다. Google이 3월 초 Gemini 3.1 Flash-Lite를 입력 토큰 100만 개당 0.25달러(약 340원)에 출시하며 사실상 선전포고를 했다. 1년 전만 해도 GPT-4 수준 성능에 이 가격은 상상도 못 할 수준이었다. 개발자 입장에서는 지금이 AI 모델 선택의 골든타임이다.

    Gemini 3.1 Flash-Lite — 가장 저렴한 고성능 모델의 등장

    Google이 2026년 3월 3일 공개한 Gemini 3.1 Flash-Lite는 전작(Gemini 2.5 Flash) 대비 세 가지가 달라졌다.

    • 가격: 입력 $0.25/1M 토큰, 출력 $1.50/1M 토큰 (2.5 Flash 대비 각각 17%, 40% 인하)
    • 속도: 첫 응답 토큰 생성 속도(TTFT) 2.5배 향상, 출력 속도 45% 향상
    • 접근성: Google AI Studio에서 개발자 즉시 사용 가능, Vertex AI로 기업 배포 지원

    실측 기준으로 초당 약 190~380 토큰을 출력한다. 실시간 챗봇, 대량 문서 처리, 반복 자동화 작업에 최적화된 모델이다.

    출처: Google 공식 블로그 — Gemini 3.1 Flash-Lite 출시, Artificial Analysis — 성능 벤치마크

    2026년 주요 AI 모델 가격 비교

    지금 개발자가 알아야 할 주요 모델의 API 가격을 정리했다. (2026년 3월 기준, 1M 토큰당 달러)

    모델 입력 출력 특징
    Gemini 3.1 Flash-Lite $0.25 $1.50 최저가·고속, 대량 처리 최적
    Gemini 2.5 Flash $0.30 $2.50 Flash-Lite 대비 추론 강화
    Claude Sonnet 4.6 $3.00 $15.00 코딩·분석 최강, Claude Code ARR $2.5B
    GPT-5.4 (API) $2.50 $10.00 멀티모달·함수 호출 강점

    가격 차이는 최대 12배에 달한다. 동일한 작업에 어떤 모델을 쓰느냐에 따라 월 API 비용이 수십 배 달라질 수 있다.

    출처: Google AI 개발자 — Gemini API 공식 가격표, MetaCTO — Gemini 가격 완전 가이드

    어떤 모델을 언제 써야 하나 — 실용 선택 가이드

    모든 작업에 비싼 모델이 필요하지 않다. 용도별로 모델을 나눠 쓰는 ‘계층화 전략’이 비용 최적화의 핵심이다.

    • 대량 자동화·분류·요약 → Gemini 3.1 Flash-Lite ($0.25/1M)
      고객 리뷰 감성 분석, 대량 문서 태깅, 이메일 자동 분류 등에 적합
    • 챗봇·고객 응대 → GPT-5.4 또는 Gemini 2.5 Flash
      자연스러운 대화와 함수 호출이 필요한 경우
    • 코딩·복잡한 추론 → Claude Sonnet 4.6
      가격이 높지만 코드 품질과 정확도에서 압도적 우위. 개발자 도구, Claude Code 연동

    스타트업이라면 Flash-Lite로 프로토타입을 만들고, 실제 서비스에서 정확도가 부족한 부분만 Sonnet이나 GPT-5.4로 교체하는 방식을 추천한다.

    그래서 한국 개발자·스타트업에게 뭐가 달라지나

    AI API 비용이 낮아진다는 것은 한국 스타트업에게 진입 장벽 하락을 의미한다. 6개월 전만 해도 AI 기능을 서비스에 넣으면 API 비용이 수백~수천만 원씩 나오는 경우가 있었다. Gemini 3.1 Flash-Lite 수준이면 같은 규모의 서비스를 10분의 1 이하 비용으로 운영할 수 있다.

    반대로 이 가격에서는 AI 기능 자체가 차별화 요소가 되기 어렵다. 모든 경쟁사도 동일한 저가 모델을 쓸 수 있기 때문이다. 결국 어떤 데이터와 프롬프트 엔지니어링으로 차별화하느냐가 핵심 역량이 된다.

    지금 바로 할 수 있는 것

    1. Gemini 3.1 Flash-Lite 무료 체험Google AI Studio에서 API 키 없이 바로 테스트해볼 수 있다.
    2. 현재 API 비용 감사 — 지금 쓰는 AI API 청구서를 꺼내 어떤 작업에 얼마를 쓰는지 분석한다. 대량 처리 작업이 있다면 Flash-Lite로 교체해보자.
    3. 모델 벤치마크 비교Artificial Analysis에서 최신 모델별 속도·정확도·가격 비교를 무료로 확인할 수 있다.

    관련 글


    출처: Google 공식 블로그 · Google AI 가격표 · Artificial Analysis · Build Fast with AI

    대표이미지 출처: Google 공식 블로그 (공식 이미지)

  • 갤럭시 S26에서 Gemini가 앱을 직접 조작한다: 한국 동시 출시, 지금 쓸 수 있는 것

    말 한마디로 배달을 시킨다

    2026년 3월 12일, 갤럭시 S26 사용자들이 처음 경험했다. Gemini에게 “스타벅스에서 아메리카노 한 잔 주문해줘”라고 말하면, Gemini가 스타벅스 앱을 열고, 메뉴를 선택하고, 주소를 입력하고, 결제 직전 화면까지 진행한 뒤 멈춘다. 사용자가 확인 버튼을 누르면 끝이다.

    이것이 Gemini 스크린 자동화다. AI가 앱을 대신 조작한다. 이 기능의 첫 출시 국가는 미국과 한국, 두 나라뿐이다.

    어떻게 작동하는가

    기술적으로는 AI가 화면을 보고 터치를 흉내낸다. 가상 창(virtual window) 안에서 앱이 실행되고, Gemini가 각 단계를 진행하는 과정이 사용자 눈에 보인다. 중간에 멈추거나 직접 개입하는 것도 언제든 가능하다.

    작동 조건이 있다. One UI 8.5와 2026년 2월 보안 패치가 설치돼 있어야 한다. 개인 Google 계정만 지원된다. 직장·학교 계정은 제외된다. 현재 영어만 지원된다.

    출시 시점에 지원되는 앱은 Uber, Lyft, DoorDash, Grubhub, Uber Eats, Starbucks다. Instacart는 곧 추가 예정이다. AppFunctions라는 개발자 프레임워크가 열려 있어, 향후 더 많은 앱이 지원될 수 있다.

    사용 한도와 요금

    무제한이 아니다. 구글은 일일 사용 한도를 플랜별로 나눴다.

    • 무료: 하루 5회
    • Google AI Plus (월 $7.99): 하루 12회
    • Google AI Pro (월 $19.99): 하루 20회
    • Google AI Ultra (월 $249.99): 하루 120회

    일반 사용자라면 하루 5회면 충분하다. 점심 배달, 퇴근길 택시, 저녁 커피—세 번이면 하루 쓸 만한 기능을 커버한다. 무거운 사용자라면 AI Pro를 고려할 만하다.

    안전 장치는 어디에 있는가

    결제는 항상 사람이 확인한다. Gemini는 결제 직전 단계에서 반드시 멈추고 사용자 승인을 요청한다. AI가 돈을 직접 쓰는 구조가 아니다. 실수로 원하지 않는 주문이 완료되는 일은 설계상 불가능하다.

    작업 중 언제든 중단 가능하고, 사용자가 직접 개입해 수정할 수도 있다. Gemini가 판단하기 어려운 경우엔 사용자에게 결정을 넘긴다.

    갤럭시 S26이 없어도 되는가

    Pixel 10도 3월 말 같은 기능을 받았다. 단, Pixel 10 버전은 현재 미국만 지원이다. 한국에서 이 기능을 쓰려면 갤럭시 S26 시리즈가 필요하다.

    S25나 이전 기기는 현재 미지원이다. 향후 One UI 업데이트로 확장될 가능성은 있지만 공식 일정은 없다.

    그래서 얼마나 실용적인가

    솔직하게 말하면, 지금 당장은 “쓸 수 있는” 수준이다. 지원 앱이 아직 미국 기반 서비스 중심이다. 한국에서 쿠팡이츠, 배달의민족, 카카오T에서 쓸 수 없다는 뜻이다. 그러나 AppFunctions 프레임워크가 열려 있는 만큼, 국내 앱 지원이 추가되면 실용성이 크게 올라간다.

    더 중요한 포인트는 방향이다. 스마트폰 AI가 “답변해주는 것”에서 “대신 해주는 것”으로 바뀌는 첫 번째 실제 사례다. 갤럭시 S26으로 직접 써볼 수 있다.

    지금 바로 할 수 있는 것

    • 갤럭시 S26 사용자: 설정 → 소프트웨어 업데이트에서 One UI 8.5 + 2026년 2월 패치 확인 후 설치. Gemini 앱을 열고 “Uber로 [목적지] 가줘”로 테스트 시작.
    • 구글 계정 플랜 확인: 현재 무료 계정이라면 하루 5회 한도 안에서 충분히 활용 가능. 하루 20회 이상이 필요한 경우에만 AI Pro($19.99/월) 업그레이드 검토.
    • 갤럭시 S26이 없는 경우: AppFunctions 개발자 문서 확인(developer.android.com). 자신의 앱에 Gemini 스크린 자동화 연동을 준비해두면 지원 앱 리스트 확장 시 바로 활용 가능.

    관련 글


    출처

  • 구글 워크스페이스에 Gemini가 들어왔다: Docs·Sheets·Slides·Drive 전면 AI 업그레이드

    구글이 워크스페이스를 통째로 바꿨다

    2026년 3월 10일, 구글이 Google Workspace 전체에 Gemini를 깊게 심었다. Docs, Sheets, Slides, Drive — 네 개 앱이 동시에 업데이트됐다. 단순한 기능 추가가 아니다. Gmail, Drive, Google Chat, 캘린더에 흩어진 데이터를 Gemini가 가로질러 읽고, 완성된 문서를 뽑아내는 구조가 됐다.

    Microsoft가 Copilot Wave 2·3으로 Excel·Teams·Outlook을 AI화하는 동안, 구글은 조용히 같은 걸 했다. 지금 그 결과물이 베타로 풀리고 있다.

    앱별로 무엇이 달라졌나

    Google Docs — “회의록으로 뉴스레터 써줘”

    이제 Docs에서 이렇게 입력할 수 있다. “1월 HOA 회의록 파일과 다음 달 이벤트 목록으로 뉴스레터 초안 만들어줘.” Gemini가 Drive에서 두 파일을 찾아 읽고, 완성된 뉴스레터 초안을 Docs 안에 생성한다. 파일을 열어 복사할 필요가 없다.

    Match Writing Style 기능도 실용적이다. 여러 사람이 작성한 문서에서 문체가 뒤섞인 경우, Gemini가 전체 문서의 어조와 스타일을 분석해 통일시킨다. 팀 문서 편집에서 반복되던 수작업이다.

    Google Sheets — 스프레드시트를 말로 만든다

    Sheets의 Fill with Gemini는 세 가지를 한다. 첫째, 자연어 지시로 스프레드시트 전체를 생성한다. “지난달 팀 지출 내역 이메일 기반으로 예산 정리 시트 만들어줘”가 작동한다. 둘째, 데이터를 자동 분류·요약한다. 셋째, Google Search에서 실시간 정보를 당겨 셀을 채운다.

    구글 주장으로는 수동 데이터 입력 대비 최대 9배 빠르다. 공개 벤치마크 SpreadsheetBench에서 70.48% 성공률을 기록했다. 실제 업무 수준의 스프레드시트 작업 기준이다.

    Google Slides — 스케치가 차트가 된다

    슬라이드 생성 시 Gemini가 기존 슬라이드 스타일을 읽고 디자인을 맞춘다. 새 슬라이드가 기존 덱과 동떨어지지 않는다. 더 실용적인 기능은 따로 있다. 브레인스토밍 테이블이나 스케치를 입력하면 편집 가능한 차트와 다이어그램으로 변환된다. 정리된 표를 보기 좋은 차트로 만드는 데 쓰던 시간이 줄어든다.

    Google Drive — 파일 검색이 AI 답변으로

    Drive에서 자연어로 검색하면 결과 목록 위에 AI Overview가 뜬다. Google 검색에서 쓰는 그것과 같은 방식인데, 범위가 내 Drive 파일로 한정된다. 파일 출처가 인용된다. “지난 분기 고객사 계약서에서 위약금 조항 찾아줘” 수준의 질의가 가능해진다.

    그래서 한국 직장인에게 의미하는 것

    이 업데이트의 핵심은 앱 간 데이터 장벽 제거다. 지금까지 Google Workspace 사용자는 이메일에서 정보를 복사해 문서에 붙이고, 그걸 다시 슬라이드로 옮기는 수작업을 반복했다. Gemini가 이 이동 경로를 대신한다.

    한국 직장인이 많이 쓰는 워크플로에 직접 적용된다. 주간 보고서 초안 작성, 회의 후 액션 아이템 정리, 팀 예산 현황 정리가 주요 대상이다. Google Workspace를 쓰는 스타트업, IT 기업, 외국계 회사에서 즉시 체감할 수 있다.

    비교 대상은 Microsoft 365 Copilot이다. Copilot도 같은 방향이지만, Google Workspace 사용자는 별도 마이그레이션 없이 지금 쓰는 툴에서 같은 경험을 얻는다. 어느 쪽을 쓰든 결론은 같다. 문서 작업의 처음 초안은 이제 사람이 직접 치지 않아도 된다.

    지금 바로 할 수 있는 것

    • Google AI Pro/Ultra 구독자: 지금 Google Docs를 열고 “Help me write” 버튼 클릭. Drive 파일을 @멘션으로 연결해 문서 초안 생성 테스트. 베타 기능은 구독 플랜에서 자동 활성화돼 있다.
    • Google Workspace 무료/Basic 사용자: AI Pro 플랜(월 $19.99, 한국 기준)으로 업그레이드 시 이 기능 포함. 업무 자동화 효과와 구독 비용을 비교해 판단.
    • Microsoft 365 vs Google Workspace 선택 중인 팀: 두 플랫폼의 AI 기능이 사실상 동등 수준에 도달했다. 현재 더 많이 쓰는 쪽을 유지하면서 AI 기능을 먼저 써보는 것이 현실적이다.

    관련 글


    출처

  • GPT-5.4 vs Gemini vs Copilot vs 시리: AI 슈퍼앱 하나만 써야 한다면?

    GPT-5.4 vs Gemini vs Copilot vs 시리: AI 슈퍼앱 하나만 써야 한다면?

    ChatGPT로 시작해서, 검색은 Perplexity, 코딩은 Cursor, 일정은 Copilot — 이렇게 AI 툴을 여러 개 쓰는 시대가 끝나가고 있다. 2026년, 빅테크 4사가 각자의 AI를 ‘하나로 모든 걸 해결하는 슈퍼앱’으로 키우겠다고 선언했다. GPT-5.4, Gemini 3.1 Pro, Microsoft Copilot, Apple 시리 2.0 — 하나만 써야 한다면 어떻게 고를까.

    GPT-5.4: 에이전트 자동화의 현재 1위

    OpenAI가 2026년 3월 출시한 GPT-5.4는 단순한 답변 생성을 넘어 컴퓨터를 직접 조작하는 에이전트 기능이 핵심이다. Computer Use API로 브라우저·앱을 스스로 실행하고, 멀티스텝 워크플로를 자동 처리한다. Thinking 모드에서는 복잡한 문제를 사전에 계획하고 사용자가 중간에 방향을 수정할 수 있다. 컨텍스트 창은 100만 토큰으로 긴 문서 분석도 가능하다.

    요금은 무료 플랜은 GPT-5.3까지만, Plus($20/월)부터 GPT-5.4 Thinking 접근이 가능하다. GitHub Copilot, VS Code와의 통합도 가장 성숙하다.

    출처: 2026년 AI 어시스턴트 최신 비교 | 주경야근

    Gemini 3.1 Pro: 컨텍스트 200만 토큰의 압도적 처리량

    구글이 2026년 2월 출시한 Gemini 3.1 Pro의 가장 큰 무기는 200만 토큰 컨텍스트 창이다. GPT-5.4의 두 배 분량으로, 코드베이스 전체·긴 계약서·대용량 보고서를 한 번에 처리할 수 있다. ARC-AGI-2 추론 벤치마크에서 77.1%로 전작 대비 2배 이상 향상됐다.

    단점은 초기 응답 속도다. 현재 Preview 상태라 실시간 챗봇·어시스턴트 용도로는 체감 속도가 느리다. 반면 Google Workspace, Firebase, Android 생태계와 자연스럽게 연동된다. Gemini Code Assist는 무료로 제공돼 Copilot 대안으로도 주목받고 있다.

    출처: GPT-5.4 vs Gemini 3.1 Pro 비교 (March 2026) | LaoZhang AI Blog

    Microsoft Copilot: Office 생태계 안에서 가장 강하다

    Copilot Wave 3(2026년 3월)부터 Copilot은 단순 초안 작성을 넘어 회의 일정·이메일·문서 작성을 직접 실행하는 에이전트로 진화했다. Cowork 기능은 Outlook·Teams·Excel을 넘나들며 멀티스텝 업무를 자율 처리한다. Word·Excel·PowerPoint 안에서 에이전트 방식으로 문서를 완성하는 경험은 Office 유저에게 가장 자연스럽다.

    Microsoft 365 구독자라면 추가 비용 없이 Copilot 기본 기능을 쓸 수 있다. 단, Cowork는 현재 Frontier 프로그램(Early Access) 단계다.

    출처: Claude vs ChatGPT vs Copilot vs Gemini: 2026 Enterprise Guide | IntuitionLabs

    시리 2.0: 아직은 ‘예정’이지만 가장 기대되는 변화

    Apple은 WWDC 2026(6월 8일)에서 Gemini 1.2조 파라미터 모델을 탑재한 시리 전면 재설계를 발표할 예정이다. 화면 인식(Onscreen Awareness), 전체 앱 연동 에이전트, 독립 시리 앱이 핵심이다. 아직 출시 전이라 실사용 비교는 불가능하지만, 아이폰 사용자 16억 명을 배경으로 한 잠재력은 가장 크다.

    단, iOS 27 업데이트 시점인 2026년 가을 이전까지는 기존 시리 수준에 머문다.

    출처: Apple WWDC 2026 | Tom’s Guide

    So What: 하나만 골라야 한다면

    현실에서 “하나만” 쓰는 것이 가장 효율적인 경우는 드물다. 하지만 주력 툴 하나를 정하고 나머지를 보조로 쓰는 전략은 유효하다.

    • Office 365를 이미 쓰는 직장인 → Copilot이 가장 자연스러운 확장
    • 코딩·개발이 주 업무 → GPT-5.4 (에이전트 자동화, IDE 통합)
    • 긴 문서·대용량 데이터 분석 → Gemini 3.1 Pro (200만 토큰 컨텍스트)
    • 아이폰 유저, 모바일 중심 → 2026년 가을 시리 2.0 출시 후 재평가

    2026년의 정답은 “하나의 슈퍼앱”이 아니라 주력 1개 + 보조 1~2개의 멀티 AI 워크플로다.

    지금 바로 할 수 있는 것

    1. 무료로 비교 체험 — ChatGPT(무료), Gemini(무료), Copilot(Microsoft 계정 무료)로 같은 질문 던져보기
    2. Gemini Code Assist 설치 — VS Code 확장에서 무료로 설치, Copilot 대비 체감 비교
    3. WWDC 2026 캘린더 등록 — 6월 8일 시리 2.0 발표, apple.com/apple-events

    관련 글

  • 시리가 드디어 달라진다: 애플 WWDC 2026, Gemini 탑재 시리 2.0 완전 분석

    시리가 드디어 달라진다: 애플 WWDC 2026, Gemini 탑재 시리 2.0 완전 분석

    “시리야, 이거 해줘”를 외쳤다가 실망한 경험, 누구나 있을 것이다. ChatGPT, Gemini, Claude가 자연스러운 대화로 업무를 처리하는 동안, 시리는 여전히 “죄송해요, 잘 모르겠어요”를 반복했다. 애플이 3월 25일 WWDC 2026 개최를 공식 발표하면서 이 오랜 오명을 씻을 카드를 꺼냈다. 핵심은 구글 Gemini 탑재 시리 전면 재설계다.

    WWDC 2026: 언제, 무엇이 달라지나

    WWDC 2026은 6월 8일부터 12일까지 온라인으로 진행되며, 6월 8일 애플파크에서 키노트가 열린다. 애플이 컨퍼런스 발표와 동시에 “AI 혁신”을 명시적으로 예고한 것은 이례적이다. iOS 27, iPadOS 27, macOS 27 등 전 운영체제 업데이트와 함께 시리 전면 개편이 핵심 발표로 예상된다.

    출처: WWDC 2026 to Showcase Apple’s AI Advancements | MacRumors

    시리 2.0: Gemini 1.2조 파라미터를 품다

    블룸버그에 따르면 애플은 구글에 연간 1조 원(약 10억 달러) 이상을 지불하며 1.2조 파라미터 규모의 커스텀 Gemini 모델을 시리에 탑재하는 계약을 맺었다. 코드명 프로젝트 캄포스(Project Campos)로 불리는 이 업데이트는 시리를 ChatGPT·Gemini와 경쟁 가능한 수준으로 끌어올리는 게 목표다.

    주요 신기능은 세 가지다. 첫째, 전체 앱 연동 Ask Siri 에이전트 — 이메일·캘린더·메시지를 넘나들며 직접 실행한다. 둘째, 화면 인식(Onscreen Awareness) — 지금 보고 있는 화면을 시리가 이해하고 문맥에 맞게 답한다. 셋째, 독립 시리 앱 — 챗봇처럼 대화 기록을 저장하고 이어서 쓸 수 있는 전용 앱이 출시된다.

    출처: Apple’s WWDC 2026 conference kicks off in June | Tom’s Guide

    개발자도 달라진다: Core AI 등장

    기존 AI 개발 프레임워크였던 Core ML이 Core AI로 대체된다. 대형 언어 모델과 이미지 생성 모델을 디바이스에서 직접 실행할 수 있도록 설계됐다. Swift 언어 업데이트도 함께 발표되어, 앱에 AI 기능을 추가하는 진입 장벽이 크게 낮아질 전망이다.

    출처: WWDC 2026 to introduce Core AI as replacement for Core ML | AppleInsider

    프라이버시: 애플만의 차별점

    Gemini 모델을 쓰면서도 애플은 온디바이스 처리와 Private Cloud Compute를 유지한다. 대화 내용이 구글 서버로 넘어가지 않는 구조다. ChatGPT·Gemini가 클라우드에 데이터를 올리는 것과 달리, 보안이 민감한 업무에서도 시리를 사용할 수 있다는 것이 애플의 핵심 주장이다.

    출처: “이번엔 진짜” 애플, WWDC 2026 개최 일정 발표 | AI매터스

    So What: 아이폰 쓰는 한국 유저에게 뭐가 달라지나

    지금까지는 시리가 너무 답답해서 ChatGPT 앱을 따로 열어야 했다. 시리 2.0이 제대로 구현되면 앱 전환 없이 아이폰 안에서 모든 AI 작업이 가능해진다. 특히 아이폰 점유율이 높은 한국에서 영향이 크다. 단, WWDC에서 발표되더라도 실제 배포는 iOS 27 업데이트인 2026년 가을이 될 가능성이 높다.

    지금 바로 할 수 있는 것

    1. WWDC 2026 키노트 일정 캘린더 등록 — 6월 8일 한국 시간 기준 오전 2시(예상), apple.com/apple-events에서 라이브 스트리밍 제공
    2. 현재 Apple Intelligence 기능 미리 써보기 — 아이폰 16 이상에서 설정 → Apple Intelligence & Siri → 활성화
    3. 비교 체험 — 현재 시리 vs ChatGPT vs Gemini 앱 동일 질문으로 비교해두면 6월 업데이트 후 차이가 명확히 보임