[카테고리:] AI툴

  • 엑셀·Teams·Outlook이 달라진다: Microsoft 365 Copilot Wave 2 직장인 완전 정복 가이드

    엑셀·Teams·Outlook이 달라진다: Microsoft 365 Copilot Wave 2 직장인 완전 정복 가이드

    엑셀로 데이터를 분석하다가 복잡한 수식에서 막힌 경험, 누구나 있을 것이다. Teams 회의가 끝나고 회의록을 직접 정리하느라 시간을 낭비한 경험도 마찬가지다. Microsoft 365 Copilot Wave 2가 이 반복적인 업무들을 AI로 대체하기 시작했다. 직장인이라면 지금 당장 알아야 할 세 가지 핵심 기능을 정리했다.

    엑셀에서 Python을 코딩 없이 쓴다: Python in Excel

    Wave 2의 가장 강력한 기능이다. Python은 데이터 분석·머신러닝의 표준 언어지만, 개발자가 아닌 직장인에게는 진입 장벽이 높았다. 이제 엑셀 안에서 원하는 분석을 한국어로 설명하면 Copilot이 Python 코드를 자동 생성해 즉시 실행한다.

    히트맵, 예측 분석, 데이터 클렌징, 머신러닝 모델 적용까지 코드 한 줄 없이 가능하다. 금융·물류·제조업처럼 데이터가 많은 업종에서 특히 강력하다. Python 코드는 Microsoft 클라우드 보안 컨테이너 안에서 실행되어 데이터가 외부로 유출되지 않는다.

    출처: Microsoft 365 Copilot Wave 2: Pages, Python in Excel, and agents | Microsoft 365 Blog

    Copilot Pages: AI 답변이 팀 협업 문서가 된다

    기존에는 Copilot에게 물어본 답변이 채팅창에서 사라지면 끝이었다. Copilot Pages는 이 흐름을 바꾼다. Copilot Chat의 답변을 버튼 하나로 영구 저장하고, 팀원과 실시간으로 함께 편집하는 공유 문서로 전환할 수 있다.

    만들어진 페이지는 Teams 채팅, Outlook 메일에 바로 첨부할 수 있다. 리서치 결과를 정리한 뒤 팀에 공유하거나, 회의 준비 자료를 AI로 뽑아 동료와 함께 다듬는 흐름이 자연스럽게 이어진다. Microsoft Entra 계정이 있는 4억 명 이상의 사용자가 접근할 수 있다.

    출처: New Microsoft Copilot 365 Wave 2 includes agents and Pages | TechTarget

    Agent Mode: Copilot이 스스로 파일을 수정한다

    2026년 1월부터 Word·Excel·PowerPoint에 Agent Mode가 정식 출시됐다. 기존 Copilot이 제안을 하면 사람이 직접 적용해야 했다면, Agent Mode는 다르다. 작업 지시를 내리면 Copilot이 계획을 세우고, 파일을 직접 수정하고, 결과를 검토하고, 오류를 스스로 수정하며 완성도를 높인다.

    예를 들어 “이 보고서를 임원용으로 1페이지로 요약하고, 핵심 수치를 표로 만들어줘”라고 하면 Copilot이 전체 작업을 순서대로 처리한다. Outlook에서는 자동 RSVP, 이메일 실시간 수정, 음성으로 받은편지함 관리까지 가능해졌다.

    출처: What’s New in Microsoft 365 Copilot | January 2026 | Microsoft Community Hub

    So What: 한국 직장인에게 뭐가 달라지나

    Microsoft 365(구 Office 365)는 한국 기업 환경에서 여전히 표준 업무 도구다. 엑셀·Teams·Outlook을 이미 쓰고 있다면 추가 툴 학습 없이 AI 기능을 바로 적용할 수 있다는 점이 핵심이다. 단, 주의할 점이 있다. 2026년 4월 15일부터 Word·Excel·PowerPoint 내 Copilot 전체 기능은 Microsoft 365 Copilot 라이선스(월 약 40달러) 유료 구독자에게만 제공된다. 지금이 무료로 기능을 체험해볼 마지막 시기다.

    지금 바로 할 수 있는 것

    1. Copilot 무료 체험 — Microsoft 365 계정으로 m365.cloud.microsoft 접속 후 Copilot Chat에서 Python in Excel 기능 테스트
    2. Teams 회의록 자동화 설정 — Teams 회의 시작 전 Copilot 아이콘 클릭 → ‘회의 기록 켜기’ 활성화 → 회의 종료 후 자동 요약 확인
    3. 4월 15일 전 라이선스 검토 — IT 담당자 또는 관리자에게 Microsoft 365 Copilot 라이선스 도입 필요 여부 확인 요청

    대표이미지 출처: Microsoft 365 공식 블로그

  • 시리가 드디어 달라진다: 애플 WWDC 2026, Gemini 탑재 시리 2.0 완전 분석

    시리가 드디어 달라진다: 애플 WWDC 2026, Gemini 탑재 시리 2.0 완전 분석

    “시리야, 이거 해줘”를 외쳤다가 실망한 경험, 누구나 있을 것이다. ChatGPT, Gemini, Claude가 자연스러운 대화로 업무를 처리하는 동안, 시리는 여전히 “죄송해요, 잘 모르겠어요”를 반복했다. 애플이 3월 25일 WWDC 2026 개최를 공식 발표하면서 이 오랜 오명을 씻을 카드를 꺼냈다. 핵심은 구글 Gemini 탑재 시리 전면 재설계다.

    WWDC 2026: 언제, 무엇이 달라지나

    WWDC 2026은 6월 8일부터 12일까지 온라인으로 진행되며, 6월 8일 애플파크에서 키노트가 열린다. 애플이 컨퍼런스 발표와 동시에 “AI 혁신”을 명시적으로 예고한 것은 이례적이다. iOS 27, iPadOS 27, macOS 27 등 전 운영체제 업데이트와 함께 시리 전면 개편이 핵심 발표로 예상된다.

    출처: WWDC 2026 to Showcase Apple’s AI Advancements | MacRumors

    시리 2.0: Gemini 1.2조 파라미터를 품다

    블룸버그에 따르면 애플은 구글에 연간 1조 원(약 10억 달러) 이상을 지불하며 1.2조 파라미터 규모의 커스텀 Gemini 모델을 시리에 탑재하는 계약을 맺었다. 코드명 프로젝트 캄포스(Project Campos)로 불리는 이 업데이트는 시리를 ChatGPT·Gemini와 경쟁 가능한 수준으로 끌어올리는 게 목표다.

    주요 신기능은 세 가지다. 첫째, 전체 앱 연동 Ask Siri 에이전트 — 이메일·캘린더·메시지를 넘나들며 직접 실행한다. 둘째, 화면 인식(Onscreen Awareness) — 지금 보고 있는 화면을 시리가 이해하고 문맥에 맞게 답한다. 셋째, 독립 시리 앱 — 챗봇처럼 대화 기록을 저장하고 이어서 쓸 수 있는 전용 앱이 출시된다.

    출처: Apple’s WWDC 2026 conference kicks off in June | Tom’s Guide

    개발자도 달라진다: Core AI 등장

    기존 AI 개발 프레임워크였던 Core ML이 Core AI로 대체된다. 대형 언어 모델과 이미지 생성 모델을 디바이스에서 직접 실행할 수 있도록 설계됐다. Swift 언어 업데이트도 함께 발표되어, 앱에 AI 기능을 추가하는 진입 장벽이 크게 낮아질 전망이다.

    출처: WWDC 2026 to introduce Core AI as replacement for Core ML | AppleInsider

    프라이버시: 애플만의 차별점

    Gemini 모델을 쓰면서도 애플은 온디바이스 처리와 Private Cloud Compute를 유지한다. 대화 내용이 구글 서버로 넘어가지 않는 구조다. ChatGPT·Gemini가 클라우드에 데이터를 올리는 것과 달리, 보안이 민감한 업무에서도 시리를 사용할 수 있다는 것이 애플의 핵심 주장이다.

    출처: “이번엔 진짜” 애플, WWDC 2026 개최 일정 발표 | AI매터스

    So What: 아이폰 쓰는 한국 유저에게 뭐가 달라지나

    지금까지는 시리가 너무 답답해서 ChatGPT 앱을 따로 열어야 했다. 시리 2.0이 제대로 구현되면 앱 전환 없이 아이폰 안에서 모든 AI 작업이 가능해진다. 특히 아이폰 점유율이 높은 한국에서 영향이 크다. 단, WWDC에서 발표되더라도 실제 배포는 iOS 27 업데이트인 2026년 가을이 될 가능성이 높다.

    지금 바로 할 수 있는 것

    1. WWDC 2026 키노트 일정 캘린더 등록 — 6월 8일 한국 시간 기준 오전 2시(예상), apple.com/apple-events에서 라이브 스트리밍 제공
    2. 현재 Apple Intelligence 기능 미리 써보기 — 아이폰 16 이상에서 설정 → Apple Intelligence & Siri → 활성화
    3. 비교 체험 — 현재 시리 vs ChatGPT vs Gemini 앱 동일 질문으로 비교해두면 6월 업데이트 후 차이가 명확히 보임
  • 문서를 AI 팟캐스트로 바꾼다: Google NotebookLM 완전 정복 [2026 최신]

    문서를 AI 팟캐스트로 바꾼다: Google NotebookLM 완전 정복 [2026 최신]

    회의록, PDF 보고서, 긴 아티클 — 읽어야 하는 건 알지만 시간이 없다. Google NotebookLM은 이 자료들을 AI 두 명이 대화하는 팟캐스트 형식으로 자동 변환해준다. 2026년 3월 대규모 업데이트로 한국어 지원, 실시간 인터랙션, 영상 생성까지 더해졌다. 무료로 쓸 수 있고, 구글 계정만 있으면 된다. 직장인·학생 모두에게 지금 당장 써볼 이유가 충분하다.

    NotebookLM이란? 한 줄 정의

    NotebookLM은 내가 올린 자료만을 기반으로 동작하는 AI 리서치 도구다. 일반 챗GPT와 다른 결정적인 차이가 있다. 인터넷 전체가 아닌, 내가 업로드한 문서 안에서만 답한다. 그래서 환각(hallucination)이 훨씬 적고, 출처 인용이 정확하다. PDF, 구글독스, 웹페이지, 유튜브 링크, 오디오 파일까지 소스로 넣을 수 있다.

    Audio Overviews: 내 문서가 팟캐스트가 된다

    핵심 기능은 Audio Overviews다. 자료를 업로드하면 AI 진행자 두 명이 해당 내용을 요약·해설·토론하는 팟캐스트를 자동 생성한다. 생성 시간은 1~2분. 분량은 보통 10~15분짜리 오디오다.

    30페이지짜리 보고서도 출퇴근길 지하철 안에서 소화할 수 있다. 영어 문서도 한국어 팟캐스트로 변환이 된다. 현재 한국어를 포함한 50개 이상의 언어를 지원하며, 설정 방법은 우측 상단 메뉴 → 설정 → 출력 언어에서 한국어를 선택하면 끝이다.

    커스터마이징도 가능하다. 생성 전 연필 아이콘을 클릭하면 이 부분에 집중해줘, 초급자 기준으로 설명해줘 같은 지시를 추가할 수 있다. 내 청중에 맞는 설명 수준으로 조정이 된다.

    출처: 노트북LM의 인기 기능 AI 음성 개요를 이제 한국어로 이용해 보세요 | Google 블로그

    인터랙티브 모드: 듣다가 끼어들 수 있다

    단순히 듣는 것에서 한 단계 더 나아간다. 인터랙티브 모드를 켜면 팟캐스트를 듣다가 Join 버튼을 눌러 대화에 참여할 수 있다. AI 진행자가 대화를 멈추고 내 질문을 받는다. 음성이나 텍스트로 질문하면 업로드한 자료를 기반으로 즉시 답변하고, 이후 팟캐스트를 이어서 진행한다.

    복잡한 기술 문서나 계약서를 검토할 때, 모르는 개념이 나왔을 때 바로 물어볼 수 있다는 점이 강력하다. 기존에는 문서를 읽다 막히면 별도로 검색하거나 챗GPT에 붙여넣기 해야 했다. 이제는 듣는 중에 그 자리에서 해결된다.

    다만 인터랙티브 모드는 현재 영어 환경에서만 완전히 작동한다. 한국어 사용자는 한국어 Audio Overview를 생성한 뒤 인터랙션은 영어로 질문하는 방식으로 활용 가능하다.

    출처: Audio Overview Interactive Mode | Futurepedia

    2026년 3월 최신 업데이트: 영상까지 만들어준다

    2026년 3월 20일 업데이트로 세 가지 핵심 기능이 추가됐다.

    첫째, Cinematic Video Overviews다. 자료를 기반으로 애니메이션과 내레이션이 결합된 영상을 자동 생성한다. 단순 슬라이드쇼가 아닌, Gemini 모델이 수백 가지 구조·스타일 결정을 내려 스토리 중심의 몰입형 영상을 만들어낸다. 강의 자료나 발표 준비에 바로 쓸 수 있다.

    둘째, 대화 기록 자동 저장이다. 세션을 닫아도 이전 대화가 유지된다. 공유 노트북에서는 내 대화가 나에게만 보여 프라이버시도 확보된다.

    셋째, 채팅에서 바로 Audio·Video Overview 생성이다. 대화 중 원하는 시점에 즉시 오버뷰로 변환할 수 있다. 챗에서 원하는 내용을 추려낸 뒤 이걸 팟캐스트로 만들어줘가 가능해진 셈이다.

    출처: Google Workspace Updates: New ways to customize and interact with your content in NotebookLM

    So What: 한국 직장인에게 뭐가 달라지나

    지금까지 긴 문서를 파악하는 방법은 직접 읽거나, 요약을 요청하는 두 가지뿐이었다. NotebookLM은 세 번째 방법을 제시한다. 들으면서 질문한다. 이동 시간, 운동 시간, 집안일 하는 시간이 전부 업무 인풋이 된다. 영어 논문이나 해외 보고서도 한국어 팟캐스트로 변환되니 언어 장벽도 낮아진다.

    특히 개발자·기획자·연구직에게는 방대한 문서를 빠르게 파악해야 할 때, 회의 전 빠른 컨텍스트 확보에 즉각적으로 쓸 수 있다. 무료인데 쓰지 않을 이유가 없다.

    지금 바로 할 수 있는 것

    1. 무료로 바로 시작notebooklm.google 접속 후 구글 계정으로 로그인 (완전 무료)
    2. 한국어 설정 — 우측 상단 설정 → 출력 언어 → 한국어 선택
    3. 첫 테스트 — 읽기 부담스러운 PDF 하나 업로드 → Audio Overview 생성 → 출퇴근길 청취
  • AI 하나로는 부족하다: Perplexity Computer, 19개 모델을 동시에 쓰는 시대 열었다

    AI 하나로는 부족하다: Perplexity Computer, 19개 모델을 동시에 쓰는 시대 열었다

    ChatGPT를 쓰다가 Claude로 넘어가고, 검색은 따로 Perplexity로 하는 경험, 누구나 한 번쯤 있을 것이다. AI 툴마다 잘하는 게 다르기 때문이다. Perplexity는 이 불편함을 끝내겠다고 나섰다. 2026년 2월 출시된 Perplexity Computer는 19개의 AI 모델을 하나의 인터페이스에서 자동으로 골라 쓰는 범용 에이전트다.

    19개 모델, 자동으로 알아서 고른다

    Perplexity Computer의 핵심은 멀티모델 라우팅이다. 사용자가 작업을 요청하면, 메타 라우터가 작업 유형을 분석해 최적의 모델에 자동 배분한다. 코딩은 GPT-5.3-Codex, 딥 리서치는 Gemini 3.1 Pro, 핵심 추론은 Claude Opus 4.6, 빠른 경량 작업은 Grok이 맡는다. 어떤 모델을 써야 할지 고민할 필요가 없다.

    출처: Perplexity launches Computer AI agent that coordinates 19 models | VentureBeat

    단순 대화가 아니라 실행이 다르다

    기존 AI는 답을 알려주는 데 그쳤다. Computer는 직접 실행한다. Slack, Gmail, GitHub, Notion 등 400개 이상의 앱과 연동해 조사 → 문서 작성 → 이메일 발송까지 하나의 명령으로 처리한다. 모든 작업은 격리된 클라우드 환경에서 실행되며, 민감한 작업은 사용자 승인이 필요하다. 몇 달에 걸친 장기 워크플로도 자동 실행 가능하다.

    출처: 퍼플렉시티, 화제의 에이전트 컴퓨터 개인·기업용으로 출시 | AI타임스

    Model Council: 세 AI가 동시에 답한다

    3월 업데이트로 추가된 Model Council 기능이 주목받고 있다. 하나의 질문에 GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro가 동시에 답하고, 세 모델이 어디서 동의하고 어디서 갈리는지 한눈에 보여준다. 중요한 의사결정이나 조사 작업에서 단일 모델의 한계를 넘을 수 있는 기능이다.

    출처: Perplexity March 2026 Updates | The Agency Journal

    So What: 한국 직장인·개발자에게 뭐가 달라지나

    지금까지는 AI 툴 여러 개를 구독하고 직접 전환하며 썼다. Perplexity Computer는 그 과정을 없앤다. 특히 개발자에게는 조사 → 코딩 → 배포까지 단일 플랫폼 자동화가 현실이 됐다. 단, 월 가격이 진입 허들이다. 팀 단위라면 Enterprise Max도 검토할 만하다.

    지금 바로 할 수 있는 것

    1. 무료로 Perplexity 써보기 — 기본 검색은 무료. perplexity.ai 가입 후 리서치 워크플로 체험
    2. Pro 플랜(/월) 먼저 시작 — Computer 정식 접근 전 기능 탐색용으로 충분
    3. 공식 소개 영상 확인Perplexity 공식 블로그에서 실제 사용 사례 확인
  • AI 노트 앱 비교: Notion AI vs Obsidian AI vs mem.ai — 직장인·개발자에게 진짜 맞는 건?

    AI 노트 앱, 뭘 써야 할지 고민인가? Notion AI, Obsidian+AI 플러그인, mem.ai — 셋 다 AI 노트 앱이라 불리지만, 실제로는 완전히 다른 철학을 가진 툴이다. 어떤 상황에 어떤 앱이 맞는지 핵심만 정리한다.

    Notion AI: 팀 협업이 핵심이라면 1순위

    Notion AI는 이미 Notion을 쓰고 있다면 가장 빠르게 AI를 도입할 수 있는 선택지다. 글 요약, 번역, 초안 작성이 버튼 하나로 끝난다.

    팀 위키나 프로젝트 문서와 연동도 자연스럽다. 단, 월 추가 비용이 들고, AI가 내 전체 노트를 이해하기보다 현재 페이지 기준으로 작동한다는 한계가 있다.

    추천 대상: 팀과 함께 문서를 관리하는 직장인

    Obsidian + AI 플러그인: 지식 관리에 진심이라면

    Obsidian은 로컬 마크다운 파일 기반이라 데이터 소유권이 완전히 내 것이다. 클라우드에 올라가지 않기 때문에 보안이 중요한 개발자에게도 적합하다.

    Copilot, Smart Connections 같은 플러그인을 붙이면 수천 개의 노트를 벡터 검색하고 GPT와 대화할 수 있다. 초기 설정이 복잡하지만, 한 번 세팅하면 강력한 두 번째 뇌가 완성된다.

    추천 대상: 개발자, 연구자, 지식 관리에 진심인 사람

    mem.ai: 정리하기 싫다면 이 선택지

    mem.ai는 그냥 던져놓으면 AI가 알아서 연결해준다는 컨셉이다. 태그도, 폴더도, 구조도 필요 없다. 메모를 입력하면 AI가 관련 노트를 자동으로 연결하고, 자연어로 검색도 된다.

    반면 한국어 지원이 불완전하고, 월 .99로 가격이 높다. 영어 중심 업무 환경이라면 강력하지만, 한국어 사용자에겐 아직 한계가 있다.

    추천 대상: 영어 환경에서 일하는 사람, 자동 정리를 원하는 사람

    결국 누가 써야 할까?

    • 팀과 문서를 함께 관리한다 → Notion AI
    • 내 지식을 체계적으로 쌓고 싶다 → Obsidian + AI 플러그인
    • 정리하기 귀찮고 자동화를 원한다 → mem.ai (영어 환경 한정)

    결국 AI 노트 앱은 도구일 뿐이다. 어떤 앱을 골라도 꾸준히 기록하는 습관이 없으면 소용없다. 하지만 자신의 업무 방식에 맞는 도구를 고르면, 그 습관이 훨씬 쉽게 자리잡는다.

  • OpenCode 리뷰: GitHub 스타 12만, 오픈소스 AI 코딩 에이전트

    올해 초, AI 코딩 커뮤니티에서 소동이 있었다. Anthropic이 Claude Pro·Max 구독 토큰을 서드파티 툴에서 사용하지 못하도록 기술적으로 차단했다. 월 100~200달러를 내던 사용자들이 갑자기 기존 방식으로 쓸 수 없게 됐다.

    그 2주 동안 GitHub 스타를 1만 8천 개 더 받은 툴이 있다. OpenCode다. 논란이 사실상 최고의 마케팅이 됐다. 나는 이 소동을 지켜보면서 툴 자체가 궁금해졌다. 소란이 아니라, 실제로 쓸만한가.

    OpenCode란

    Anomaly Innovations가 개발한 오픈소스 AI 코딩 에이전트다. 터미널, IDE, 데스크톱 앱 세 가지 환경을 모두 지원한다. 2024년 말 등장 이후 빠르게 성장했다. 현재 GitHub 스타 12만 개 이상, 월간 활성 개발자 500만 명 규모다.

    이 툴의 핵심 철학은 두 가지다. 어떤 AI 모델이든 연결해서 쓸 수 있다. 그리고 코드는 서버에 저장하지 않는다. Anthropic, OpenAI, Google Gemini, AWS Bedrock, Groq 등 75개 이상의 프로바이더를 지원한다. Ollama를 통한 로컬 모델 연동도 된다.

    단순 코드 자동완성 툴과 다른 점이 있다. 에이전트로 작동한다는 것이다. 프로젝트 파일을 읽고, 코드를 작성하고, 명령을 실행한다. git과도 상호작용한다. 스니펫 제안에서 멈추지 않고 코드베이스에 직접 행동한다. 마치 주니어 개발자에게 태스크를 위임하는 감각이다.

    출처 @opencode git

    좋았던 점

    모델을 고를 수 있다는 것 자체가 전략이다. 세션 중간에도 모델을 전환할 수 있다. 대규모 리팩토링에는 컨텍스트 윈도우가 넓은 모델을 쓴다. 빠른 반복 작업에는 비용이 낮은 모델을 쓴다. 두 가지를 혼합하는 전략이 가능하다. 특정 프로바이더에 고정된 Copilot이나 Cursor와 비교하면 선택지 자체가 다르다.

    LSP 통합이 환각을 줄인다. Language Server Protocol 서버와 직접 통합한다. Rust, TypeScript, Python 등 주요 언어의 LSP를 자동으로 구성한다. 타입 정보와 심볼 맥락이 모델에 전달된다. 단순 LLM 프롬프팅 대비 환각이 줄어드는 게 실제로 느껴진다.

    코드가 서버 밖으로 나가지 않는다. 코드와 컨텍스트 데이터를 일절 저장하지 않는 구조다. 의료, 금융, 국방처럼 코드를 외부로 전송할 수 없는 환경에 적합하다. 로컬 모델을 붙이면 규정 준수와 AI 지원을 동시에 가져갈 수 있다. 오픈소스이기 때문에 내부 코딩 표준을 강제하거나 보안 정책에 맞게 수정하는 것도 가능하다.

    단일 인터페이스로 여러 환경을 커버한다. CLI, macOS·Windows·Linux 데스크톱 앱, VS Code·Cursor·Windsurf IDE 확장을 모두 제공한다. 서버 모드를 통한 WebUI도 있다. 여러 VPS 인스턴스를 프로젝트별로 띄우고 WebUI로 통합 관리하는 사례도 나오고 있다.

    아쉬운 점

    “무료”는 절반만 맞는 말이다. 소프트웨어 자체는 무료다. 하지만 API 비용은 전액 사용자 부담이다. Claude Sonnet이나 GPT-4o로 집중 작업하면 월 20~50달러가 나올 수 있다. 작업 강도가 높으면 그 이상도 보고된다. Copilot 구독과 단순 비교하면 오히려 비쌀 수 있다. 본격 도입 전에 자신의 작업 패턴 기준으로 비용을 직접 계산해봐야 한다.

    아직 성숙 중인 툴이다. 대형 코드베이스에서 컨텍스트 한계에 부딪혔을 때 처리가 불투명하다. 에이전트가 중간에 실수하면 롤백이 번거롭다. 메모리 점유가 과하다는 지적도 커뮤니티에서 꾸준히 나온다. 2026년 초 기준으로 문서화가 기능 출시 속도를 따라가지 못하고 있다. 동작 방식을 파악하려면 소스코드나 GitHub 이슈를 직접 뒤져야 할 때도 있다.

    이런 분께 추천

    Copilot이나 Cursor에 만족하고 있다면 굳이 갈아탈 필요는 없다. OpenCode는 다음 상황에서 실질적인 가치를 낸다. 코드를 외부 서버로 전송할 수 없는 규정 준수 환경이 첫 번째다. 개발자 50명 이상 조직에서 라이선스 비용 압박이 있는 경우도 해당된다. 특정 AI 프로바이더에 종속되는 것을 피하고 싶은 팀, 터미널 중심 워크플로에 익숙하고 직접 설정을 즐기는 개발자에게도 맞다.

    반대로 GUI 환경에서 바로 생산성을 내야 하는 입문자, 설정과 유지보수에 시간을 쓰기 어려운 소규모 팀에게는 맞지 않는다.

    So what — Kevin의 코멘트

    국내 엔터프라이즈 시장을 보면 오픈소스와 상용 솔루션의 경계가 꽤 명확하다. “무료”나 “오픈소스”라는 단어가 오히려 채택을 망설이게 만드는 경우를 자주 봤다. 지원 체계가 있냐, 책임 소재가 어디냐, 보안 검토를 통과할 수 있냐. 이 세 가지 질문 앞에서 오픈소스는 늘 불리한 출발선에 선다.

    OpenCode는 기술적으로 흥미롭다. 기여자 800명, Fortune 500 내부 포크 사례까지 나오고 있으니 발전 속도도 기대된다. 하지만 국내 대기업이나 금융권에서 “오픈소스 코딩 에이전트를 도입하자”는 제안이 결재를 통과하기까지는 시간이 걸릴 것이다. 당장은 스타트업, 개인 개발자, 또는 사내 IT 부서의 내부 툴링 용도가 현실적인 진입점이라고 본다. 엔터프라이즈 채택은 OpenCode가 상용 지원 모델을 갖추거나, 검증된 레퍼런스가 쌓인 이후의 이야기다.

    최종 평가

    OpenCode는 논란 덕분에 알려졌다. 하지만 기술적 완성도도 무시할 수준이 아니다. 벤더 락인을 피하려는 흐름이 본격화되는 지금, 모델 유연성과 프라이버시 아키텍처는 단순 기능이 아니라 포지셔닝 자체다. 다만 “오픈소스라 무료”라는 인식과 실제 운영 비용 사이의 간극을 사전에 계산하지 않으면 실망으로 이어질 수 있다. 통제권과 유연성이 우선순위인 팀에게는 현재 시장에서 가장 설득력 있는 선택지 중 하나다.

    출처

    • Hacker News — OpenCode – Open source AI coding agent (2026.03.24)
    • DEV Community — OpenCode: The Open Source AI Coding Agent Reviewed (2026.03.21)
    • InfoQ — OpenCode: an Open-source AI Coding Agent Competing with Claude Code and Copilot (2026.02)
    • abit.ee — OpenCode: The Open-Source AI Coding Agent with 126,000 GitHub Stars (2026.03.21)
    • BattleAITools — OpenCode Review — 8.4/10 AI Coding Tool Rating (2026)
    • opencode.ai — 공식 홈페이지
  • GPT-5.4 출시 — AI가 드디어 사람보다 컴퓨터를 잘 쓴다

    OpenAI가 3월 5일 GPT-5.4를 출시했다. 자율 데스크톱 조작 벤치마크에서 인간 전문가 점수를 처음으로 넘어섰다.

    무슨 일인가

    OpenAI가 GPT-5.4를 공개했다. 이번 버전의 핵심은 Computer Use 기능이다. 모델이 스크린을 직접 보고 마우스 클릭, 키보드 입력, 앱 전환까지 스스로 실행한다. 별도 플러그인이 아니라 모델 자체에 내장된 기능이다.

    성능 수치를 보면, 실제 데스크톱 작업 능력을 측정하는 OSWorld-Verified 벤치마크에서 75.0%를 기록했다. 인간 전문가 기준점인 72.4%를 처음으로 넘어선 수치다. 직전 모델인 GPT-5.2가 같은 테스트에서 47.3%였다는 점을 감안하면, 한 세대 만에 약 28포인트가 올라간 셈이다.

    주요 스펙을 정리하면 이렇다.

    • 컨텍스트 윈도우: API 기준 최대 100만 토큰 (GPT-5.2의 40만에서 확장)
    • 토큰 효율: 복잡한 작업 기준 이전 대비 약 47% 절감
    • 오류율: 개별 주장 기준 허위 응답 33% 감소
    • Tool Search: 수만 개 규모의 툴 생태계에서 필요한 툴을 실시간으로 검색·선택하는 신규 기능
    • 출시 형태: Standard, Pro, Thinking 세 가지 변형. ChatGPT Plus·Team·Pro 구독자에게 순차 배포 중

    전문 지식 업무를 측정하는 GDPval 벤치마크에서는 44개 직군 기준 83%를 기록했다. GPT-5.2의 71%에서 크게 올라간 수치다.

    왜 중요한가

    이전까지 AI는 “말로 설명해주면 내가 실행할게” 방식이었다. 브라우저 탭을 직접 열거나, 엑셀 파일을 조작하거나, 사내 시스템에 로그인해서 데이터를 가져오는 일은 여전히 사람이 해야 했다. GPT-5.4는 그 경계를 넘는다.

    OSWorld 벤치마크가 인간 기준점을 넘겼다는 사실의 의미는 단순히 “AI가 더 똑똑해졌다”가 아니다. 반복적인 멀티 앱 워크플로 — 데이터 추출, 양식 작성, 보고서 취합 같은 작업 — 가 이제 자동화 가능한 영역으로 넘어왔다는 신호다. 이전까지 RPA(로보틱 프로세스 자동화) 전담 팀이나 맞춤형 스크립트 없이는 처리하기 어려웠던 일들이다.

    경쟁 구도도 주목할 만하다. 현 시점 기준으로 세 모델은 각자 다른 영역을 선도하고 있다. GPT-5.4는 업무 자동화와 컴퓨터 조작, Claude Opus 4.6은 코딩(SWE-Bench 80.8%), Gemini 3.1 Pro는 추론과 가격 경쟁력($2/$12 per MTok)에서 각각 앞선다. 어느 한 모델이 모든 영역을 압도하는 시대는 아직 아니다.

    So what — Kevin 코멘트

    집에서 작업할 때 컴퓨터를 AI에 맡기고 가끔 사용료만 확인하는 루틴이 생긴 지 꽤 됐다. 아직 복잡한 일은 아니지만, 그 자체로 꽤 든든하다. 오래전 좋아했던 일본 애니메이션 쵸비츠에서 사람들이 퍼스컴(퍼스널 컴퓨터)을 생활 파트너처럼 쓰던 세계관이 있었는데, GPT-5.4의 Computer Use를 쓰다 보면 그 시대가 생각보다 빨리 왔다는 느낌이 든다.

    다만 보안 문제는 아직 현실적인 걸림돌이다. 기업 시스템에 AI가 직접 로그인하고 파일을 조작하는 구조는, 인증 처리와 권한 관리가 충분히 성숙하지 않으면 새로운 공격 벡터가 될 수 있다. 그게 Computer Use의 실제 도입을 늦추는 가장 큰 이유라고 본다. 그렇지만 요즘 발전 속도를 보면 이 문제도 오래 가지 않을 것 같다. 지금 당장 전면 도입보다는, 내부 시스템과 격리된 환경에서 반복 작업부터 실험해보는 것이 현실적인 시작점이다.

    관련 맥락

    GPT-5.4 출시 직전인 3월 초, OpenAI는 GPT-5.3 Instant를 먼저 공개했다. 2~3주 간격으로 두 번의 출시가 연속으로 이어진 것이다. Anthropic도 2월 초 Claude Opus 4.6, 2월 중순 Claude Sonnet 4.6을 릴리스했다. Google은 2월 말 Gemini 3.1 Pro를 내놨다. 주요 랩 세 곳 모두 이제 수개월 단위가 아니라 2~3주 단위로 업데이트를 내보내고 있다.

    배경에 있는 경쟁 압력도 뚜렷하다. Anthropic의 Claude Code는 출시 1년도 되지 않아 연간 반복 매출 25억 달러를 기록했다는 보도가 나왔다. GPT-5.4가 GPT-5.3 Codex의 코딩 특화 기능을 메인 모델로 통합한 것도 이 맥락과 무관하지 않다.

    앞으로 어떻게 될까

    단기적으로는 Computer Use가 실무에서 얼마나 신뢰할 수 있는지가 관건이다. 벤치마크 환경과 실제 기업 시스템은 다르다. 인증 처리, 예외 상황 대응, 보안 정책 등 실제 배포 과정에서 드러날 문제들이 아직 검증되지 않았다.

    중기적으로는 이 기능이 RPA 시장에 구조적 압력을 가할 가능성이 크다. UiPath나 Automation Anywhere 같은 기존 RPA 툴이 경쟁해야 하는 상대가 바뀌는 셈이다. 반면 GPT-5.4를 활용해 내부 워크플로를 자동화하려는 팀에게는 지금이 실험 시작 시점으로 적합하다.

    한 가지 유의할 점은 GPT-5.2 Thinking이 2026년 6월 5일 종료된다는 것이다. 해당 버전을 API로 연동 중인 팀이라면 마이그레이션 일정을 미리 잡아둬야 한다.


    출처

    OpenAI — Introducing GPT-5.4 (2026.03.05)
    Build Fast with AI — GPT-5.4 Review: Features, Benchmarks & Access (2026.03)
    Digital Applied — GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro (2026.03)
    NxCode — GPT-5.4 vs GPT-5.2: What Changed & Should You Upgrade? (2026.03)
    Turing College — GPT-5.4 Review: Is It Worth Leaving GPT-5.3 Codex Behind? (2026.03)