[카테고리:] 생산성

  • 엑셀·Teams·Outlook이 달라진다: Microsoft 365 Copilot Wave 2 직장인 완전 정복 가이드

    엑셀·Teams·Outlook이 달라진다: Microsoft 365 Copilot Wave 2 직장인 완전 정복 가이드

    엑셀로 데이터를 분석하다가 복잡한 수식에서 막힌 경험, 누구나 있을 것이다. Teams 회의가 끝나고 회의록을 직접 정리하느라 시간을 낭비한 경험도 마찬가지다. Microsoft 365 Copilot Wave 2가 이 반복적인 업무들을 AI로 대체하기 시작했다. 직장인이라면 지금 당장 알아야 할 세 가지 핵심 기능을 정리했다.

    엑셀에서 Python을 코딩 없이 쓴다: Python in Excel

    Wave 2의 가장 강력한 기능이다. Python은 데이터 분석·머신러닝의 표준 언어지만, 개발자가 아닌 직장인에게는 진입 장벽이 높았다. 이제 엑셀 안에서 원하는 분석을 한국어로 설명하면 Copilot이 Python 코드를 자동 생성해 즉시 실행한다.

    히트맵, 예측 분석, 데이터 클렌징, 머신러닝 모델 적용까지 코드 한 줄 없이 가능하다. 금융·물류·제조업처럼 데이터가 많은 업종에서 특히 강력하다. Python 코드는 Microsoft 클라우드 보안 컨테이너 안에서 실행되어 데이터가 외부로 유출되지 않는다.

    출처: Microsoft 365 Copilot Wave 2: Pages, Python in Excel, and agents | Microsoft 365 Blog

    Copilot Pages: AI 답변이 팀 협업 문서가 된다

    기존에는 Copilot에게 물어본 답변이 채팅창에서 사라지면 끝이었다. Copilot Pages는 이 흐름을 바꾼다. Copilot Chat의 답변을 버튼 하나로 영구 저장하고, 팀원과 실시간으로 함께 편집하는 공유 문서로 전환할 수 있다.

    만들어진 페이지는 Teams 채팅, Outlook 메일에 바로 첨부할 수 있다. 리서치 결과를 정리한 뒤 팀에 공유하거나, 회의 준비 자료를 AI로 뽑아 동료와 함께 다듬는 흐름이 자연스럽게 이어진다. Microsoft Entra 계정이 있는 4억 명 이상의 사용자가 접근할 수 있다.

    출처: New Microsoft Copilot 365 Wave 2 includes agents and Pages | TechTarget

    Agent Mode: Copilot이 스스로 파일을 수정한다

    2026년 1월부터 Word·Excel·PowerPoint에 Agent Mode가 정식 출시됐다. 기존 Copilot이 제안을 하면 사람이 직접 적용해야 했다면, Agent Mode는 다르다. 작업 지시를 내리면 Copilot이 계획을 세우고, 파일을 직접 수정하고, 결과를 검토하고, 오류를 스스로 수정하며 완성도를 높인다.

    예를 들어 “이 보고서를 임원용으로 1페이지로 요약하고, 핵심 수치를 표로 만들어줘”라고 하면 Copilot이 전체 작업을 순서대로 처리한다. Outlook에서는 자동 RSVP, 이메일 실시간 수정, 음성으로 받은편지함 관리까지 가능해졌다.

    출처: What’s New in Microsoft 365 Copilot | January 2026 | Microsoft Community Hub

    So What: 한국 직장인에게 뭐가 달라지나

    Microsoft 365(구 Office 365)는 한국 기업 환경에서 여전히 표준 업무 도구다. 엑셀·Teams·Outlook을 이미 쓰고 있다면 추가 툴 학습 없이 AI 기능을 바로 적용할 수 있다는 점이 핵심이다. 단, 주의할 점이 있다. 2026년 4월 15일부터 Word·Excel·PowerPoint 내 Copilot 전체 기능은 Microsoft 365 Copilot 라이선스(월 약 40달러) 유료 구독자에게만 제공된다. 지금이 무료로 기능을 체험해볼 마지막 시기다.

    지금 바로 할 수 있는 것

    1. Copilot 무료 체험 — Microsoft 365 계정으로 m365.cloud.microsoft 접속 후 Copilot Chat에서 Python in Excel 기능 테스트
    2. Teams 회의록 자동화 설정 — Teams 회의 시작 전 Copilot 아이콘 클릭 → ‘회의 기록 켜기’ 활성화 → 회의 종료 후 자동 요약 확인
    3. 4월 15일 전 라이선스 검토 — IT 담당자 또는 관리자에게 Microsoft 365 Copilot 라이선스 도입 필요 여부 확인 요청

    대표이미지 출처: Microsoft 365 공식 블로그

  • 문서를 AI 팟캐스트로 바꾼다: Google NotebookLM 완전 정복 [2026 최신]

    문서를 AI 팟캐스트로 바꾼다: Google NotebookLM 완전 정복 [2026 최신]

    회의록, PDF 보고서, 긴 아티클 — 읽어야 하는 건 알지만 시간이 없다. Google NotebookLM은 이 자료들을 AI 두 명이 대화하는 팟캐스트 형식으로 자동 변환해준다. 2026년 3월 대규모 업데이트로 한국어 지원, 실시간 인터랙션, 영상 생성까지 더해졌다. 무료로 쓸 수 있고, 구글 계정만 있으면 된다. 직장인·학생 모두에게 지금 당장 써볼 이유가 충분하다.

    NotebookLM이란? 한 줄 정의

    NotebookLM은 내가 올린 자료만을 기반으로 동작하는 AI 리서치 도구다. 일반 챗GPT와 다른 결정적인 차이가 있다. 인터넷 전체가 아닌, 내가 업로드한 문서 안에서만 답한다. 그래서 환각(hallucination)이 훨씬 적고, 출처 인용이 정확하다. PDF, 구글독스, 웹페이지, 유튜브 링크, 오디오 파일까지 소스로 넣을 수 있다.

    Audio Overviews: 내 문서가 팟캐스트가 된다

    핵심 기능은 Audio Overviews다. 자료를 업로드하면 AI 진행자 두 명이 해당 내용을 요약·해설·토론하는 팟캐스트를 자동 생성한다. 생성 시간은 1~2분. 분량은 보통 10~15분짜리 오디오다.

    30페이지짜리 보고서도 출퇴근길 지하철 안에서 소화할 수 있다. 영어 문서도 한국어 팟캐스트로 변환이 된다. 현재 한국어를 포함한 50개 이상의 언어를 지원하며, 설정 방법은 우측 상단 메뉴 → 설정 → 출력 언어에서 한국어를 선택하면 끝이다.

    커스터마이징도 가능하다. 생성 전 연필 아이콘을 클릭하면 이 부분에 집중해줘, 초급자 기준으로 설명해줘 같은 지시를 추가할 수 있다. 내 청중에 맞는 설명 수준으로 조정이 된다.

    출처: 노트북LM의 인기 기능 AI 음성 개요를 이제 한국어로 이용해 보세요 | Google 블로그

    인터랙티브 모드: 듣다가 끼어들 수 있다

    단순히 듣는 것에서 한 단계 더 나아간다. 인터랙티브 모드를 켜면 팟캐스트를 듣다가 Join 버튼을 눌러 대화에 참여할 수 있다. AI 진행자가 대화를 멈추고 내 질문을 받는다. 음성이나 텍스트로 질문하면 업로드한 자료를 기반으로 즉시 답변하고, 이후 팟캐스트를 이어서 진행한다.

    복잡한 기술 문서나 계약서를 검토할 때, 모르는 개념이 나왔을 때 바로 물어볼 수 있다는 점이 강력하다. 기존에는 문서를 읽다 막히면 별도로 검색하거나 챗GPT에 붙여넣기 해야 했다. 이제는 듣는 중에 그 자리에서 해결된다.

    다만 인터랙티브 모드는 현재 영어 환경에서만 완전히 작동한다. 한국어 사용자는 한국어 Audio Overview를 생성한 뒤 인터랙션은 영어로 질문하는 방식으로 활용 가능하다.

    출처: Audio Overview Interactive Mode | Futurepedia

    2026년 3월 최신 업데이트: 영상까지 만들어준다

    2026년 3월 20일 업데이트로 세 가지 핵심 기능이 추가됐다.

    첫째, Cinematic Video Overviews다. 자료를 기반으로 애니메이션과 내레이션이 결합된 영상을 자동 생성한다. 단순 슬라이드쇼가 아닌, Gemini 모델이 수백 가지 구조·스타일 결정을 내려 스토리 중심의 몰입형 영상을 만들어낸다. 강의 자료나 발표 준비에 바로 쓸 수 있다.

    둘째, 대화 기록 자동 저장이다. 세션을 닫아도 이전 대화가 유지된다. 공유 노트북에서는 내 대화가 나에게만 보여 프라이버시도 확보된다.

    셋째, 채팅에서 바로 Audio·Video Overview 생성이다. 대화 중 원하는 시점에 즉시 오버뷰로 변환할 수 있다. 챗에서 원하는 내용을 추려낸 뒤 이걸 팟캐스트로 만들어줘가 가능해진 셈이다.

    출처: Google Workspace Updates: New ways to customize and interact with your content in NotebookLM

    So What: 한국 직장인에게 뭐가 달라지나

    지금까지 긴 문서를 파악하는 방법은 직접 읽거나, 요약을 요청하는 두 가지뿐이었다. NotebookLM은 세 번째 방법을 제시한다. 들으면서 질문한다. 이동 시간, 운동 시간, 집안일 하는 시간이 전부 업무 인풋이 된다. 영어 논문이나 해외 보고서도 한국어 팟캐스트로 변환되니 언어 장벽도 낮아진다.

    특히 개발자·기획자·연구직에게는 방대한 문서를 빠르게 파악해야 할 때, 회의 전 빠른 컨텍스트 확보에 즉각적으로 쓸 수 있다. 무료인데 쓰지 않을 이유가 없다.

    지금 바로 할 수 있는 것

    1. 무료로 바로 시작notebooklm.google 접속 후 구글 계정으로 로그인 (완전 무료)
    2. 한국어 설정 — 우측 상단 설정 → 출력 언어 → 한국어 선택
    3. 첫 테스트 — 읽기 부담스러운 PDF 하나 업로드 → Audio Overview 생성 → 출퇴근길 청취
  • AI 노트 앱 비교: Notion AI vs Obsidian AI vs mem.ai — 직장인·개발자에게 진짜 맞는 건?

    AI 노트 앱, 뭘 써야 할지 고민인가? Notion AI, Obsidian+AI 플러그인, mem.ai — 셋 다 AI 노트 앱이라 불리지만, 실제로는 완전히 다른 철학을 가진 툴이다. 어떤 상황에 어떤 앱이 맞는지 핵심만 정리한다.

    Notion AI: 팀 협업이 핵심이라면 1순위

    Notion AI는 이미 Notion을 쓰고 있다면 가장 빠르게 AI를 도입할 수 있는 선택지다. 글 요약, 번역, 초안 작성이 버튼 하나로 끝난다.

    팀 위키나 프로젝트 문서와 연동도 자연스럽다. 단, 월 추가 비용이 들고, AI가 내 전체 노트를 이해하기보다 현재 페이지 기준으로 작동한다는 한계가 있다.

    추천 대상: 팀과 함께 문서를 관리하는 직장인

    Obsidian + AI 플러그인: 지식 관리에 진심이라면

    Obsidian은 로컬 마크다운 파일 기반이라 데이터 소유권이 완전히 내 것이다. 클라우드에 올라가지 않기 때문에 보안이 중요한 개발자에게도 적합하다.

    Copilot, Smart Connections 같은 플러그인을 붙이면 수천 개의 노트를 벡터 검색하고 GPT와 대화할 수 있다. 초기 설정이 복잡하지만, 한 번 세팅하면 강력한 두 번째 뇌가 완성된다.

    추천 대상: 개발자, 연구자, 지식 관리에 진심인 사람

    mem.ai: 정리하기 싫다면 이 선택지

    mem.ai는 그냥 던져놓으면 AI가 알아서 연결해준다는 컨셉이다. 태그도, 폴더도, 구조도 필요 없다. 메모를 입력하면 AI가 관련 노트를 자동으로 연결하고, 자연어로 검색도 된다.

    반면 한국어 지원이 불완전하고, 월 .99로 가격이 높다. 영어 중심 업무 환경이라면 강력하지만, 한국어 사용자에겐 아직 한계가 있다.

    추천 대상: 영어 환경에서 일하는 사람, 자동 정리를 원하는 사람

    결국 누가 써야 할까?

    • 팀과 문서를 함께 관리한다 → Notion AI
    • 내 지식을 체계적으로 쌓고 싶다 → Obsidian + AI 플러그인
    • 정리하기 귀찮고 자동화를 원한다 → mem.ai (영어 환경 한정)

    결국 AI 노트 앱은 도구일 뿐이다. 어떤 앱을 골라도 꾸준히 기록하는 습관이 없으면 소용없다. 하지만 자신의 업무 방식에 맞는 도구를 고르면, 그 습관이 훨씬 쉽게 자리잡는다.

  • OpenCode 리뷰: GitHub 스타 12만, 오픈소스 AI 코딩 에이전트

    올해 초, AI 코딩 커뮤니티에서 소동이 있었다. Anthropic이 Claude Pro·Max 구독 토큰을 서드파티 툴에서 사용하지 못하도록 기술적으로 차단했다. 월 100~200달러를 내던 사용자들이 갑자기 기존 방식으로 쓸 수 없게 됐다.

    그 2주 동안 GitHub 스타를 1만 8천 개 더 받은 툴이 있다. OpenCode다. 논란이 사실상 최고의 마케팅이 됐다. 나는 이 소동을 지켜보면서 툴 자체가 궁금해졌다. 소란이 아니라, 실제로 쓸만한가.

    OpenCode란

    Anomaly Innovations가 개발한 오픈소스 AI 코딩 에이전트다. 터미널, IDE, 데스크톱 앱 세 가지 환경을 모두 지원한다. 2024년 말 등장 이후 빠르게 성장했다. 현재 GitHub 스타 12만 개 이상, 월간 활성 개발자 500만 명 규모다.

    이 툴의 핵심 철학은 두 가지다. 어떤 AI 모델이든 연결해서 쓸 수 있다. 그리고 코드는 서버에 저장하지 않는다. Anthropic, OpenAI, Google Gemini, AWS Bedrock, Groq 등 75개 이상의 프로바이더를 지원한다. Ollama를 통한 로컬 모델 연동도 된다.

    단순 코드 자동완성 툴과 다른 점이 있다. 에이전트로 작동한다는 것이다. 프로젝트 파일을 읽고, 코드를 작성하고, 명령을 실행한다. git과도 상호작용한다. 스니펫 제안에서 멈추지 않고 코드베이스에 직접 행동한다. 마치 주니어 개발자에게 태스크를 위임하는 감각이다.

    출처 @opencode git

    좋았던 점

    모델을 고를 수 있다는 것 자체가 전략이다. 세션 중간에도 모델을 전환할 수 있다. 대규모 리팩토링에는 컨텍스트 윈도우가 넓은 모델을 쓴다. 빠른 반복 작업에는 비용이 낮은 모델을 쓴다. 두 가지를 혼합하는 전략이 가능하다. 특정 프로바이더에 고정된 Copilot이나 Cursor와 비교하면 선택지 자체가 다르다.

    LSP 통합이 환각을 줄인다. Language Server Protocol 서버와 직접 통합한다. Rust, TypeScript, Python 등 주요 언어의 LSP를 자동으로 구성한다. 타입 정보와 심볼 맥락이 모델에 전달된다. 단순 LLM 프롬프팅 대비 환각이 줄어드는 게 실제로 느껴진다.

    코드가 서버 밖으로 나가지 않는다. 코드와 컨텍스트 데이터를 일절 저장하지 않는 구조다. 의료, 금융, 국방처럼 코드를 외부로 전송할 수 없는 환경에 적합하다. 로컬 모델을 붙이면 규정 준수와 AI 지원을 동시에 가져갈 수 있다. 오픈소스이기 때문에 내부 코딩 표준을 강제하거나 보안 정책에 맞게 수정하는 것도 가능하다.

    단일 인터페이스로 여러 환경을 커버한다. CLI, macOS·Windows·Linux 데스크톱 앱, VS Code·Cursor·Windsurf IDE 확장을 모두 제공한다. 서버 모드를 통한 WebUI도 있다. 여러 VPS 인스턴스를 프로젝트별로 띄우고 WebUI로 통합 관리하는 사례도 나오고 있다.

    아쉬운 점

    “무료”는 절반만 맞는 말이다. 소프트웨어 자체는 무료다. 하지만 API 비용은 전액 사용자 부담이다. Claude Sonnet이나 GPT-4o로 집중 작업하면 월 20~50달러가 나올 수 있다. 작업 강도가 높으면 그 이상도 보고된다. Copilot 구독과 단순 비교하면 오히려 비쌀 수 있다. 본격 도입 전에 자신의 작업 패턴 기준으로 비용을 직접 계산해봐야 한다.

    아직 성숙 중인 툴이다. 대형 코드베이스에서 컨텍스트 한계에 부딪혔을 때 처리가 불투명하다. 에이전트가 중간에 실수하면 롤백이 번거롭다. 메모리 점유가 과하다는 지적도 커뮤니티에서 꾸준히 나온다. 2026년 초 기준으로 문서화가 기능 출시 속도를 따라가지 못하고 있다. 동작 방식을 파악하려면 소스코드나 GitHub 이슈를 직접 뒤져야 할 때도 있다.

    이런 분께 추천

    Copilot이나 Cursor에 만족하고 있다면 굳이 갈아탈 필요는 없다. OpenCode는 다음 상황에서 실질적인 가치를 낸다. 코드를 외부 서버로 전송할 수 없는 규정 준수 환경이 첫 번째다. 개발자 50명 이상 조직에서 라이선스 비용 압박이 있는 경우도 해당된다. 특정 AI 프로바이더에 종속되는 것을 피하고 싶은 팀, 터미널 중심 워크플로에 익숙하고 직접 설정을 즐기는 개발자에게도 맞다.

    반대로 GUI 환경에서 바로 생산성을 내야 하는 입문자, 설정과 유지보수에 시간을 쓰기 어려운 소규모 팀에게는 맞지 않는다.

    So what — Kevin의 코멘트

    국내 엔터프라이즈 시장을 보면 오픈소스와 상용 솔루션의 경계가 꽤 명확하다. “무료”나 “오픈소스”라는 단어가 오히려 채택을 망설이게 만드는 경우를 자주 봤다. 지원 체계가 있냐, 책임 소재가 어디냐, 보안 검토를 통과할 수 있냐. 이 세 가지 질문 앞에서 오픈소스는 늘 불리한 출발선에 선다.

    OpenCode는 기술적으로 흥미롭다. 기여자 800명, Fortune 500 내부 포크 사례까지 나오고 있으니 발전 속도도 기대된다. 하지만 국내 대기업이나 금융권에서 “오픈소스 코딩 에이전트를 도입하자”는 제안이 결재를 통과하기까지는 시간이 걸릴 것이다. 당장은 스타트업, 개인 개발자, 또는 사내 IT 부서의 내부 툴링 용도가 현실적인 진입점이라고 본다. 엔터프라이즈 채택은 OpenCode가 상용 지원 모델을 갖추거나, 검증된 레퍼런스가 쌓인 이후의 이야기다.

    최종 평가

    OpenCode는 논란 덕분에 알려졌다. 하지만 기술적 완성도도 무시할 수준이 아니다. 벤더 락인을 피하려는 흐름이 본격화되는 지금, 모델 유연성과 프라이버시 아키텍처는 단순 기능이 아니라 포지셔닝 자체다. 다만 “오픈소스라 무료”라는 인식과 실제 운영 비용 사이의 간극을 사전에 계산하지 않으면 실망으로 이어질 수 있다. 통제권과 유연성이 우선순위인 팀에게는 현재 시장에서 가장 설득력 있는 선택지 중 하나다.

    출처

    • Hacker News — OpenCode – Open source AI coding agent (2026.03.24)
    • DEV Community — OpenCode: The Open Source AI Coding Agent Reviewed (2026.03.21)
    • InfoQ — OpenCode: an Open-source AI Coding Agent Competing with Claude Code and Copilot (2026.02)
    • abit.ee — OpenCode: The Open-Source AI Coding Agent with 126,000 GitHub Stars (2026.03.21)
    • BattleAITools — OpenCode Review — 8.4/10 AI Coding Tool Rating (2026)
    • opencode.ai — 공식 홈페이지
  • GPT-5.4 출시 — AI가 드디어 사람보다 컴퓨터를 잘 쓴다

    OpenAI가 3월 5일 GPT-5.4를 출시했다. 자율 데스크톱 조작 벤치마크에서 인간 전문가 점수를 처음으로 넘어섰다.

    무슨 일인가

    OpenAI가 GPT-5.4를 공개했다. 이번 버전의 핵심은 Computer Use 기능이다. 모델이 스크린을 직접 보고 마우스 클릭, 키보드 입력, 앱 전환까지 스스로 실행한다. 별도 플러그인이 아니라 모델 자체에 내장된 기능이다.

    성능 수치를 보면, 실제 데스크톱 작업 능력을 측정하는 OSWorld-Verified 벤치마크에서 75.0%를 기록했다. 인간 전문가 기준점인 72.4%를 처음으로 넘어선 수치다. 직전 모델인 GPT-5.2가 같은 테스트에서 47.3%였다는 점을 감안하면, 한 세대 만에 약 28포인트가 올라간 셈이다.

    주요 스펙을 정리하면 이렇다.

    • 컨텍스트 윈도우: API 기준 최대 100만 토큰 (GPT-5.2의 40만에서 확장)
    • 토큰 효율: 복잡한 작업 기준 이전 대비 약 47% 절감
    • 오류율: 개별 주장 기준 허위 응답 33% 감소
    • Tool Search: 수만 개 규모의 툴 생태계에서 필요한 툴을 실시간으로 검색·선택하는 신규 기능
    • 출시 형태: Standard, Pro, Thinking 세 가지 변형. ChatGPT Plus·Team·Pro 구독자에게 순차 배포 중

    전문 지식 업무를 측정하는 GDPval 벤치마크에서는 44개 직군 기준 83%를 기록했다. GPT-5.2의 71%에서 크게 올라간 수치다.

    왜 중요한가

    이전까지 AI는 “말로 설명해주면 내가 실행할게” 방식이었다. 브라우저 탭을 직접 열거나, 엑셀 파일을 조작하거나, 사내 시스템에 로그인해서 데이터를 가져오는 일은 여전히 사람이 해야 했다. GPT-5.4는 그 경계를 넘는다.

    OSWorld 벤치마크가 인간 기준점을 넘겼다는 사실의 의미는 단순히 “AI가 더 똑똑해졌다”가 아니다. 반복적인 멀티 앱 워크플로 — 데이터 추출, 양식 작성, 보고서 취합 같은 작업 — 가 이제 자동화 가능한 영역으로 넘어왔다는 신호다. 이전까지 RPA(로보틱 프로세스 자동화) 전담 팀이나 맞춤형 스크립트 없이는 처리하기 어려웠던 일들이다.

    경쟁 구도도 주목할 만하다. 현 시점 기준으로 세 모델은 각자 다른 영역을 선도하고 있다. GPT-5.4는 업무 자동화와 컴퓨터 조작, Claude Opus 4.6은 코딩(SWE-Bench 80.8%), Gemini 3.1 Pro는 추론과 가격 경쟁력($2/$12 per MTok)에서 각각 앞선다. 어느 한 모델이 모든 영역을 압도하는 시대는 아직 아니다.

    So what — Kevin 코멘트

    집에서 작업할 때 컴퓨터를 AI에 맡기고 가끔 사용료만 확인하는 루틴이 생긴 지 꽤 됐다. 아직 복잡한 일은 아니지만, 그 자체로 꽤 든든하다. 오래전 좋아했던 일본 애니메이션 쵸비츠에서 사람들이 퍼스컴(퍼스널 컴퓨터)을 생활 파트너처럼 쓰던 세계관이 있었는데, GPT-5.4의 Computer Use를 쓰다 보면 그 시대가 생각보다 빨리 왔다는 느낌이 든다.

    다만 보안 문제는 아직 현실적인 걸림돌이다. 기업 시스템에 AI가 직접 로그인하고 파일을 조작하는 구조는, 인증 처리와 권한 관리가 충분히 성숙하지 않으면 새로운 공격 벡터가 될 수 있다. 그게 Computer Use의 실제 도입을 늦추는 가장 큰 이유라고 본다. 그렇지만 요즘 발전 속도를 보면 이 문제도 오래 가지 않을 것 같다. 지금 당장 전면 도입보다는, 내부 시스템과 격리된 환경에서 반복 작업부터 실험해보는 것이 현실적인 시작점이다.

    관련 맥락

    GPT-5.4 출시 직전인 3월 초, OpenAI는 GPT-5.3 Instant를 먼저 공개했다. 2~3주 간격으로 두 번의 출시가 연속으로 이어진 것이다. Anthropic도 2월 초 Claude Opus 4.6, 2월 중순 Claude Sonnet 4.6을 릴리스했다. Google은 2월 말 Gemini 3.1 Pro를 내놨다. 주요 랩 세 곳 모두 이제 수개월 단위가 아니라 2~3주 단위로 업데이트를 내보내고 있다.

    배경에 있는 경쟁 압력도 뚜렷하다. Anthropic의 Claude Code는 출시 1년도 되지 않아 연간 반복 매출 25억 달러를 기록했다는 보도가 나왔다. GPT-5.4가 GPT-5.3 Codex의 코딩 특화 기능을 메인 모델로 통합한 것도 이 맥락과 무관하지 않다.

    앞으로 어떻게 될까

    단기적으로는 Computer Use가 실무에서 얼마나 신뢰할 수 있는지가 관건이다. 벤치마크 환경과 실제 기업 시스템은 다르다. 인증 처리, 예외 상황 대응, 보안 정책 등 실제 배포 과정에서 드러날 문제들이 아직 검증되지 않았다.

    중기적으로는 이 기능이 RPA 시장에 구조적 압력을 가할 가능성이 크다. UiPath나 Automation Anywhere 같은 기존 RPA 툴이 경쟁해야 하는 상대가 바뀌는 셈이다. 반면 GPT-5.4를 활용해 내부 워크플로를 자동화하려는 팀에게는 지금이 실험 시작 시점으로 적합하다.

    한 가지 유의할 점은 GPT-5.2 Thinking이 2026년 6월 5일 종료된다는 것이다. 해당 버전을 API로 연동 중인 팀이라면 마이그레이션 일정을 미리 잡아둬야 한다.


    출처

    OpenAI — Introducing GPT-5.4 (2026.03.05)
    Build Fast with AI — GPT-5.4 Review: Features, Benchmarks & Access (2026.03)
    Digital Applied — GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro (2026.03)
    NxCode — GPT-5.4 vs GPT-5.2: What Changed & Should You Upgrade? (2026.03)
    Turing College — GPT-5.4 Review: Is It Worth Leaving GPT-5.3 Codex Behind? (2026.03)

  • OpenAI Codex, 드디어 Windows 상륙 — AI 코딩 에이전트가 일상이 된다

    오늘의 핵심 한 줄: Mac 전용이었던 OpenAI Codex 앱이 Windows에 출시되며, AI 코딩 에이전트가 전체 개발자 시장으로 확장됐다.


    무슨 일인가

    2026년 3월 4일, OpenAI가 Codex 앱 Windows 버전을 정식 출시했다. Mac 버전 출시 직후부터 50만 명 이상의 개발자가 대기 중이었고, Windows 출시 시점 기준 주간 활성 사용자는 이미 160만 명을 넘어섰다.

    Windows 버전은 단순 포팅이 아니다. Windows 개발 환경을 위해 처음부터 새로 설계됐다. 네이티브 샌드박스, PowerShell 지원, 병렬 에이전트 실행, 태스크별 워크트리와 diff 리뷰 기능을 갖췄다. Visual Studio, Rider, PhpStorm, Git Bash, GitHub Desktop, WSL, Sublime Text 등 주요 IDE와 통합도 지원된다.

    세션 기록은 OpenAI 계정에 저장되어 Mac에서 시작한 작업을 Windows에서 이어받을 수 있다. ChatGPT Free, Go, Plus, Pro 플랜 모두 사용 가능하며, Windows 10 버전 19041.0 이상에서 Microsoft Store를 통해 설치된다.


    왜 중요한가

    숫자가 말해준다. Stack Overflow 2025년 조사에 따르면 개발자의 약 50%가 업무용으로, 55% 이상이 개인 용도로 Windows를 사용한다. Mac에서만 돌아가는 AI 코딩 에이전트는 절반의 개발자에게 닿지 못했다. Windows 출시는 Codex의 실질적인 시장 확장이다.

    기술적으로도 의미가 있다. OpenAI는 Windows용 네이티브 에이전트 샌드박스를 처음부터 새로 구축했다. OS 수준의 제어, 파일시스템 ACL, 전용 샌드박스 사용자 구조를 적용해 WSL이나 가상머신 없이도 안전하게 동작한다. 이 샌드박스 구현체는 오픈소스로 공개돼 다른 AI 툴들도 참고할 수 있게 됐다.


    실무자 관점 코멘트

    나는 지금 Claude Code를 주력으로 쓰고 있다. 터미널 기반 워크플로에 잘 맞고, 코드베이스 전체를 컨텍스트로 잡는 방식이 실제 업무에서 체감 차이가 크다.

    Codex Windows 출시를 반기는 이유는 경쟁 심화 때문이다. 요즘 AI 코딩 툴이 쏟아지고 있지만, 솔직히 아직 해결 안 된 문제가 있다. AI가 내 컴퓨터나 브라우저에 직접 접근해서 실제로 일을 처리하는 것, 즉 진짜 의미의 에이전트 동작이 아직 매끄럽지 않다. 문제는 기술만이 아니다. AI에게 무언가를 시키는 입력 자체가 아직 불편하다. 장치 수준에서도, UX/UI 수준에서도 아직 갈 길이 멀다.

    경쟁이 심화되면 이 부분이 빠르게 개선될 것이라고 본다. Codex가 Windows 시장으로 확장하고, Claude Code, Copilot Workspace가 맞불을 놓는 구도가 되면 결국 수혜는 개발자에게 돌아온다. 툴이 많아지는 것보다, 툴을 쓰는 경험 자체가 나아지는 것이 지금 이 시장에서 진짜 필요한 발전이다.

    ( 뉴럴링크, 메타 글래스, 애플 글래스 와 같은 input장치가 필요하고 작고 가볍고 편리해 지면 좋겠다는 생각.)


    관련 맥락

    현재 Codex의 기본 모델은 GPT-5.3-Codex다. GPT-5.2-Codex 대비 25% 빠르고, 코딩 성능과 추론 능력을 동시에 끌어올린 모델로 SWE-Bench Pro와 Terminal-Bench 2.0에서 최고 성능을 기록했다.

    Skills 기능도 주목할 만하다. 명령어, 리소스, 스크립트를 묶어 Codex가 팀의 워크플로에 맞게 도구를 재사용할 수 있게 한다. Figma 디자인을 프로덕션 UI 코드로 변환하거나, Linear에서 버그를 트리아지하거나, Cloudflare·Vercel 등에 직접 배포하는 스킬이 기본 제공된다.


    앞으로 어떻게 될까

    OpenAI는 Codex를 현재의 개발자 도구를 넘어 비기술 직군까지 확장하는 엔터프라이즈 표준 에이전트로 만들겠다는 방향을 밝혔다. AI 코딩 에이전트가 개발자 전용 툴에서 업무 자동화 플랫폼으로 진화하는 그림이다.

    경쟁 구도도 빠르게 재편되고 있다. Claude Code, GitHub Copilot Workspace 등 주요 플레이어들이 모두 에이전트 방향으로 이동 중이다. Codex의 Windows 상륙은 이 경쟁의 무대를 전체 개발자 시장으로 넓혔다는 점에서 분기점이 될 수 있다.

    여러분은 현재 어떤 AI 코딩 툴을 주로 사용하고 계신가요?


    참고 출처