Codex가 IDE를 버린 이유

IDE 안에서는 안 되는 일

2026년 2월 2일, OpenAI가 macOS용 Codex 앱을 출시했다. Copilot처럼 IDE 안에 붙는 플러그인이 아니다. 완전히 독립된 데스크톱 앱이다.

이 선택이 흥미로운 건, OpenAI에 이미 IDE 통합 제품이 있기 때문이다. GitHub Copilot이 VS Code에서 돌아가고 있고, Codex CLI는 터미널에서 쓸 수 있다. 그런데 굳이 세 번째 카테고리를 만들었다.

OpenAI의 설명은 이렇다: "핵심 과제가 '에이전트가 무엇을 할 수 있는가'에서 '사람이 에이전트를 어떻게 지휘하고 감독하는가'로 이동했다." 기존 IDE와 터미널은 이 방식의 작업을 지원하도록 설계되지 않았다는 거다.

세 가지 카테고리

AI 코딩 도구가 이제 세 갈래로 갈라졌다.

카테고리	대표 도구	핵심 가치
IDE-first	Cursor, Copilot	에디터 안에서 인라인 제안
Terminal-first	Claude Code, Codex CLI	명령어 기반, 파일 직접 조작
Orchestration-first	Codex 앱	다중 에이전트 관리, 장기 작업 감독

한 개발자의 비유가 핵심을 잘 짚는다:

"Cursor는 '내 IDE에 초능력이 생겼다'고 느껴진다. Codex 앱은 '내 레포에 관제실이 생겼다'고 느껴진다."

IDE-first 도구는 커서가 있는 곳에서 코드를 써준다. Terminal-first 도구는 파일 시스템을 직접 다룬다. 하지만 Codex 앱은 여러 에이전트를 동시에 돌리면서 각각의 작업을 감독하는 구조다. 에이전트가 최대 30분까지 독립적으로 작업하고, 완료되면 리뷰 큐에 올린다.

왜 독립 앱인가

IDE 플러그인으로 만들면 IDE의 제약을 그대로 상속받는다. 탭 하나에 에이전트 하나. 에디터 중심의 인터페이스. 파일 단위 사고.

Codex 앱은 이걸 뒤집는다:

다중 에이전트 병렬 실행 — 프로젝트 사이드바에서 여러 스레드를 동시에 관리한다. 각 에이전트가 격리된 worktree에서 작업하기 때문에 서로 충돌하지 않는다.
자동화 — 스케줄에 따라 백그라운드에서 에이전트가 돌아간다. 결과는 리뷰 큐에 쌓인다. "매일 아침 테스트 커버리지 올려놔" 같은 작업이 가능하다.
Skills — 지시, 리소스, 스크립트를 묶은 패키지. 앱에서 만들면 CLI, IDE 확장, 팀 전체에서 공유된다.
프론트엔드 스크린샷 — 클라우드에서 프론트엔드 작업 시 UI 스크린샷을 직접 보여준다. 브랜치를 로컬에 체크아웃하지 않아도 디자인을 확인할 수 있다.

Sam Altman은 최근 상당한 규모의 코딩 프로젝트를 전통적인 IDE를 한 번도 열지 않고 완성했다고 말했다. 실제로 그렇게 쓰라는 의미다.

기술 스택

모델: GPT-5.2-Codex — o3를 코딩 특화로 파인튜닝한 모델. TerminalBench 1위.
실행: 샌드박스 클라우드 환경. 각 에이전트가 독립된 worktree에서 작업.
가격: ChatGPT Free/Go에 한시적 포함. Plus, Pro, Business, Enterprise, Edu는 한도 2배.
플랫폼: macOS 전용 (Windows, Linux 예정)

Claude Code와의 차이

바이브 코더 입장에서 가장 궁금한 건 Claude Code와의 비교일 거다.

	Codex 앱	Claude Code
형태	독립 GUI 앱	터미널 CLI
에이전트 수	다중 병렬	단일 (서브에이전트 가능)
실행 위치	클라우드 샌드박스	로컬 머신
장기 작업	30분까지 자율 실행	사용자 감독 하에 계속 실행
자동화	스케줄 기반 Automations	hooks, CLAUDE.md
보안 모델	클라우드 격리	로컬 권한 (allowlist 기반)
오프라인	불가	가능 (API 키만 있으면)

핵심적인 차이는 "어디서 코드가 실행되는가"다. Codex는 클라우드에서 돌린다. 내 파일을 올려보내고 결과를 받는다. Claude Code는 내 머신에서 직접 돌린다. 이건 보안과 속도, 비용의 트레이드오프다.

Codex의 클라우드 실행은 보안 면에서 유리하다 — 에이전트가 내 로컬 파일 시스템에 접근할 수 없다. 반면 Claude Code의 로컬 실행은 네트워크 지연이 없고, 프라이빗 코드를 외부에 보내지 않아도 된다.

시장 반응

출시 한 달 만에 100만 명 이상의 개발자가 Codex를 사용했다. 이틀 뒤인 2월 4일, GitHub은 Copilot Pro+와 Enterprise 사용자에게 Claude와 Codex 모두를 Agent HQ에서 쓸 수 있게 했다. 경쟁이 아니라 공존의 신호다.

긍정적인 반응은 주로 기술 부채 해소에 집중됐다. Altman의 말: "AI 코딩 에이전트는 인간 개발자가 싫어하는 종류의 작업에 뛰어나다 — 이거 리팩터링 해, 이 코드베이스 정리해, 이거 다시 써, 이 테스트 작성해."

우려도 있다. macOS 전용이라는 점, 에이전트가 여전히 실수를 하고 감독이 필요하다는 점, 그리고 개발자 역할 축소에 대한 불안.

IDE를 버린 것이 아니라

정확히 말하면 Codex는 IDE를 버린 게 아니다. IDE가 답할 수 없는 질문에 답하려는 거다: "에이전트 5개를 동시에 돌리면서 각각의 결과를 리뷰하려면 어떤 인터페이스가 필요한가?"

이 질문에 VS Code의 탭 구조는 답이 되지 않는다. 터미널의 단일 세션도 부족하다. 그래서 새로운 카테고리가 나왔다.

AI 코딩 도구의 경쟁축이 "누가 더 똑똑한 코드를 짜는가"에서 "누가 더 나은 에이전트 관리 경험을 제공하는가"로 이동하고 있다. Codex 앱은 그 방향의 첫 번째 본격적인 시도다.