- Published on
Codex가 IDE를 버린 이유
- Authors

- Name
- 오늘의 바이브
IDE 안에서는 안 되는 일
2026년 2월 2일, OpenAI가 macOS용 Codex 앱을 출시했다. Copilot처럼 IDE 안에 붙는 플러그인이 아니다. 완전히 독립된 데스크톱 앱이다.

이 선택이 흥미로운 건, OpenAI에 이미 IDE 통합 제품이 있기 때문이다. GitHub Copilot이 VS Code에서 돌아가고 있고, Codex CLI는 터미널에서 쓸 수 있다. 그런데 굳이 세 번째 카테고리를 만들었다.
OpenAI의 설명은 이렇다: "핵심 과제가 '에이전트가 무엇을 할 수 있는가'에서 '사람이 에이전트를 어떻게 지휘하고 감독하는가'로 이동했다." 기존 IDE와 터미널은 이 방식의 작업을 지원하도록 설계되지 않았다는 거다.
세 가지 카테고리
AI 코딩 도구가 이제 세 갈래로 갈라졌다.
| 카테고리 | 대표 도구 | 핵심 가치 |
|---|---|---|
| IDE-first | Cursor, Copilot | 에디터 안에서 인라인 제안 |
| Terminal-first | Claude Code, Codex CLI | 명령어 기반, 파일 직접 조작 |
| Orchestration-first | Codex 앱 | 다중 에이전트 관리, 장기 작업 감독 |
한 개발자의 비유가 핵심을 잘 짚는다:
"Cursor는 '내 IDE에 초능력이 생겼다'고 느껴진다. Codex 앱은 '내 레포에 관제실이 생겼다'고 느껴진다."
IDE-first 도구는 커서가 있는 곳에서 코드를 써준다. Terminal-first 도구는 파일 시스템을 직접 다룬다. 하지만 Codex 앱은 여러 에이전트를 동시에 돌리면서 각각의 작업을 감독하는 구조다. 에이전트가 최대 30분까지 독립적으로 작업하고, 완료되면 리뷰 큐에 올린다.
왜 독립 앱인가
IDE 플러그인으로 만들면 IDE의 제약을 그대로 상속받는다. 탭 하나에 에이전트 하나. 에디터 중심의 인터페이스. 파일 단위 사고.
Codex 앱은 이걸 뒤집는다:
- 다중 에이전트 병렬 실행 — 프로젝트 사이드바에서 여러 스레드를 동시에 관리한다. 각 에이전트가 격리된 worktree에서 작업하기 때문에 서로 충돌하지 않는다.
- 자동화 — 스케줄에 따라 백그라운드에서 에이전트가 돌아간다. 결과는 리뷰 큐에 쌓인다. "매일 아침 테스트 커버리지 올려놔" 같은 작업이 가능하다.
- Skills — 지시, 리소스, 스크립트를 묶은 패키지. 앱에서 만들면 CLI, IDE 확장, 팀 전체에서 공유된다.
- 프론트엔드 스크린샷 — 클라우드에서 프론트엔드 작업 시 UI 스크린샷을 직접 보여준다. 브랜치를 로컬에 체크아웃하지 않아도 디자인을 확인할 수 있다.

Sam Altman은 최근 상당한 규모의 코딩 프로젝트를 전통적인 IDE를 한 번도 열지 않고 완성했다고 말했다. 실제로 그렇게 쓰라는 의미다.
기술 스택
- 모델: GPT-5.2-Codex — o3를 코딩 특화로 파인튜닝한 모델. TerminalBench 1위.
- 실행: 샌드박스 클라우드 환경. 각 에이전트가 독립된 worktree에서 작업.
- 가격: ChatGPT Free/Go에 한시적 포함. Plus, Pro, Business, Enterprise, Edu는 한도 2배.
- 플랫폼: macOS 전용 (Windows, Linux 예정)
Claude Code와의 차이
바이브 코더 입장에서 가장 궁금한 건 Claude Code와의 비교일 거다.
| Codex 앱 | Claude Code | |
|---|---|---|
| 형태 | 독립 GUI 앱 | 터미널 CLI |
| 에이전트 수 | 다중 병렬 | 단일 (서브에이전트 가능) |
| 실행 위치 | 클라우드 샌드박스 | 로컬 머신 |
| 장기 작업 | 30분까지 자율 실행 | 사용자 감독 하에 계속 실행 |
| 자동화 | 스케줄 기반 Automations | hooks, CLAUDE.md |
| 보안 모델 | 클라우드 격리 | 로컬 권한 (allowlist 기반) |
| 오프라인 | 불가 | 가능 (API 키만 있으면) |
핵심적인 차이는 "어디서 코드가 실행되는가"다. Codex는 클라우드에서 돌린다. 내 파일을 올려보내고 결과를 받는다. Claude Code는 내 머신에서 직접 돌린다. 이건 보안과 속도, 비용의 트레이드오프다.
Codex의 클라우드 실행은 보안 면에서 유리하다 — 에이전트가 내 로컬 파일 시스템에 접근할 수 없다. 반면 Claude Code의 로컬 실행은 네트워크 지연이 없고, 프라이빗 코드를 외부에 보내지 않아도 된다.
시장 반응
출시 한 달 만에 100만 명 이상의 개발자가 Codex를 사용했다. 이틀 뒤인 2월 4일, GitHub은 Copilot Pro+와 Enterprise 사용자에게 Claude와 Codex 모두를 Agent HQ에서 쓸 수 있게 했다. 경쟁이 아니라 공존의 신호다.
긍정적인 반응은 주로 기술 부채 해소에 집중됐다. Altman의 말: "AI 코딩 에이전트는 인간 개발자가 싫어하는 종류의 작업에 뛰어나다 — 이거 리팩터링 해, 이 코드베이스 정리해, 이거 다시 써, 이 테스트 작성해."
우려도 있다. macOS 전용이라는 점, 에이전트가 여전히 실수를 하고 감독이 필요하다는 점, 그리고 개발자 역할 축소에 대한 불안.
IDE를 버린 것이 아니라
정확히 말하면 Codex는 IDE를 버린 게 아니다. IDE가 답할 수 없는 질문에 답하려는 거다: "에이전트 5개를 동시에 돌리면서 각각의 결과를 리뷰하려면 어떤 인터페이스가 필요한가?"
이 질문에 VS Code의 탭 구조는 답이 되지 않는다. 터미널의 단일 세션도 부족하다. 그래서 새로운 카테고리가 나왔다.
AI 코딩 도구의 경쟁축이 "누가 더 똑똑한 코드를 짜는가"에서 "누가 더 나은 에이전트 관리 경험을 제공하는가"로 이동하고 있다. Codex 앱은 그 방향의 첫 번째 본격적인 시도다.