AI 전문기자, Claude 환각에 해고됐다

AI를 가장 잘 아는 기자였다. Ars Technica에서 AI 전담 기자로 일하며 환각, 편향, 오류를 수년간 보도했다. 그런 그가 Claude의 환각에 속아 가짜 인용문을 기사에 실었다. 2026년 3월 2일, Benj Edwards는 해고됐다.

AI가 만들어낸 가짜 인용문이 실린 뉴스 기사를 상징하는 이미지

열이 39도였고, 마감은 내일이었다

2026년 2월 13일, Benj Edwards는 고열에 시달리고 있었다. 하지만 기사 마감은 기다려주지 않았다. 그가 쓰려던 기사의 주제는 아이러니하게도 AI 에이전트가 일으킨 사고였다. 오픈소스 프로젝트 관리자 Scott Shambaugh가 AI 에이전트의 공격을 받은 사건을 다루는 기사였다.

Edwards는 취재 자료를 정리하기 위해 Claude를 사용했다. 그의 의도는 단순했다. 취재원의 발언에서 핵심 인용문을 추출하고, 기사 윤곽을 잡는 데 AI를 보조 도구로 쓰는 것이었다. Claude가 실패하자 ChatGPT로도 시도했다. 결과물은 그럴듯해 보였다.

문제는 AI가 돌려준 인용문이 실제 발언이 아니라 요약본이었다는 것이다. Shambaugh가 한 적 없는 말이 따옴표 안에 들어갔다. Edwards는 이를 검증하지 못한 채 기사를 발행했다.

가짜 인용문, 진짜 기사에 실리다

발행된 기사에는 Shambaugh의 것으로 표기된 인용문이 여러 개 포함되어 있었다. 문제는 Shambaugh 본인이 그런 말을 한 적이 없다는 것이다. AI가 원문의 맥락을 파악한 뒤, 그럴듯한 문장으로 재구성해버린 것이다.

이것이 바로 AI 환각의 가장 위험한 형태다. 완전히 허무맹랑한 말을 지어내는 것이 아니라, 원문과 비슷하지만 미묘하게 다른 문장을 만들어낸다. 맥락은 맞되 단어가 다르고, 뉘앙스가 틀어져 있다. 팩트체크를 하더라도 "대충 맞는 것 같은데?"라고 넘어가기 쉬운 종류의 오류다.

Edwards 본인도 Bluesky에서 이를 인정했다. "아픈 상태에서 AI와 작업하다가 Shambaugh의 실제 발언이 아닌 패러프레이즈 버전을 갖게 됐다." 열이 있는 상태에서 AI의 출력을 원문과 대조하지 못했다는 고백이었다.

Ars Technica의 즉각 대응

기사 발행 이틀 후인 2월 15일, 문제가 수면 위로 올라왔다. Shambaugh가 자신의 발언이 아닌 인용문이 실렸다고 지적한 것이다. Ars Technica는 즉시 기사를 철회했다.

편집장 Ken Fisher는 편집자 주석을 통해 명확한 입장을 밝혔다. 해당 기사에 **"AI 도구가 생성한 조작된 인용문이 포함되어 있었으며, 이를 실제로 발언하지 않은 취재원의 것으로 귀속시켰다"**고 인정한 것이다. Fisher는 이것이 "우리 기준의 심각한 위반"이라고 덧붙였다.

뉴스룸에서 기사를 검토하는 장면을 상징하는 이미지

2월 27일, 기사의 댓글 스레드가 닫혔다. Ars Technica의 크리에이티브 디렉터 Aurich Lawson은 내부 검토가 완료됐으며, **"적절한 내부 조치가 취해졌다"**고 발표했다. 동시에 "앞으로 몇 주 안에 AI를 어떻게 사용하고 사용하지 않는지에 대한 독자용 가이드를 발행하겠다"고 약속했다.

그리고 3월 2일, Edwards의 Ars Technica 바이오 페이지가 과거 시제로 변경됐다. 해고가 확인된 순간이다. Ars Technica와 모회사 Condé Nast 모두 인사 결정에 대해서는 논평하지 않았다.

10년차 AI 전문기자의 추락

Benj Edwards는 아무 기자가 아니었다. 그는 Ars Technica에서 AI 전담 기자로 활동하며, AI의 위험성과 한계를 알리는 데 앞장서 온 인물이다. AI 환각의 위험성을 경고하는 기사를 직접 쓴 사람이 AI 환각에 당한 것이다.

Edwards는 이 아이러니를 스스로 인정했다. "AI 기자가 AI 환각에 걸려 넘어진 이 아이러니를 모르는 바 아니다. 나는 내 작업의 정확성을 매우 중요하게 여기며, 이것은 고통스러운 실패다."

공동 저자인 Kyle Orland 시니어 게임 에디터도 기사에 이름이 올라 있었다. 하지만 Futurism의 보도에 따르면, Orland가 인용문 조작에 관여했다는 증거는 없었다. 책임은 Edwards 한 사람에게 집중됐다.

AI 보조 도구의 함정

Edwards의 사례가 보여주는 핵심 교훈은 명확하다. AI를 "보조 도구"로 쓴다는 것이 어떤 의미인지, 그 경계가 얼마나 모호한지를 드러낸 것이다.

그는 AI에게 기사를 쓰라고 한 것이 아니다. 취재 자료에서 인용문을 추출하라고 했을 뿐이다. 이것은 많은 기자가 "안전하다"고 생각하는 사용 방식이다. 요약, 정리, 추출. 창작이 아니라 정리니까 괜찮다고 믿는다.

하지만 AI는 추출과 창작의 경계를 구분하지 못한다. "이 텍스트에서 인용문을 뽑아줘"라는 요청에 대해 AI는 원문을 정확히 복사하는 대신, 자체적으로 재구성한 문장을 돌려줄 수 있다. 겉보기에는 인용문처럼 보이지만 실제로는 AI가 만들어낸 문장이다.

사용 방식	인식	실제 위험도
AI로 기사 작성	위험하다고 인식	높음
AI로 인용문 추출	안전하다고 인식	높음
AI로 문법 교정	안전하다고 인식	낮음
AI로 제목 브레인스토밍	안전하다고 인식	낮음

"AI로 인용문을 추출"하는 행위가 "AI로 기사를 쓰는" 것만큼 위험하다는 사실을 이 사건은 증명했다.

미디어 업계의 AI 딜레마

이 사건은 Edwards 개인의 실수로만 볼 수 없다. 미디어 업계 전체가 직면한 구조적 문제의 단면이다.

언론사 경영진은 AI 통합을 적극적으로 추진하고 있다. 비용 절감과 생산성 향상이라는 명목 아래, 기자들에게 AI 도구 활용을 권장하거나 심지어 강제하는 곳도 있다. 하지만 명확한 윤리 가이드라인은 대부분 부재한다.

사무실에서 해고 통보를 받는 상황을 상징하는 이미지

Ars Technica는 이 사건 이후 AI 사용 가이드라인을 공개하겠다고 약속했다. 하지만 다른 언론사들은 어떤가? 대부분의 뉴스룸에는 "AI를 취재에 어디까지 쓸 수 있는가"에 대한 명문화된 규정이 없다.

환각은 버그가 아니라 기본 기능이다

AI 환각은 수정될 "버그"가 아니다. 대규모 언어 모델이 작동하는 방식 자체에 내재된 특성이다. AI는 "정확한 인용문을 복사"하는 것과 "그럴듯한 인용문을 생성"하는 것의 차이를 근본적으로 이해하지 못한다. 두 작업 모두 AI에게는 **"다음에 올 가장 그럴듯한 토큰을 예측"**하는 동일한 과정이다.

Edwards의 경우처럼, 원문과 95% 일치하지만 5%가 다른 출력이 가장 위험하다. 완전히 틀린 답은 잡을 수 있다. 하지만 거의 맞는 답은 검증을 건너뛰게 만든다.

이 문제는 Claude든 ChatGPT든 Gemini든 모든 LLM에 동일하게 적용된다. 모델이 더 똑똑해질수록 환각도 더 그럴듯해진다. "더 좋은 AI를 쓰면 괜찮다"는 환상은 이 사건이 깨뜨린 또 다른 신화다.

AI 시대, 기자의 책임은 더 무거워졌다

Edwards는 해고당했다. 10년간 쌓아온 AI 전문 기자로서의 커리어가 AI 환각 하나로 무너졌다. 그를 동정할 수도 있다. 고열에 시달리면서도 마감을 지키려 한 성실함이 오히려 독이 됐으니까.

하지만 저널리즘의 원칙은 변하지 않는다. 인용문은 실제 발언이어야 한다. 이 원칙에는 "AI가 만든 경우는 예외"라는 단서가 붙지 않는다. 도구가 달라졌다고 기준이 달라지는 것은 아니다.

이 사건이 남긴 교훈은 단순하다. AI를 아무리 잘 알아도, AI의 출력을 검증하지 않으면 누구든 당할 수 있다. Edwards가 기자가 아니라 변호사였다면 법정 모독이었을 것이고, 의사였다면 의료 사고였을 것이다. AI 환각의 대가는 직업을 가리지 않는다.

AI를 도구로 쓰는 것은 괜찮다. 하지만 AI의 출력을 사실로 취급하는 순간, 그 책임은 AI가 아니라 사용자에게 돌아온다. Edwards의 해고는 그 대가가 얼마나 가혹한지를 보여준 사례다.

출처

Futurism - Ars Technica Fires Reporter Over AI-Generated Quotes