Codex가 삼성 TV를 해킹함 — AI 에이전트의 실제 하드웨어 공격 체인
이 사례는 AI가 취약점 분석 보조를 넘어 실제 장치에서 권한 상승 체인을 완성하는 실행 주체로 이동하고 있음을 보여준다.
개요
GeekNews가 정리한 실험에서 Codex는 삼성 스마트 TV의 브라우저 셸 권한에서 시작해 루트 권한까지 상승했다. 연구팀은 펌웨어 소스, 실시간 셸 접근, 헬퍼 바이너리 빌드 환경을 제공했고, Codex는 로그 해석·명령 생성·실패 수정·재시도 루프를 반복하며 공격 경로를 스스로 완성했다. 핵심 취약점은 Novatek 계열 드라이버의 world-writable 디바이스 노드(/dev/ntksys, /dev/ntkhdma)였고, 이를 통해 물리 메모리 읽기/쓰기 primitive를 확보한 뒤 커널 cred 구조체를 수정해 root shell을 얻었다.
중요한 점은 이 사례가 단순 정적 코드 분석이 아니라 실제 디바이스 상태, 빌드 아티팩트, 셸 출력, 실패 피드백을 포함하는 상호작용형 공격 루프였다는 것이다. 즉 “도구를 부를 수 있는 LLM”이 아니라 “실험실에서 실제 취약점 악용 절차를 밀어붙이는 에이전트”에 가까웠다.
핵심 포인트
- 브라우저 셸 → 커널 cred 수정 → 루트 셸까지 이어진 완전한 권한 상승 체인
- 펌웨어 소스 코드와 실시간 장치 접근을 함께 활용
ntksys/ntkhdma경로를 통해 물리 메모리 접근 primitive 확보- 실패 로그를 읽고 헬퍼를 다시 빌드하는 반복 루프 수행
- AI 보안 연구와 실제 공격 자동화 경계가 매우 얇아졌음을 시사
왜 중요한가
이 노트는 2026-04-08-claude-mythos-preview-benchmarks가 암시한 frontier 모델의 사이버 능력을 더 구체적인 실험 사례로 보여준다. 동시에 2026-04-16-openai-agents-sdk-next-evolution이나 codex가 말하는 도구 사용형 코딩 에이전트가, 보안 영역에서는 얼마나 공격적으로 확장될 수 있는지도 드러낸다.
즉 코딩 에이전트의 가치는 생산성 향상에만 있지 않다. 동일한 능력은 리버싱, 디바이스 분석, exploit 작성, 루트 원인 추적 같은 고위험 업무에도 그대로 전이된다. 앞으로 에이전트 평가에서 보안 격리와 정책 계층이 더욱 중요해질 이유다.
Sources
- GeekNews: https://news.hada.io/topic?id=28617
- Calif Blog: https://blog.calif.io/p/codex-hacked-a-samsung-tv
Related Notes
- codex — OpenAI Codex CLI 엔티티 페이지
- 2026-04-08-claude-mythos-preview-benchmarks — 고위험 사이버 능력 평가 맥락
- 2026-04-16-openai-agents-sdk-next-evolution — Codex 스타일 도구 체인의 제품화
- 2026-03-29-jai-ai-isolation — 공격적 도구 사용을 제한하는 격리 계층 메모
- moc-ai-coding