PokeClaw (PocketClaw) — 온디바이스 AI 안드로이드 폰 자동화

첫 온디바이스 AI 폰 제어 앱. Gemma 4 기반, 클라우드 없이, API 키 없이, 월간 요금 없이. OpenClaw에서 영감받은 포켓 버전.

개요

Gemma 4 (2026-04-02 출시)의 네이티브 tool calling을 LiteRT-LM으로 안드로이드에서 구동. 폰 내부에서 완전한 closed-loop 파이프라인.

다른 앱: Phone → Internet → Cloud API → Internet → Phone 💳
PokeClaw: Phone → LLM → Phone (인터넷 없음, API 키 없음, 요금 없음)

핵심 특징

  • 2.3B 모델 (Gemma 4 E2B)이 CPU만으로도 폰 자율 제어 가능
  • 온디바이스 tool calling via LiteRT-LM
  • 완전 오프라인 동작 (WiFi 불필요)
  • 무료 (API 키, 구독, 사용량 제한 없음)

성능

CPU-only 기준 웜업 ~45초 (저가 안드로이드). GPU/NPU 있으면 훨씬 빠름:

  • Google Tensor G3/G4 (Pixel 8/9)
  • Snapdragon 8 Gen 2/3 (Galaxy S24, OnePlus 12)
  • Dimensity 9200/9300
  • Snapdragon 7+ Gen 2+

도구 (Tools)

Tool동작
tap / swipe / long_press화면 터치
input_text텍스트 입력
open_app앱 실행
send_message메시지 전송 전체 플로우
auto_reply특정 연락처 모니터링 + 자동 답장
get_screen_infoUI 트리 읽기
take_screenshot화면 캡처
finish작업 완료 신호

Skills 시스템

2.3B 모델은 어떤 도구를 써야 할지 스스로 판단하기 어려우므로 플레이북(Workflow) 제공:

  • Auto-reply: 알림 감지 → 채팅 열기 → 대화 읽기 → 맥락 기반 답장 → 전송
  • Morning briefing: 날씨 앱 → 캘린더 → 이메일 → 요약
  • Smart forward: 알림 → 메시지 읽기 → 다른 연락처로 요약 전달
  • Auto-booking: 예약 앱 → 시간 검색 → 상세 입력 → 확인

Claude Code의 스킬 아키텍처에서 영감. 도구 = 블록, 스킬 = 레시피. 커뮤니티가 직접 스킬을 작성/공유할 수 있도록 오픈 예정.

모델이 똑똑해지면(7B, 13B) 스킬 없이도 자율 제어 가능해질 것.

기술 스택

  • 모델: Gemma 4 E2B (2.3B)
  • 런타임: LiteRT-LM (Google)
  • 플랫폼: Android (Kotlin)
  • 오픈소스, 무료

현재 상태

v0.3.0, 프로토타입 단계. 클라우드 LLM 지원은 optional feature로 추가 예정. 많은 이슈가 있으니 버그 리포트 환영.

관련 노트

출처