insane-search — 막힌 사이트는 없다

403? WAF? CAPTCHA? 빈 SPA? 로그인 벽? 모든 일반 도구가 포기할 때, insane-search는 막 시작된다.

개요

insane-search는 Claude Code용 플러그인/도구로, 방벽, CAPTCHA, SPA, 로그인 벽 등 어떤 사이트도 “접근 불가”로 처리하지 않는다. 5단계 적응형 프로브 체인이 모든 사이트에 완전한 시도를 시도하며, 항상 무언가 작동한다.

핵심 철학: “막혔다”는 사전 판단 금지. 매 사이트마다 완전한 체인을 적용.

5단계 프로브 체인

Phase 0: 특수 엔드포인트 인덱스
  ↓ 인덱스 없음 또는 실패
Phase 1: 경량 프로브 (병렬)
  • WebFetch + Jina Reader
  • Chrome / 모바일 / Googlebot UA로 curl
  • URL 변형: m.{domain}, .json, /rss, /feed
  • AMP 캐시, archive.today, Wayback (저신뢰)
  ↓ 403/429/WAF 감지
Phase 2: TLS 서명 속임수 + 신원 스푸핑
  • curl_cffi로 safari → chrome → firefox 순회
  • 신원 스푸핑: 홈페이지 쿠키 워밍 → 리퍼러 체인 → 지역 헤더
  • Akamai _abck 감지 → Phase 3 스킵
  • 누락 시 자동 설치: pip install curl_cffi
  ↓ TLS 우회 실패 또는 JS 챌린지 감지
Phase 3: 전체 브라우저
  • Playwright MCP (browser_navigate → snapshot → evaluate)
  • 네트워크 트래픽 감시로 숨겨진 API 발견
  ↓ 로그인/페이월 감지
Exit: "authentication required" — 이 단계에서는 해결 불가

주요 기능

  • “막혔다”는 단어 모름 — 사전 판단 없이 모든 사이트 완전 시도
  • 신원 스푸핑 내장 — Phase 2에서 TLS指纹만 아님. 전체 브라우저 신원 구축 (홈페이지 쿠키 워밍, 리퍼러 체인, 지역 헤더)
  • 의도 기반 라우팅 — “URL 가져오기”와 “키워드 검색”을 다른 문제로 취급. WebSearch/Naver 검색으로 URL 얻은 후 내용 페칭. 2단계 파이프라인 자동화
  • 스스로 무기 설치curl_cffi, feedparser, yt-dlp 등 누락된 의존성 자동 설치
  • 숨겨진 API 발견 — Phase 3에서 브라우저 네트워크 트래픽 감시, 내부 JSON API 포착 및 재사용
  • 제로 설정 마찰 — API 키, OAuth, 개발자 포털 불필요

플랫폼별 인덱스

플랫폼방법
X/Twittersyndication (타임라인) + oEmbed (단일 트윗) + WebSearch 키워드 검색
RedditURL + .json + 모바일 UA
BlueskyAT Protocol (public.api.bsky.app/xrpc/...)
Mastodon인스턴스별 공개 API
Hacker NewsFirebase API + Algolia Search
Naver 블로그적응형 스케줄러 자동 처리
Coupang적응형 스케줄러 자동 처리
LinkedIn적응형 스케줄러 자동 처리
Medium, Substack적응형 스케줄러 자동 처리

설치 (Claude Code)

# 1. 마켓플레이스 추가
/plugin marketplace add https://github.com/fivetaku/gptaku_plugins.git
 
# 2. 플러그인 설치
/plugin install insane-search
 
# 3. Claude Code 재시작
# 4. 바로 사용!

사용 예시

"Show me what's trending on r/LocalLLaMA"
"What did @openclaw post on X recently?"
"Search X for posts about insane-search"
"Summarize this YouTube video"
"Search Coupang for under ₩100,000 keyboards"
"Read this Naver blog post for me"
"네이버에서 클로드코드 관련 뉴스 찾아줘"
"Find LinkedIn articles about Claude Code plugins"

핵심 원리

  1. 어떤 방법도 사전 제외 금지 — 의존성 누락 시 설치하고 시도
  2. “접근 불가” 레이블 금지 — 사이트는 변하고 방법이 작동할 수 있음
  3. 모든 HTML 응답 스캔 — OGP 태그 + JSON-LD 구조화 데이터에서 제목, 요약, 가격, 프로필 정보 추출
  4. 적응적 에스컬레이션 — 이전 단계가 실패할 때만 다음 단계로 진행

관련 페이지

출처