insane-search — 막힌 사이트는 없다
403? WAF? CAPTCHA? 빈 SPA? 로그인 벽? 모든 일반 도구가 포기할 때, insane-search는 막 시작된다.
개요
insane-search는 Claude Code용 플러그인/도구로, 방벽, CAPTCHA, SPA, 로그인 벽 등 어떤 사이트도 “접근 불가”로 처리하지 않는다. 5단계 적응형 프로브 체인이 모든 사이트에 완전한 시도를 시도하며, 항상 무언가 작동한다.
핵심 철학: “막혔다”는 사전 판단 금지. 매 사이트마다 완전한 체인을 적용.
5단계 프로브 체인
Phase 0: 특수 엔드포인트 인덱스
↓ 인덱스 없음 또는 실패
Phase 1: 경량 프로브 (병렬)
• WebFetch + Jina Reader
• Chrome / 모바일 / Googlebot UA로 curl
• URL 변형: m.{domain}, .json, /rss, /feed
• AMP 캐시, archive.today, Wayback (저신뢰)
↓ 403/429/WAF 감지
Phase 2: TLS 서명 속임수 + 신원 스푸핑
• curl_cffi로 safari → chrome → firefox 순회
• 신원 스푸핑: 홈페이지 쿠키 워밍 → 리퍼러 체인 → 지역 헤더
• Akamai _abck 감지 → Phase 3 스킵
• 누락 시 자동 설치: pip install curl_cffi
↓ TLS 우회 실패 또는 JS 챌린지 감지
Phase 3: 전체 브라우저
• Playwright MCP (browser_navigate → snapshot → evaluate)
• 네트워크 트래픽 감시로 숨겨진 API 발견
↓ 로그인/페이월 감지
Exit: "authentication required" — 이 단계에서는 해결 불가
주요 기능
- “막혔다”는 단어 모름 — 사전 판단 없이 모든 사이트 완전 시도
- 신원 스푸핑 내장 — Phase 2에서 TLS指纹만 아님. 전체 브라우저 신원 구축 (홈페이지 쿠키 워밍, 리퍼러 체인, 지역 헤더)
- 의도 기반 라우팅 — “URL 가져오기”와 “키워드 검색”을 다른 문제로 취급. WebSearch/Naver 검색으로 URL 얻은 후 내용 페칭. 2단계 파이프라인 자동화
- 스스로 무기 설치 —
curl_cffi,feedparser,yt-dlp등 누락된 의존성 자동 설치 - 숨겨진 API 발견 — Phase 3에서 브라우저 네트워크 트래픽 감시, 내부 JSON API 포착 및 재사용
- 제로 설정 마찰 — API 키, OAuth, 개발자 포털 불필요
플랫폼별 인덱스
| 플랫폼 | 방법 |
|---|---|
| X/Twitter | syndication (타임라인) + oEmbed (단일 트윗) + WebSearch 키워드 검색 |
URL + .json + 모바일 UA | |
| Bluesky | AT Protocol (public.api.bsky.app/xrpc/...) |
| Mastodon | 인스턴스별 공개 API |
| Hacker News | Firebase API + Algolia Search |
| Naver 블로그 | 적응형 스케줄러 자동 처리 |
| Coupang | 적응형 스케줄러 자동 처리 |
| 적응형 스케줄러 자동 처리 | |
| Medium, Substack | 적응형 스케줄러 자동 처리 |
설치 (Claude Code)
# 1. 마켓플레이스 추가
/plugin marketplace add https://github.com/fivetaku/gptaku_plugins.git
# 2. 플러그인 설치
/plugin install insane-search
# 3. Claude Code 재시작
# 4. 바로 사용!사용 예시
"Show me what's trending on r/LocalLLaMA"
"What did @openclaw post on X recently?"
"Search X for posts about insane-search"
"Summarize this YouTube video"
"Search Coupang for under ₩100,000 keyboards"
"Read this Naver blog post for me"
"네이버에서 클로드코드 관련 뉴스 찾아줘"
"Find LinkedIn articles about Claude Code plugins"
핵심 원리
- 어떤 방법도 사전 제외 금지 — 의존성 누락 시 설치하고 시도
- “접근 불가” 레이블 금지 — 사이트는 변하고 방법이 작동할 수 있음
- 모든 HTML 응답 스캔 — OGP 태그 + JSON-LD 구조화 데이터에서 제목, 요약, 가격, 프로필 정보 추출
- 적응적 에스컬레이션 — 이전 단계가 실패할 때만 다음 단계로 진행