pi-autoresearch

AI 코딩 에이전트 pi를 위한 자율 최적화 루프 확장 — 아이디어를 시도하고, 측정하고, 성과를 유지하고, 실패를 폐기하고, 반복.

요약

davebcn87/pi-autoresearch는 터미널에서 실행되는 AI 코딩 에이전트 pi를 위한 확장입니다. karpathy/autoresearch에서 영감을 받아 자율 최적화 루프를 구현합니다.

핵심 기능

자동화된 실험 루프

아이디어 → 실행 → 벤치마크 → 개선 유지 → 회귀 되돌리기 → 반복

도구

  • init_experiment: 세션 구성 (이름, 지표, 단위, 방향)
  • run_experiment: 명령어 실행 및 측정
  • log_experiment: 결과 기록 및 위젯 업데이트

서브커맨드

  • /autoresearch <text>: 자동 연구 모드 진입/재개
  • /autoresearch off: 자동 연구 모드 종료
  • /autoresearch clear: 모든 상태 초기화

활용 예시

도메인지표명령어
테스트 속도seconds ↓pnpm test
번들 크기KB ↓pnpm build && du -sb dist
LLM 훈련val_bpb ↓uv run train.py
빌드 속도seconds ↓pnpm build
Lighthouseperf score ↑lighthouse http://localhost:3000 —output=json

구조

확장 vs 스킬 분리

  • Extension (global): 도구, 위젯, 대시보드 — 도메인 독립적
  • Skill (per-domain): 도메인 지식 — 명령어, 지표, 범위

세션 파일

  • autoresearch.md: 세션 문서 — 목표, 지표, 시도 내역
  • autoresearch.sh: 벤치마크 스크립트
  • autoresearch.checks.sh: (선택) 정확성 검사 — 테스트, 타입, 린트

UI

  • 위젯: 항상 에디터 상단에 표시
  • Ctrl+X: 대시보드 확장/축소
  • Ctrl+Shift+X: 전체 화면 대시보드 오버레이

신뢰도 점수 (Confidence Score)

3회 이상 실험 후 계산됩니다:

  • 🟢 ≥ 2.0×: 개선이 실제일 가능성 높음
  • 🟡 1.0–2.0×: 노이즈 이상이지만 미미
  • 🔴 < 1.0×: 노이즈 내 — 재실행 권장

MAD (Median Absolute Deviation) 기반 노이즈 추정.

설치

pi install https://github.com/davebcn87/pi-autoresearch

설정

autoresearch.config.json로 동작 커스터마이징:

{
  "workingDir": "/path/to/project",
  "maxIterations": 50
}

영감


관련

  • pi
  • autoresearch

Source: https://github.com/davebcn87/pi-autoresearch