DeepSeek-V4-Pro 가장 저렴하게 쓰는 법

결론: 절대 최저가는 DeepSeek 공식 API + 컨텍스트 캐싱. 자가 호스팅은 거의 항상 더 비싸다. 해외/프라이버시·무료 체험 같은 조건에 따라 최적 경로가 갈린다. (기준일 2026-05-31) 대상: DeepSeek-V4-Pro = 1.6T MoE(활성 49B), 1M 컨텍스트, MIT 오픈웨이트. 가격 비교는 deepseek-v4 참조.

먼저 함정 둘

  1. 모델 ID는 반드시 deepseek-v4-pro. deepseek-chat/deepseek-reasoner는 V4-Pro가 아니라 12배 싼 V4-Flash로 매핑된다(품질 다름).
  2. V4-Pro는 1.6T라 :free 무료 변형이 없다(무료는 Flash뿐). 프리뷰라 일부 제공사는 호스팅조차 안 함.

최저가 랭킹 (요약)

순위방법실효 단가 (입력/출력 $/1M)핵심 조건
🥇공식 API + 컨텍스트 캐싱캐시적중 입력 **0.87반복 컨텍스트면 입력 99%↓ (자동)
🥇공식 API (캐시 미적중)0.87 (¥3/¥6)절대 바닥값, 중국 직속·프라이버시 유의
🥈중국 클라우드 무료 쿼터단가 동일 + 무료 토큰알리바바 100만 / 火山 50만+초대권. 실명인증
🥉서구 제공사 (OpenRouter 등)0.87 ~ 블렌디드 $0.6~0.8해외·프라이버시 대안, 카드 결제
자가 호스팅자체비용 ~$3/1M (8×H200)대부분 API보다 비쌈

1. DeepSeek 공식 API — 절대 최저가 (+ 절감 레버)

오늘(5/31) 75% 프로모가 종료되지만 동일 단가가 영구 정가로 전환 → 6/1에도 안 오른다(인상 아님).

항목단가 (USD / 위안)
입력 (캐시 적중)$0.435 / ¥3
입력 (캐시 중)$0.0036 / ¥0.025 ← 99% 절감
출력$0.87 / ¥6

절감 레버

  • 컨텍스트 캐싱(최강) — 자동·코드 수정 불필요. 시스템 프롬프트·참조 문서 등 불변 내용을 프롬프트 맨 앞에 고정하면 입력가 0.0036**. RAG·멀티턴·반복 호출에 최적.
  • 신규 가입 무료 500만 토큰(~30일, 카드 불필요)으로 테스트.
  • 오프피크 할인(16:30~00:30 UTC): V3 50%·R1 75% 확인되나 V4-Pro 적용은 공식 미확인(의존 금지).
  • 전용 Batch 50% 할인 티어는 ❌ 공식에 없음(루머). “USD↔CNY 4배 괴리”는 착시(할인가/정가·Pro/Flash 혼동).

2. 서구 제공사 / 아그리게이터 (해외·프라이버시 대안)

중국 직속 API의 데이터 학습이 꺼려질 때. 블렌디드(입력:출력 3:1) 저렴순:

제공사입력/출력 $/1M비고
OpenRouter0.87공식가 미러, 라우팅. 카드/암호화폐
GMICloud블렌디드 ~$0.64집계상 서구 최저
Fireworks AI블렌디드 ~$0.79속도 최고(~167 t/s)
DeepInfra2.60 (캐시 $0.10)FP4+FP8, 반복 컨텍스트 유리
Together AI4.40⚠️ 컨텍스트 512K만, FP4
  • 무료/체험: DeepInfra 1, Together 스타트업 최대 $50k(심사). V4-Pro 자체 무료는 없음.
  • ⚠️ 블로그에 구가격(3.48) 잔존 → 라이브 재확인. FP4 양자화 품질 손실 가능. Hyperbolic/Parasail/Lambda는 V4-Pro 호스팅 미확인. 데이터 학습 정책은 각사 ToS 확인.

전체 출시 모델 가격 비교는 2026-04-24-openrouter-model-pricing-comparison 참조.


3. 중국 클라우드 (단가 동일 → 무료 쿼터로 승부)

거의 모두 공식가와 동일(官网一致) → 차이는 무료 증정·접근성.

플랫폼무료/증정해외 접근성
阿里云 百炼(알리바바)개통 즉시 100만 토큰 무료 + 패키지 4.5折중국 실명인증
火山引擎(바이트댄스)신규 50만 + 초대 145元권(≈3,625만 토큰) + Agent Plan 80%↓중국 실명인증
PPIO 派欧云신규 50元 V4권(선착순)◎ 영문·국제 도메인
SiliconFlow가입 크레딧.com·영문·USD (해외 최적)
腾讯 TokenHub / 百度 千帆체험 제공중국 실명인증
  • ⚠️ V4-Pro 프리뷰는 처리량 제한(GPU 算力 제약) — 대량/실시간은 대기 가능. 하반기 화웨이 Ascend 양산 후 추가 인하 예고.
  • 国内 콘솔(火山/阿里/腾讯/百度)은 실명인증·알리페이/위챗 장벽 → 해외라면 SiliconFlow·PPIO 우선.

4. 자가 호스팅 — 대부분 비추천

V4-Pro는 1.6T라 공식 FP4로도 8×H200(141GB) 단일노드가 최소(~3/1M로 현재 API 출력가($0.87)보다 수 배 비싸다.

  • API가 싼 경우: 산발~중간 트래픽 → 사실상 항상 API 승.
  • 자가 호스팅 유리: 8×H200을 24/7 고이용률(월 수십억 토큰+)로 풀가동, 또는 온프레미스 프라이버시·파인튜닝이 필수일 때.
  • Mac Studio 512GB: antirez ds4(Metal)로 q2 ~27 / q4 ~26 t/s, 단일 사용자·실험용.
  • 저비용 CPU 오프로드(KTransformers): V4-Pro 미문서화, V4-Flash만 현실적(RTX 5090+256GB RAM ~20 t/s).
  • → 직접 굴릴 거면 Pro 대신 Flash.

상황별 추천

  • 무조건 최저가(프라이버시 무관) → 공식 API + 컨텍스트 캐싱(반복 컨텍스트면 입력 $0.0036).
  • 해외 + 카드 + 프라이버시 대안 → OpenRouter(공식가 미러) 또는 SiliconFlow/PPIO.
  • 무료 최대화 → DeepSeek 500만 → 阿里 100만/火山 50만+초대권 → DeepInfra 1.
  • 대량·온프레미스 → 8×H200 자가 호스팅 검토(그 외 비경제적).
  • 가성비 우선·품질 약간 양보V4-Flash(0.28) = Pro의 1/12.

관련 노트