DeepSeek-V4-Pro 가장 저렴하게 쓰는 법
결론: 절대 최저가는 DeepSeek 공식 API + 컨텍스트 캐싱. 자가 호스팅은 거의 항상 더 비싸다. 해외/프라이버시·무료 체험 같은 조건에 따라 최적 경로가 갈린다. (기준일 2026-05-31) 대상: DeepSeek-V4-Pro = 1.6T MoE(활성 49B), 1M 컨텍스트, MIT 오픈웨이트. 가격 비교는 deepseek-v4 참조.
먼저 함정 둘
- 모델 ID는 반드시
deepseek-v4-pro.deepseek-chat/deepseek-reasoner는 V4-Pro가 아니라 12배 싼 V4-Flash로 매핑된다(품질 다름).- V4-Pro는 1.6T라
:free무료 변형이 없다(무료는 Flash뿐). 프리뷰라 일부 제공사는 호스팅조차 안 함.
최저가 랭킹 (요약)
| 순위 | 방법 | 실효 단가 (입력/출력 $/1M) | 핵심 조건 |
|---|---|---|---|
| 🥇 | 공식 API + 컨텍스트 캐싱 | 캐시적중 입력 **0.87 | 반복 컨텍스트면 입력 99%↓ (자동) |
| 🥇 | 공식 API (캐시 미적중) | 0.87 (¥3/¥6) | 절대 바닥값, 중국 직속·프라이버시 유의 |
| 🥈 | 중국 클라우드 무료 쿼터 | 단가 동일 + 무료 토큰 | 알리바바 100만 / 火山 50만+초대권. 실명인증 |
| 🥉 | 서구 제공사 (OpenRouter 등) | 0.87 ~ 블렌디드 $0.6~0.8 | 해외·프라이버시 대안, 카드 결제 |
| — | 자가 호스팅 | 자체비용 ~$3/1M (8×H200) | 대부분 API보다 비쌈 |
1. DeepSeek 공식 API — 절대 최저가 (+ 절감 레버)
오늘(5/31) 75% 프로모가 종료되지만 동일 단가가 영구 정가로 전환 → 6/1에도 안 오른다(인상 아님).
| 항목 | 단가 (USD / 위안) |
|---|---|
| 입력 (캐시 미적중) | $0.435 / ¥3 |
| 입력 (캐시 적중) | $0.0036 / ¥0.025 ← 99% 절감 |
| 출력 | $0.87 / ¥6 |
절감 레버
- 컨텍스트 캐싱(최강) — 자동·코드 수정 불필요. 시스템 프롬프트·참조 문서 등 불변 내용을 프롬프트 맨 앞에 고정하면 입력가 0.0036**. RAG·멀티턴·반복 호출에 최적.
- 신규 가입 무료 500만 토큰(~30일, 카드 불필요)으로 테스트.
- 오프피크 할인(16:30~00:30 UTC): V3 50%·R1 75% 확인되나 V4-Pro 적용은 공식 미확인(의존 금지).
- 전용 Batch 50% 할인 티어는 ❌ 공식에 없음(루머). “USD↔CNY 4배 괴리”는 착시(할인가/정가·Pro/Flash 혼동).
2. 서구 제공사 / 아그리게이터 (해외·프라이버시 대안)
중국 직속 API의 데이터 학습이 꺼려질 때. 블렌디드(입력:출력 3:1) 저렴순:
| 제공사 | 입력/출력 $/1M | 비고 |
|---|---|---|
| OpenRouter | 0.87 | 공식가 미러, 라우팅. 카드/암호화폐 |
| GMICloud | 블렌디드 ~$0.64 | 집계상 서구 최저 |
| Fireworks AI | 블렌디드 ~$0.79 | 속도 최고(~167 t/s) |
| DeepInfra | 2.60 (캐시 $0.10) | FP4+FP8, 반복 컨텍스트 유리 |
| Together AI | 4.40 | ⚠️ 컨텍스트 512K만, FP4 |
- 무료/체험: DeepInfra 1, Together 스타트업 최대 $50k(심사). V4-Pro 자체 무료는 없음.
- ⚠️ 블로그에 구가격(3.48) 잔존 → 라이브 재확인. FP4 양자화 품질 손실 가능. Hyperbolic/Parasail/Lambda는 V4-Pro 호스팅 미확인. 데이터 학습 정책은 각사 ToS 확인.
전체 출시 모델 가격 비교는 2026-04-24-openrouter-model-pricing-comparison 참조.
3. 중국 클라우드 (단가 동일 → 무료 쿼터로 승부)
거의 모두 공식가와 동일(官网一致) → 차이는 무료 증정·접근성.
| 플랫폼 | 무료/증정 | 해외 접근성 |
|---|---|---|
| 阿里云 百炼(알리바바) | 개통 즉시 100만 토큰 무료 + 패키지 4.5折 | 중국 실명인증 |
| 火山引擎(바이트댄스) | 신규 50만 + 초대 145元권(≈3,625만 토큰) + Agent Plan 80%↓ | 중국 실명인증 |
| PPIO 派欧云 | 신규 50元 V4권(선착순) | ◎ 영문·국제 도메인 |
| SiliconFlow | 가입 크레딧 | ◎ .com·영문·USD (해외 최적) |
| 腾讯 TokenHub / 百度 千帆 | 체험 제공 | 중국 실명인증 |
- ⚠️ V4-Pro 프리뷰는 처리량 제한(GPU 算力 제약) — 대량/실시간은 대기 가능. 하반기 화웨이 Ascend 양산 후 추가 인하 예고.
- 国内 콘솔(火山/阿里/腾讯/百度)은 실명인증·알리페이/위챗 장벽 → 해외라면 SiliconFlow·PPIO 우선.
4. 자가 호스팅 — 대부분 비추천
V4-Pro는 1.6T라 공식 FP4로도 8×H200(141GB) 단일노드가 최소(~3/1M로 현재 API 출력가($0.87)보다 수 배 비싸다.
- API가 싼 경우: 산발~중간 트래픽 → 사실상 항상 API 승.
- 자가 호스팅 유리: 8×H200을 24/7 고이용률(월 수십억 토큰+)로 풀가동, 또는 온프레미스 프라이버시·파인튜닝이 필수일 때.
- Mac Studio 512GB: antirez
ds4(Metal)로 q2 ~27 / q4 ~26 t/s, 단일 사용자·실험용. - 저비용 CPU 오프로드(KTransformers): V4-Pro 미문서화, V4-Flash만 현실적(RTX 5090+256GB RAM ~20 t/s).
- → 직접 굴릴 거면 Pro 대신 Flash.
상황별 추천
- 무조건 최저가(프라이버시 무관) → 공식 API + 컨텍스트 캐싱(반복 컨텍스트면 입력 $0.0036).
- 해외 + 카드 + 프라이버시 대안 → OpenRouter(공식가 미러) 또는 SiliconFlow/PPIO.
- 무료 최대화 → DeepSeek 500만 → 阿里 100만/火山 50만+초대권 → DeepInfra 1.
- 대량·온프레미스 → 8×H200 자가 호스팅 검토(그 외 비경제적).
- 가성비 우선·품질 약간 양보 → V4-Flash(0.28) = Pro의 1/12.
관련 노트
- deepseek-v4 — 모델 개요·가격 인하 맥락
- moc-chinese-llm-models — 중국 LLM 플래그십 7종 가격·벤치마크 비교
- 2026-04-24-openrouter-model-pricing-comparison — OpenRouter 출시 모델 가격·컨텍스트 비교표
- 2026-04-27-mac-96gb-llm-recommendation — Mac 로컬에서 DeepSeek V4 Flash 등 구동 권장