MOC - Multimedia & Speech AI

음성 인식(STT), 음성 합성(TTS), 음성 입력 앱, Apple Speech API 관련 노트 모음


음성 입력 앱 (macOS)

노트설명
Whispree한국어 개발자용 STT + LLM 교정 음성 입력 (Groq/Codex)
vvriteQwen3-ASR 온디바이스 음성 타이핑 (한국어 우수)
FreeFlowGroq 기반 무료 음성 받아쓰기 (컨텍스트 인식)

Apple Speech API

노트설명
Apple Speech APISpeechAnalyzer/SpeechTranscriber — Whisper 대비 2.2배 빠른 전사

음성 인식 모델

노트설명
apfelMac 내장 Apple 온디바이스 LLM 활용 도구 (FoundationModels.framework)

비디오·미디어 다운로드

노트설명
오픈소스 비디오 다운로드 브라우저 확장 비교VDH 대안 — Media Downloader Unleashed, Turbo DM, VidBee 등

음성 입력 앱 비교

모델한국어네트워크후처리비고
WhispreeGroq/Codex + LLM우수 (교정)필요LLM 교정Structured Mode, Visual Context
vvriteQwen3-ASR우수불필요없음온디바이스 전용
FreeFlowGroq + LLM보통필요LLM 후처리컨텍스트 인식
Apple Speech APISpeechAnalyzer미확인불필요없음34분 영상 45초 처리

관련 MOC