MOC - Multimedia & Speech AI

음성 인식(STT), 음성 합성(TTS), 음성 입력 앱, Apple Speech API 관련 노트 모음


음성 입력 앱 (macOS)

노트설명
2026-04-04-whispree-korean-stt-llm-voice-input한국어 개발자용 STT + LLM 교정 음성 입력 (Groq/Codex)
2026-04-04-vvrite-on-device-voice-typingQwen3-ASR 온디바이스 음성 타이핑 (한국어 우수)
2026-04-04-freeflow-voice-dictationGroq 기반 무료 음성 받아쓰기 (컨텍스트 인식)

Apple Speech API

노트설명
2026-04-04-apple-speech-api-whisper-alternativeSpeechAnalyzer/SpeechTranscriber — Whisper 대비 2.2배 빠른 전사

음성 인식 모델

노트설명
2026-04-04-apfel-mac-builtin-aiMac 내장 Apple 온디바이스 LLM 활용 도구 (FoundationModels.framework)

비디오·미디어 다운로드

노트설명
2026-04-05-open-source-video-download-extensionsVDH 대안 — Media Downloader Unleashed, Turbo DM, VidBee 등

음성 입력 앱 비교

모델한국어네트워크후처리비고
WhispreeGroq/Codex + LLM우수 (교정)필요LLM 교정Structured Mode, Visual Context
vvriteQwen3-ASR우수불필요없음온디바이스 전용
FreeFlowGroq + LLM보통필요LLM 후처리컨텍스트 인식
Apple Speech APISpeechAnalyzer미확인불필요없음34분 영상 45초 처리

관련 MOC