MOC - AI Models

LLM, 모델 아키텍처, 벤치마크 관련 노트 모음

모델

노트	설명
2026-04-03-spreadsheet-terminal-bench	AI 에이전트 벤치마크 (Kevin Gu)
2026-03-22-chatgpt-thinking-mode-model-size	ChatGPT Thinking Mode - 모델 체급에 따른 특성과 한계
2026-05-28-llm-model-release-timeline	LLM 모델 출시 타임라인 — Claude & GPT (루머 포함)
2026-03-22-cloudflare-workers-ai-large-models	Cloudflare Workers AI — 엣지에서 대형 모델 실행
2026-03-22-github-trending-vllm-project-vllm-omni	vLLM Omni — 멀티모달 모델 서빙
2026-03-24-iphone-400b-llm	iPhone에서 400B LLM 구동
2026-03-26-qwen3.5-27b-claude-opus-distilled-v2	Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-v2
2026-03-29-minimax-glm-kimi-coding-comparison	MiniMax m2.7 vs GLM-5.1 vs Kimi k2.5 — 코딩 성능 비교
2026-05-19-karpathy-joins-anthropic	Karpathy의 Anthropic 합류 — 의미와 파급력
2026-03-31-karpathy-litellm-dependencies-reevaluation	Golang 철학 vs Python 의존성 체인 (LiteLLM 사건 이후)
2026-04-05-qwen3-6-plus	Qwen3.6-Plus
2026-04-16-qwen3-6-35b-a3b	Qwen3.6-35B-A3B — Qwen의 35B 멀티모달 에이전틱 코딩 모델
2026-04-22-qwen3-6-27b-open-source-agentic-coding	Qwen3.6-27B — compact size flagship coding, terminal-level agentic coding
2026-04-22-xiaomi-mimo-v2-5-open-source-agents-forward	Xiaomi MiMo-V2.5 — 오픈소스 에이전트/장기 실행 작업 강화 모델
2026-04-17-lyra-2-0	Lyra 2.0 — 단일 이미지에서 탐색 가능한 3D 월드를 생성하는 NVIDIA 프레임워크
2026-04-05-mac-mini-ollama-gemma4-setup	Mac mini Ollama + Gemma 4 설정
2026-04-08-gemma4-openclaw-ollama-3steps	Gemma 4 + OpenClaw 3단계 로컬 구동
2026-04-15-supergemma4-geeknews-coverage	SuperGemma4 GeekNews coverage — Gemma 4 26B 비검열/속도개선/양자화 소개
2026-04-08-claude-mythos-preview-benchmarks	Claude Mythos Preview 벤치마크
2026-04-15-fe-developer-ai-dsl-assistant	FE 개발자의 AI 활용 사례와 DSL Assistant 논문을 연결한 보존 메모
2026-04-15-anthropic-opus-4-7-ai-design-tool	Anthropic이 Opus 4.7과 함께 프롬프트 기반 디자인 툴까지 위로 확장하려는 신호
2026-04-16-claude-opus-4-7-release	Opus 4.7 정식 출시 — 코딩·장기 작업·비전 향상과 새 사이버 가드레일을 함께 발표
2026-04-26-openai-monitorability-evals	OpenAI가 CoT monitorability를 안전 평가 인프라로 공개한 데이터셋/코드 묶음
2026-04-15-gemini-3-1-flash-tts	자연어 지시와 오디오 태그로 스타일을 제어하는 Google의 최신 TTS 모델
2026-04-16-openai-oauth-chatgpt-account-openai-api	ChatGPT/Codex OAuth 캐시를 OpenAI 호환 localhost 프록시로 재노출하는 비공식 프로젝트
2026-04-16-chatgpt-for-excel	OpenAI가 Excel 리본 안으로 들어가 자연어 기반 시트 생성·분석·수정을 제공하는 공식 애드인
2026-04-16-ai-error-analysis-automation	Sentry→n8n→Gemini→Notion으로 에러 triage를 자동화하는 운영 패턴
2026-04-16-ai-fails-without-judgment	테스트와 자동화가 늘어도 구조 판단은 인간이 맡아야 한다는 실무 에세이
2026-04-16-cal-com-closed-source-security	Cal.com이 AI 기반 취약점 탐지를 이유로 프로덕션 제품을 닫고 Cal.diy만 MIT로 남긴 전환 사례
2026-04-16-stanford-ai-index-2026	Stanford AI Index 2026 — 성능 가속, 미중 격차 축소, 안전·노동·환경 비용을 함께 읽는 연간 상태 보고서
2026-04-16-pi-autoresearch-geeknews	Karpathy식 autoresearch를 테스트·빌드·Lighthouse까지 확장한 범용 자율 실험 루프 정리
2026-04-20-kimi-k2-6	Kimi K2.6 — 장기 실행 코딩, Agent Swarm, 툴 호출 안정성을 강화한 Moonshot AI의 오픈소스 모델
2026-04-25-ai-model-category-picks	2026-04-25 기준 카테고리별 최고의 AI를 실사용 축으로 정리한 메모
2026-04-20-kimi-k2-6-vs-qwen3-6-vs-opus-4-7	Kimi K2.6, Qwen3.6, Opus 4.7을 실무 선택 기준으로 비교한 코딩 에이전트 모델 가이드

2026-04-24 ~ 04-28 신규

노트	설명
2026-04-24-openrouter-model-pricing-comparison	OpenRouter 최근 출시 모델들의 API 가격·컨텍스트 윈도우 비교표
2026-05-08-omniroute	무료 AI gateway, 160+ providers, 13 routing strategies
2026-04-24-cloudflare-unweight-lossless-llm-compression	exponent Huffman coding으로 LLM 크기 22% 감소 — batch 1 처리량 41% 오버헤드
2026-04-24-threads-choi-openai-deepseek-v4-openweights	DeepSeek-V4 오픈웨이트 발표 — 100만 토큰·Think Max 주장, 검증 필요
2026-04-25-ai-model-category-picks	2026-04-25 기준 카테고리별 최고 AI 모델 셀렉션
2026-04-26-nemotron-personas-korea	국내 최초 대규모 한국어 페르소나 데이터셋 (700만 페르소나, 17억 토큰)
2026-04-27-mac-96gb-llm-recommendation	Mac 96GB+ Local LLM — Qwen3.6-27B보다 DeepSeek V4 Flash MLX·Minimax M2.7 우위
2026-04-26-swiftlm-apple-silicon-inference	Apple Silicon 네이티브 MLX 추론 서버, SSD Streaming + TurboQuant
2026-04-26-openai-monitorability-evals	OpenAI CoT 모니터링 기반 안전 평가 데이터셋/코드 공개
2026-04-26-local-llm-formats-comparison	MLX vs GGUF vs nvfp — 로컬 LLM 포맷별 용도·장단점 비교
2026-05-12-rapid-mlx-apple-silicon-local-ai-engine	Rapid-MLX — Apple Silicon 전용 초고속 로컬 AI 엔진
2026-05-19-whichllm	whichllm — 하드웨어 기반 로컬 LLM 추천 CLI
2026-05-12-llama-cpp-ollama-lmstudio-rapid-mlx-comparison	llama.cpp / Ollama / LM Studio / Rapid-MLX 비교 노트
2026-05-28-xiaomi-mimo-v2-5-price-cut-99-percent	Xiaomi MiMo-V2.5 API 최대 99% 영구 인하 — 딥시크 겨냥 가격 경쟁

인프라 & 도구

노트	설명
2026-03-21-qmd	QMD - Query Markup Documents (온디바이스 검색 엔진)

LLM Wiki

탐색기

MOC - AI Models

MOC - AI Models

모델

2026-04-24 ~ 04-28 신규

인프라 & 도구

관련 MOC

그래프 뷰

목차

백링크