8f6f8969fd26c92ce8ede3887edcee4ce298cf07
- api/: FastAPI app, X-API-Key 인증(미설정 시 임시키), 엔진 load-once 풀 (+transcribe lock), POST /v1/transcribe(multipart, 동기), /health, /v1/system, /v1/models. 업로드 임시파일 finally 삭제(프라이버시). - postprocess/: llm.correct(scripts/llm_correct.py 승격; opt-in·allowlist·감사로그·재시도) + rules.normalize(EmbeddingGemma 등 정규화). - results/formats.py: txt/srt/vtt. connectivity/tunnel.py: cloudflared quick tunnel(Colab). - cli serve: uvicorn 단일워커 + --tunnel cloudflare; config llm_* 필드; pyproject api/queue extra 분리(+python-multipart, dev httpx). 검증: 22 단위테스트(API TestClient·formats·postprocess) + 실서버 e2e (/health·auth 401·실제 전사(JFK)·SRT·임시파일 삭제). KO 품질은 turbo/large-v3 필요(tiny는 한국어 degenerate). Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
luke_scribe
내부용 로컬 STT 전사 API — faster-whisper(CTranslate2) 기반, 하드웨어 적응형.
단일 Job 추상화로 배치(파일/영상)와 실시간(WebSocket)을 처리한다.
설계 단일 진실원본(SoT):
.omc/plans/consensus-luke-scribe-stt-api.md,.omc/specs/deep-interview-luke-scribe-stt-api.md
상태
- 설계 완료(모호도 ~5%) · 구현 P1 진행 중 (greenfield).
빠른 시작 (개발)
uv sync # 코어 의존성
uv run luke-scribe detect # 하드웨어 감지 → 능력등급/정밀도/워커수
uv sync --extra engine # 엔진(faster-whisper)
uv run luke-scribe transcribe FILE --model tiny # 단발 전사
CLI
| 명령 | 설명 | 상태 |
|---|---|---|
detect |
하드웨어 감지·능력등급(T0~T3)·정밀도·워커수 | ✅ P1 |
transcribe <file> |
단발 파일 전사 (faster-whisper, CPU/GPU) | ✅ P1 |
bench |
turbo vs large-v3 도메인 벤치(게이트) | ⏳ P1 (샘플셋 필요) |
serve |
API 서버 | ⏳ P2 |
Description
Languages
Markdown
100%