Files
luke_scribe/README.md
lukehemmin 73380bebf9 feat(p1): faster-whisper engine + audio ingest + transcribe (CPU verified)
- engine/: FasterWhisperEngine 래퍼 + model_registry (turbo→CT2 repo)
- audio/ingest.py: ffprobe duration/size probe + 413 상한 훅
- cli transcribe: device-auto, model 오버라이드, 413 가드, model_used 출력
- 단위 테스트 3 (resolve_model, probe_media); README 갱신

검증(CPU): JFK 11s 클립 → 정확 전사, detected_lang=en. 10 tests pass, ruff clean.

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-07 15:07:41 +09:00

1.2 KiB

luke_scribe

내부용 로컬 STT 전사 API — faster-whisper(CTranslate2) 기반, 하드웨어 적응형. 단일 Job 추상화로 배치(파일/영상)와 실시간(WebSocket)을 처리한다.

설계 단일 진실원본(SoT): .omc/plans/consensus-luke-scribe-stt-api.md, .omc/specs/deep-interview-luke-scribe-stt-api.md

상태

  • 설계 완료(모호도 ~5%) · 구현 P1 진행 중 (greenfield).

빠른 시작 (개발)

uv sync                                            # 코어 의존성
uv run luke-scribe detect                          # 하드웨어 감지 → 능력등급/정밀도/워커수
uv sync --extra engine                             # 엔진(faster-whisper)
uv run luke-scribe transcribe FILE --model tiny    # 단발 전사

CLI

명령 설명 상태
detect 하드웨어 감지·능력등급(T0~T3)·정밀도·워커수 P1
transcribe <file> 단발 파일 전사 (faster-whisper, CPU/GPU) P1
bench turbo vs large-v3 도메인 벤치(게이트) P1 (샘플셋 필요)
serve API 서버 P2