feat(p1): faster-whisper engine + audio ingest + transcribe (CPU verified)

- engine/: FasterWhisperEngine 래퍼 + model_registry (turbo→CT2 repo)
- audio/ingest.py: ffprobe duration/size probe + 413 상한 훅
- cli transcribe: device-auto, model 오버라이드, 413 가드, model_used 출력
- 단위 테스트 3 (resolve_model, probe_media); README 갱신

검증(CPU): JFK 11s 클립 → 정확 전사, detected_lang=en. 10 tests pass, ruff clean.

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
This commit is contained in:
2026-06-07 15:07:41 +09:00
parent d75d60671e
commit 73380bebf9
8 changed files with 202 additions and 8 deletions
+5 -5
View File
@@ -11,16 +11,16 @@
## 빠른 시작 (개발)
```bash
uv sync # 코어 의존성
uv run luke-scribe detect # 하드웨어 감지 → 능력등급/정밀도/워커수
# 엔진(transcribe/bench)은 다음 증분:
# uv sync --extra engine
uv sync # 코어 의존성
uv run luke-scribe detect # 하드웨어 감지 → 능력등급/정밀도/워커수
uv sync --extra engine # 엔진(faster-whisper)
uv run luke-scribe transcribe FILE --model tiny # 단발 전사
```
## CLI
| 명령 | 설명 | 상태 |
|------|------|------|
| `detect` | 하드웨어 감지·능력등급(T0~T3)·정밀도·워커수 | ✅ P1 |
| `transcribe <file>` | 단발 파일 전사 | P1 |
| `transcribe <file>` | 단발 파일 전사 (faster-whisper, CPU/GPU) | P1 |
| `bench` | turbo vs large-v3 도메인 벤치(게이트) | ⏳ P1 (샘플셋 필요) |
| `serve` | API 서버 | ⏳ P2 |