73380bebf9
- engine/: FasterWhisperEngine 래퍼 + model_registry (turbo→CT2 repo) - audio/ingest.py: ffprobe duration/size probe + 413 상한 훅 - cli transcribe: device-auto, model 오버라이드, 413 가드, model_used 출력 - 단위 테스트 3 (resolve_model, probe_media); README 갱신 검증(CPU): JFK 11s 클립 → 정확 전사, detected_lang=en. 10 tests pass, ruff clean. Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
27 lines
1.2 KiB
Markdown
27 lines
1.2 KiB
Markdown
# luke_scribe
|
|
|
|
내부용 **로컬 STT 전사 API** — faster-whisper(CTranslate2) 기반, 하드웨어 적응형.
|
|
단일 `Job` 추상화로 배치(파일/영상)와 실시간(WebSocket)을 처리한다.
|
|
|
|
> 설계 단일 진실원본(SoT): [`.omc/plans/consensus-luke-scribe-stt-api.md`](.omc/plans/consensus-luke-scribe-stt-api.md),
|
|
> [`.omc/specs/deep-interview-luke-scribe-stt-api.md`](.omc/specs/deep-interview-luke-scribe-stt-api.md)
|
|
|
|
## 상태
|
|
- 설계 완료(모호도 ~5%) · 구현 P1 진행 중 (greenfield).
|
|
|
|
## 빠른 시작 (개발)
|
|
```bash
|
|
uv sync # 코어 의존성
|
|
uv run luke-scribe detect # 하드웨어 감지 → 능력등급/정밀도/워커수
|
|
uv sync --extra engine # 엔진(faster-whisper)
|
|
uv run luke-scribe transcribe FILE --model tiny # 단발 전사
|
|
```
|
|
|
|
## CLI
|
|
| 명령 | 설명 | 상태 |
|
|
|------|------|------|
|
|
| `detect` | 하드웨어 감지·능력등급(T0~T3)·정밀도·워커수 | ✅ P1 |
|
|
| `transcribe <file>` | 단발 파일 전사 (faster-whisper, CPU/GPU) | ✅ P1 |
|
|
| `bench` | turbo vs large-v3 도메인 벤치(게이트) | ⏳ P1 (샘플셋 필요) |
|
|
| `serve` | API 서버 | ⏳ P2 |
|