lukehemmin 5d2604105b feat(p1): scaffolding + Device Manager / VRAM probe + CLI detect
- pyproject (uv, src layout) + extras: engine/gpu/api/diarize/llm
- config.py (pydantic-settings, SCRIBE_ env)
- devices/: vram_probe (NVML/psutil/disk) + DeviceManager →
  capability tier T0–T3, precision by cc/VRAM, worker estimate (계획 §3.6, AC-2/3)
- cli.py (typer): detect (구현) + transcribe/bench/serve (스텁)
- run.sh, .env.example, README

Verified on GTX 1050/2GB: detect → T0_CPU (turbo doesn't fit → explicit
downgrade, fail-explicit). Overrides (--device/--workers) work. 7 unit tests
cover T0–T3 + overrides via synthetic VRAM. ruff clean.

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-07 12:56:07 +09:00

luke_scribe

내부용 로컬 STT 전사 API — faster-whisper(CTranslate2) 기반, 하드웨어 적응형. 단일 Job 추상화로 배치(파일/영상)와 실시간(WebSocket)을 처리한다.

설계 단일 진실원본(SoT): .omc/plans/consensus-luke-scribe-stt-api.md, .omc/specs/deep-interview-luke-scribe-stt-api.md

상태

  • 설계 완료(모호도 ~5%) · 구현 P1 진행 중 (greenfield).

빠른 시작 (개발)

uv sync                       # 코어 의존성
uv run luke-scribe detect     # 하드웨어 감지 → 능력등급/정밀도/워커수
# 엔진(transcribe/bench)은 다음 증분:
# uv sync --extra engine

CLI

명령 설명 상태
detect 하드웨어 감지·능력등급(T0~T3)·정밀도·워커수 P1
transcribe <file> 단발 파일 전사 P1
bench turbo vs large-v3 도메인 벤치(게이트) P1 (샘플셋 필요)
serve API 서버 P2
S
Description
No description provided
Readme 716 KiB
Languages
Markdown 100%