predictor.yaml
predictor initFull Reference
# ═══════════════════════════════════════════════════════════════
# Model Source (choose one)
# ═══════════════════════════════════════════════════════════════
model: ./path/to/model.gguf # Local file path
# OR
hf_model: org/model-id # HuggingFace model ID
# ═══════════════════════════════════════════════════════════════
# Server Settings
# ═══════════════════════════════════════════════════════════════
port: 8000 # Local server port
timeout: 60 # Request timeout (seconds)
max_concurrent: 10 # Connection pool size
# ═══════════════════════════════════════════════════════════════
# Model Type & API Format
# ═══════════════════════════════════════════════════════════════
type: text # text | audio | image (auto-detected)
api_format: auto # auto | openai | generic
streaming_format: sse # sse | raw
# ═══════════════════════════════════════════════════════════════
# Health Check
# ═══════════════════════════════════════════════════════════════
health_check:
endpoint: /health # Health check path
interval: 30 # Check interval (seconds)
# ═══════════════════════════════════════════════════════════════
# Hardware Configuration
# ═══════════════════════════════════════════════════════════════
hardware:
backend: auto # auto | cuda | metal | cpu
# ═══════════════════════════════════════════════════════════════
# Inference Settings
# ═══════════════════════════════════════════════════════════════
inference:
max_concurrent: 1 # Sequential by default
request_queue_size: 100 # Queue depth limit
# ═══════════════════════════════════════════════════════════════
# Security
# ═══════════════════════════════════════════════════════════════
allowed_ips: # IP allowlist (CIDR)
- "192.168.1.0/24"
- "10.0.0.5"
# ═══════════════════════════════════════════════════════════════
# Logging
# ═══════════════════════════════════════════════════════════════
log_level: info # info | metadata | headers | bodies
# ═══════════════════════════════════════════════════════════════
# Metadata (displayed in dashboard)
# ═══════════════════════════════════════════════════════════════
metadata:
name: "My Model"
version: "v1.0"
type: "llm"
# ═══════════════════════════════════════════════════════════════
# Audio Settings (Whisper)
# ═══════════════════════════════════════════════════════════════
audio:
language: auto # or specific language code
# ═══════════════════════════════════════════════════════════════
# TTS Settings
# ═══════════════════════════════════════════════════════════════
tts:
default_voice: af_bellaMinimal Examples
Text Model (GGUF)
HuggingFace Model
Whisper
TTS
Configuration Priority
Log Levels
Level
What's Logged
IP Allowlist
Last updated