e.V.
Vorhaben · ● Jetzt · Plattform · KW 22–24 · aktualisiert 2026-05-21

Mukke Vocal-Studio — GPU-Phase 2: echte Modelle statt Stubs

Die vier GPU-Services für Mukkes Vocal-Studio (Stems, Music-Gen, Pitch, Mix) laufen seit KW 20 live als Stub-Implementierungen. Phase 2 ersetzt sie durch die tatsächlichen Modelle auf der RTX-3090-Workstation in Tägerwilen.

Schritte

Was als Nächstes ansteht

  1. `stems.mana.how` auf Demucs (htdemucs-ft) umstellen, Stub-Endpoint deaktivieren, Mac-Mini-Tunnel auf den GPU-Container relayen.
  2. `music-gen.mana.how` auf MusicGen-Medium (Meta) — Lizenz prüfen, alternativ Stable-Audio-Open.
  3. `pitch.mana.how` auf RMVPE oder CREPE, Frame-Pitch-Auflösung nachziehen (Follow-up aus μ-12).
  4. `mix.mana.how` Mastering-Chain (Loudness, Soft-Clip, dezenter EQ) auf Pedalboard.
  5. Memorization-Test gegen Trainingsdaten dokumentieren, COMPLIANCE-Veto auflösen.
Offene Punkte

Was uns aufhält, was wir noch nicht entschieden haben

Die ehrliche Seite: wenn etwas nicht weiterkommt, liegt es meist an einer der hier gelisteten Abhängigkeiten oder offenen Fragen.

Hängt ab von
  • Cloudflared erreicht 192.168.178.11 (GPU-Box) nicht direkt; Phase 1 nutzt Python-Relay localhost:1312x → GPU:312x als crontab @reboot. Phase 2 soll diesen Workaround sauber dokumentieren oder durch direkte Tunnel-Route ersetzen.
Offene Fragen
  • Reicht MusicGen-Medium qualitativ für unsere Use-Cases, oder müssen wir Stable-Audio-Open evaluieren?
  • Wie weit lassen sich die Modelle auf einer 24-GB-Karte gleichzeitig laden, ohne Cold-Start-Sprünge zu produzieren?
Belege

Wo dieses Vorhaben in der Doku oder im Code lebt

Vorhaben sind die vorwärts-gerichtete Schwester des Devlogs. Erledigtes wandert in die passende Kalenderwoche, damit hier nur das steht, was wirklich noch ansteht.