Infrastruktur·Bewusste Externe·Live

Anthropic · OpenAI · Gemini

anthropic.com · openai.com · google.com

Große Sprachmodelle (Claude, GPT, Gemini) sind aus Compute-Größe und Modell-Qualität heraus heute nicht im Eigenbetrieb leistbar.

Mitigation

Was diese Abhängigkeit eingrenzt

mana-llm ist der einzige Ort im Code, an dem API-Keys liegen. Apps rufen nicht direkt bei den Anbietern an. Self-hosted-Fallbacks (Llama, Mistral, Gemma) sind als Pfad vorbereitet, wenn Modell-Qualität ausreicht.

Der Anbieter

Claude (Anthropic), GPT (OpenAI), Gemini (Google) — diese Modelle laufen auf Tausenden GPUs in fremden Rechenzentren. Sie selbst zu hosten würde einen achtstelligen Compute-Etat bedeuten, den der Verein nicht hat.

Wir kaufen API-Calls. Bewusst, mit Buchführung darüber, was wann zu welchem Anbieter geht. Drei statt einer Quelle, um nicht von einem einzigen Anbieter abhängig zu sein.

Was bei uns bleibt:

API-Keys: ausschließlich in mana-llm. Keine App, kein anderer Service hat direkten Anbieter-Zugang. Das macht Wechsel möglich, ohne in 17 Repos zu editieren.
Routing-Logik: welche Anfrage geht an welches Modell.
Rate-Limiting: Mana-Verbrauchsregeln, Quoten, Notbremsen.

Self-hosted-Pfad: Auf mana-gpu laufen schon kleine Modelle (Whisper, TTS, Embeddings). Sobald ein Llama/Mistral-class Modell für Verein-Anfragen ausreicht, wandert ein wachsender Anteil dorthin und weg von den drei externen Anbietern. Das ist ein langfristiger Migrations-Pfad, kein Big-Bang.

Was wir nicht tun: Wir mischen keine Trainings-Daten aus Vereins-Anfragen in Anbieter-Verträge. Wir benutzen die Anbieter zero-retention, soweit die Anbieter das vertraglich anbieten.

Wer drauf läuft

Konsumenten

Servicemana-llm

Cross-Link

Plattform-Services, die hier aufsitzen

Diese Services nennen Anthropic · OpenAI · Gemini in ihrem Infrastruktur-Frontmatter — sie sind direkt von diesem Baustein abhängig.

mana-llm
Eine Schnittstelle vor Anthropic, OpenAI, Gemini — ein Ort für API-Keys, ein Cost-Tracking, ein Audit.

Grundsätze

Was Anthropic · OpenAI · Gemini für den Verein verkörpert

Eigenbetrieb
Eigene Infrastruktur, quelloffener Stack.

Stand

Was offen ist

Llama-3-class Modelle auf [mana-gpu](/infrastruktur/mana-gpu) für die einfacheren Anfragen routen, um den Anteil externer Calls zu senken.
Per-Anbieter Quartals-Audit: was wurde geschickt, wie viel gekostet, was wäre lokal machbar gewesen.

Bewusste Externe

Weitere Infrastruktur dieser Art

Drittanbieter, den wir nicht selbst ersetzen können — beim Namen genannt, mit Mitigation.

Anthropic · OpenAI · Gemini ist ein Baustein der Vereins-Infrastruktur — eine von drei Schichten unter den Plattform-Services und Apps.

Alle Infrastruktur →Services, die darauf laufen