Enterprise API
TUP Chat & Shadow.
Als API.
Multi-LLM-Zugang mit Pseudonymisierung — DSGVO-konform, in Frankfurt gehostet, OpenAI-kompatibel. Eine Schnittstelle, drei Modelle, ein AVV.
Erstgespräch buchenWas ist möglich
Eine Schnittstelle, drei Modelle, kein Datenexport.
ChatGPT, Claude und Gemini hinter einer einzigen API. Sie integrieren einmal — wir routen, halten Quotas, kümmern uns um Failovers zwischen Anbietern, und stellen sicher, dass keine Daten den EU-Wirtschaftsraum verlassen.
Optional pro Request: TUP Shadow pseudonymisiert sensible Inhalte vor dem Modellaufruf und setzt die Originaldaten clientseitig wieder ein. Ihr Code sieht eine normale LLM-Antwort — der Modell-Anbieter sieht keinen Klartext.
Use Cases
Wofür Teams die API einsetzen.
Konstruierte Beispielszenarien — keine realen Mandantenbeziehungen.
- Eigene Anwendung, eigene UI — aber Sie wollen ChatGPT, Claude und Gemini nicht selbst anbinden und schon gar nicht selbst über DSGVO-Konformität streiten. Sie rufen TUP an, wir routen.
Pseudonymisierung als Pre-Processing-Schritt
Sie haben bereits einen LLM-Stack. Was Ihnen fehlt: ein Service, der vor jedem Call sensible Daten erkennt und durch Platzhalter ersetzt. TUP Shadow als API liefert genau das, ohne dass Sie es selbst bauen.Multi-Tenant-SaaS mit isolierten Tenants
Sie betreiben ein SaaS-Produkt für mehrere Kunden — und brauchen pro Tenant getrennte Inferenz, getrenntes Audit-Logging, getrennte Quotas. TUP API verwaltet Tenants nativ.
Technisch
Was Sie wissen müssen.
Hosting
Anwendung in Hetzner Nürnberg (NBG1), LLM-Inferenz in AWS Bedrock eu-central-1 / Google Vertex AI europe-west3 — beides Frankfurt. Kein Datentransfer außerhalb der EU.
Schema
OpenAI-kompatibles Chat-Completions-Schema. Drop-in für bestehende SDKs (OpenAI Node, Python, Go). Streaming via SSE.
Modelle
ChatGPT (GPT-4 / GPT-4o), Claude (Sonnet / Opus / Haiku), Gemini (Pro / Flash). Routing per Request-Header oder serverseitiger Policy.
Pseudonymisierung
TUP Shadow als optionaler Pre-Processing-Layer pro Request. Reversibel — Antwort kommt mit Originaldaten zurück. Konfigurierbare PII-Klassen pro Tenant.
Rate Limiting
Per Tenant, per User, per Modell. Burst- und Sustained-Limits. 429er enthalten X-RateLimit-Reset-Header für sauberes Backoff.
Audit-Log
Jeder Call wird mit Zeitstempel, Tenant, User, Modell und Token-Verbrauch geloggt — DSGVO-relevant für Compliance-Reviews. Export als JSON-Lines.
Pricing
Nutzungsbasiert. Mit Mindestabnahme.
TUP API kommt nicht mit einer Self-Service-Preisliste — die Konfiguration variiert deutlich nach Volumen, Tenant-Anzahl, Shadow-Nutzung und Reaktionszeit-Anforderungen.
Wir buchen ein 30-minütiges Erstgespräch, klären Ihren Use Case und schicken Ihnen ein konkretes Angebot — typischerweise innerhalb eines Werktags.
Erstgespräch buchen