Enterprise API

TUP Chat & Shadow.
Als API.

Multi-LLM-Zugang mit Pseudonymisierung — DSGVO-konform, in Frankfurt gehostet, OpenAI-kompatibel. Eine Schnittstelle, drei Modelle, ein AVV.

Erstgespräch buchen

Was ist möglich

Eine Schnittstelle, drei Modelle, kein Datenexport.

ChatGPT, Claude und Gemini hinter einer einzigen API. Sie integrieren einmal — wir routen, halten Quotas, kümmern uns um Failovers zwischen Anbietern, und stellen sicher, dass keine Daten den EU-Wirtschaftsraum verlassen.

Optional pro Request: TUP Shadow pseudonymisiert sensible Inhalte vor dem Modellaufruf und setzt die Originaldaten clientseitig wieder ein. Ihr Code sieht eine normale LLM-Antwort — der Modell-Anbieter sieht keinen Klartext.

Use Cases

Wofür Teams die API einsetzen.

Konstruierte Beispielszenarien — keine realen Mandantenbeziehungen.

DSGVO-konformer LLM-Zugang im Backend
Eigene Anwendung, eigene UI — aber Sie wollen ChatGPT, Claude und Gemini nicht selbst anbinden und schon gar nicht selbst über DSGVO-Konformität streiten. Sie rufen TUP an, wir routen.
Pseudonymisierung als Pre-Processing-Schritt
Sie haben bereits einen LLM-Stack. Was Ihnen fehlt: ein Service, der vor jedem Call sensible Daten erkennt und durch Platzhalter ersetzt. TUP Shadow als API liefert genau das, ohne dass Sie es selbst bauen.
Multi-Tenant-SaaS mit isolierten Tenants
Sie betreiben ein SaaS-Produkt für mehrere Kunden — und brauchen pro Tenant getrennte Inferenz, getrenntes Audit-Logging, getrennte Quotas. TUP API verwaltet Tenants nativ.

Technisch

Was Sie wissen müssen.

Hosting

Anwendung in Hetzner Nürnberg (NBG1), LLM-Inferenz in AWS Bedrock eu-central-1 / Google Vertex AI europe-west3 — beides Frankfurt. Kein Datentransfer außerhalb der EU.

Schema

OpenAI-kompatibles Chat-Completions-Schema. Drop-in für bestehende SDKs (OpenAI Node, Python, Go). Streaming via SSE.

Modelle

ChatGPT (GPT-4 / GPT-4o), Claude (Sonnet / Opus / Haiku), Gemini (Pro / Flash). Routing per Request-Header oder serverseitiger Policy.

Pseudonymisierung

TUP Shadow als optionaler Pre-Processing-Layer pro Request. Reversibel — Antwort kommt mit Originaldaten zurück. Konfigurierbare PII-Klassen pro Tenant.

Rate Limiting

Per Tenant, per User, per Modell. Burst- und Sustained-Limits. 429er enthalten X-RateLimit-Reset-Header für sauberes Backoff.

Audit-Log

Jeder Call wird mit Zeitstempel, Tenant, User, Modell und Token-Verbrauch geloggt — DSGVO-relevant für Compliance-Reviews. Export als JSON-Lines.

Pricing

Nutzungsbasiert. Mit Mindestabnahme.

TUP API kommt nicht mit einer Self-Service-Preisliste — die Konfiguration variiert deutlich nach Volumen, Tenant-Anzahl, Shadow-Nutzung und Reaktionszeit-Anforderungen.

Wir buchen ein 30-minütiges Erstgespräch, klären Ihren Use Case und schicken Ihnen ein konkretes Angebot — typischerweise innerhalb eines Werktags.

Erstgespräch buchen

← zurück zur Plattform-Übersicht

TUP Chat & Shadow.Als API.

Eine Schnittstelle, drei Modelle, kein Datenexport.

Wofür Teams die API einsetzen.

DSGVO-konformer LLM-Zugang im Backend

Pseudonymisierung als Pre-Processing-Schritt

Multi-Tenant-SaaS mit isolierten Tenants

Was Sie wissen müssen.

Nutzungsbasiert. Mit Mindestabnahme.

TUP Chat & Shadow.
Als API.