Seit Jahren bot Contact-Center-Software eine relativ einfache Preisgestaltung. Sie zahlten für den Zugang per User, und Ihre Kosten skalierten mit der Mitarbeiterzahl.
Salesforce führte 2025 eine verbrauchsbasierte Preisgestaltung für Agentforce ein. Cisco misst seine Webex AI Agents derzeit per Session, in zwei Minuten Sprachinkrementen oder fünfzehn Nachrichten Digitalinteraktionen.

Mit verbrauchsbasierter Preisgestaltung kommt ein Trade-Off
Unter diesem neuen und sich weiterentwickelnden Modell verlagert sich die Variabilität von der Anbieter Seite zur Käufer Seite. Während per-User-Preise Budgets ein gewisses Mass an Planbarkeit gaben und Käufer weitgehend davor schützten, wie sich die Technologie im Produktivbetrieb verhielt, koppelt die verbrauchsbasierte Preisgestaltung die Kosten direkt an die tatsächliche Nutzung und macht diese Nutzung für den Käufer sichtbar.
Verbrauchsverträge lesen sich eher wie Cloud Compute Vereinbarungen als wie klassische Softwarelizenzen. Sie enthalten Caps, True-ups, Überziehungsraten und Reserved-Capacity-Stufen. Entsprechend müssen Käufer diese Modelle gegen reale Nutzung und nicht gegen User-Zahlen spiegeln. Das Flex Credits Modell von Salesforce wird in drei Kaufstrukturen angeboten, darunter Pay-as-you-go und Pre-Commit. Webex Contact Center Subscriptions von Cisco enthalten automatisch Überschüsse, die rückwirkend gegen die zugesagten Werte abgerechnet werden.
Kein Wunder also, dass sich viele Verwaltungsteams dabei wiederfinden, Preise und Verträge auf einer ihnen bislang unbekannten vertraglichen Oberfläche zu verhandeln.
Die Kostenoberfläche ist breiter als die Rechnung zeigt
In einem agentischen Flow kann eine einzelne gelöste Kundeninteraktion mehrere Modellaufrufe, Abrufschritte und Tool-Anforderungen in angrenzende Systeme umfassen. Hinzu kommt die Übergabe-Orchestrierung, wenn mehr als ein Agent beteiligt ist. Jede Aktivität verursacht Kosten, und die meisten dieser Kosten erscheinen nicht als Positionen auf der Anbieterrechnung.
All dies wird mit Multi Agent Orchestrierung noch deutlich komplexer. Cisco hat bestätigt, dass Webex AI Agents Multi Agent Zusammenarbeit über Agent to Agent und Model Context Protocol Standards unterstützen werden. Die Implikation ist klar. Eine Kundeninteraktion, die über fünf Modell- und zwei Tool-Aufrufe gelöst wird, kostet mehr, als eine Listenpreisrechnung vermuten lässt, und die Varianz potenziert sich im Scale.
Die IDC FutureScape 2026 Prognose schätzt, dass G1000 Organisationen bis 2027 mit bis zu 30 % höheren, unterschätzten KI Infrastrukturkosten konfrontiert sein werden. Als Haupttreiber nennt IDC unzureichende Prognosen und fehlende KI spezifische Kostenkategorien und spricht von einer Bilanz der KI-Infrastruktur. Contact Center mit agentischen Deployments im Produktionsmassstab müssen reagieren.
Governance ist dort, wo die Lücke am grössten ist
Die von IDC beschriebene Exponierung ist steuerbar, jedoch nur mit Disziplinen, die die meisten Contact Center bisher nicht benötigt haben. Früher kaufte die Verwaltung Sitzlizenzen, die Finanzabteilung genehmigte Budgets, und Operations mass die Auslastung gegenüber den zugesagten Mengen.
Keiner dieser Workflows ergibt in einem agentischen Contact Center noch gleichermassen Sinn, in dem die Frage, ob ein KI-Agent ein teureres Beurteilungsmodell hätte nutzen sollen, reale finanzielle Auswirkungen hat.
Andere Unternehmensbereiche haben diese Disziplin bereits aufgebaut. Der State of FinOps 2026 der FinOps Foundation zeigt, dass 98 % der Praktiker inzwischen KI-Ausgaben managen. Cloud und Engineering Organisationen haben akzeptiert, dass verbrauchsbasierte Ausgaben verbrauchsbasierte Führung erfordern.
Das Contact Center, historisch unter planbaren per-User-Verträgen geführt, läuft Gefahr, zurückzufallen.
Der Mindset Shift, den CX Leaders brauchen
In agentischen Umgebungen ist beobachtbare Kostensteuerung wichtiger als fixe Kosten. Ein Deployment, dessen Kostenverhalten nicht auf Aktionsebene messbar ist, kann auch nicht auf Aktionsebene gesteuert werden. Aufgabe der CX-Führung ist es sicherzustellen, dass die Organisation sehen kann, was KI kostet, während diese Kosten entstehen.
Der Instinkt wird sein, über Caps und fixe Preisforderungen wieder Planbarkeit herzustellen. Kurzfristig kann das sinnvoll sein, langfristig löst es jedoch das falsche Problem. Die Ökonomie agentischer Deployments ist per Design variabel. Diese Variabilität vertraglich zu unterdrücken, limitiert oft den Wert oder verschiebt Kosten in weniger sichtbare Kategorien.
Der wirksamere Hebel liegt früher, auf Architektur- und Betriebsmodell-Ebene:

Die Contact Center, die sich im agentischen Zeitalter einen kumulativen Vorteil sichern, sind jene, die Sichtbarkeit und Führung früh in die Architektur integrieren, während Technologie und Vertragsmodelle noch reifen. Die Verschiebung von Zugang zu Aktivität wird sich fortsetzen. Organisationen, die ihr bewusst begegnen, werden anders positioniert sein als jene, die ihr erst bei der Verlängerung begegnen.
Wie Bucher + Suter Kunden bei der Anpassung unterstützt
Die KI-strategische Arbeit von Bucher + Suter unterstützt CX- und IT-Leaders dabei, Design und Führungsentscheidungen zu treffen, bevor Anbieterverträge und Architekturentscheidungen sie festschreiben. Wir identifizieren zunächst die Use Cases, in denen agentische KI in Ihrer Umgebung die messbarste Auswirkung erzielt, und entwickeln darauf aufbauend die tiefgehende Analyse, die zeigt, wo der grösste Wert entsteht. Anschliessend bauen wir Führungs- und Messframeworks auf, die KI-Ausgaben mit den Geschäftsergebnissen ausrichten, für die Sie bereits verantwortlich sind. Ziel ist es, Wert planbar zu machen, in einem Modell, das Kosten per Design variabel hält.