Sprach-KI auf Schweizerdeutsch: was heute geht — und was nicht
Über Sprach-KI auf Schweizerdeutsch wird entweder gehypt oder spekuliert. Hier steht nüchtern, was am echten Anruf heute funktioniert, was hörbar scheitert — und wann sich das für deinen Betrieb lohnt. Ohne Produktpitch, ohne Startdatum.
Die Suche nach „Sprach-KI Schweizerdeutsch“ führt heute zu zwei Sorten Seiten: Medienartikel, die seit Jahren spekulieren, ob Siri bald Mundart kann, und Anbieterseiten, die am Ende ihr eigenes Produkt verkaufen. Was fehlt, ist die nüchterne Einordnung von jemandem, der kein Voicebot-Produkt im Schaufenster hat. Genau die liefere ich hier.
Warum Schweizerdeutsch das eigentliche Problem ist
„Versteht die KI Sprache?“ ist die falsche Frage. Hochdeutsch verstehen Sprachmodelle längst gut. Das Problem ist der Anruf eines Kunden, der in breiter Mundart spricht, im Hintergrund eine Baustelle, und am anderen Ende eine Maschine, die hörbar nicht aus der Schweiz klingt. Der Anrufer merkt das in zwei Sekunden — und legt auf. Verpasste Anrufe sind verlorene Aufträge; eine Sprach-KI, die den Anrufer vergrault, ist schlimmer als gar keine.
Mundart ist kein Suchbegriff, sondern ein Produktmerkmal. Kunden tippen „sprach-ki schweizerdeutsch“ auf Hochdeutsch in die Suche, auch wenn sie am Telefon Dialekt sprechen. Entscheidend ist deshalb nicht, wie es geschrieben wird, sondern ob es am echten Anruf trägt.
Was heute realistisch geht
- Verstehen von standardnaher Mundart: Zürich, Bern, Aargau in ruhiger Umgebung — brauchbar für klar abgegrenzte Fälle.
- Antworten in sauberem Schweizer Hochdeutsch: natürlich, ohne deutsch klingende Floskeln, das funktioniert heute gut.
- Enge Aufgaben: Termin notieren, Rückruf erfassen, die immer gleichen Fragen ausserhalb der Bürozeiten beantworten, den Fall strukturiert weitergeben.
Was heute noch hörbar scheitert
- Starke Dialekte am Telefon: breites Baseldytsch, Wallis, Bündner Mundart — mit Leitungsrauschen deutlich fehleranfällig.
- Fachjargon im Handwerk: Begriffe, Materialnamen, Abkürzungen, die selbst Menschen aus anderen Gewerken nicht kennen.
- Offene, beratungsintensive Gespräche: sobald es um Aushandlung, Zwischentöne und „eigentlich will ich etwas anderes“ geht, ist die Maschine überfordert — und sollte es zugeben statt improvisieren.
Wer dir „95 % Erkennung“ als nackte Zahl verkauft, hat es nicht am echten Schweizer Anruf mit Nebengeräusch getestet. Die ehrliche Antwort ist: kommt auf den Dialekt, die Leitung und die Enge der Aufgabe an.
Der ehrliche Weg: eng anfangen, wo Fehler wenig kosten
Sprach-KI führt man nicht am gesamten Telefonverkehr ein. Man fängt an dem einen Fall an, an dem ein Fehler billig ist: der Anruf ausserhalb der Bürozeiten, der sonst komplett verfällt. Dort ist die Messlatte nicht „perfekt“, sondern „besser als niemand“. Funktioniert das, weitet man aus. Funktioniert es nicht, hat es niemanden einen Auftrag gekostet.
Warum ich kein Datum verspreche
Voice ist bei mir im Aufbau, und ich nenne bewusst kein Startdatum. Ein Versprechen, das ich nicht halten kann, beschädigt genau das Einzige, das ich anzubieten habe: dass ich sage, was ist. Was im Text-Assistenten heute läuft, ist real und benutzbar — das ist der Beweis, dass die Grundlage steht. Voice setzt darauf auf, sobald es am echten Anruf trägt, nicht im Demo. Bis dahin heisst es ehrlich „im Aufbau“, nicht „kommt bald“.
Wenn du wissen willst, ob sich Sprach-KI für deinen Betrieb lohnt — und an welchem engen Fall man ehrlich anfinge — dann ist der nächste Schritt eine Standortbestimmung. Für Betriebe, bei denen der Anruf das Nadelöhr ist, lohnt sich auch ein Blick auf die Sanitär- & Haustechnik-Seite.