ChatGPT spricht Schweizerdeutsch: doch Dialekte bereiten Probleme

Publiziert

ChatGPTDarum scheitert hochgelobtes Sprachmodell am Dialekt

ChatGPT spricht neuerdings Schweizerdeutsch – allerdings noch ziemlich holprig und Dialekte sind kaum zu erkennen. Ein Experte für Sprach- und Textanalyse erklärt, wieso.

So cringe tönt es, wenn ChatGPT Schweizerdeutsch spricht.

20min/Anja Zobrist

Darum gehts

  • «Hoi Anja, wie gahts?» Das Sprachmodell ChatGPT wurde um einen Advanced Voice Mode für die Schweiz erweitert – es spricht jetzt also Schweizerdeutsch.

  • Das klingt allerdings noch ziemlich holprig.

  • Ein Experte erklärt: Das liegt vor allem daran, dass das Modell zu wenig Material hat, mit dem es trainiert werden kann.

Es tut ein bisschen weh in den Ohren: ChatGPT soll dank des «Advanced Voice Modes» jetzt Schweizerdeutsch sprechen. So richtig klappt das aber noch nicht (siehe Video oben). Mark Cieliebak ist Professor für Textanalyse und Dialogsysteme an der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW). Im Interview erklärt er, woran das hochgelobte Sprachmodell scheitert und wieso es nur noch eine Frage der Zeit sein dürfte, bis es auch diese Herausforderung gemeistert hat.

ChatGPT soll jetzt Schweizerdeutsch sprechen. So richtig natürlich klingt das aber nicht. Wieso?

Mark Cieliebak: Es gibt viel zu wenig Daten. Um ein Sprachmodell zu trainieren, braucht es die Texte auf Mundart, die entsprechenden Audios dazu und die Angabe, in welchem Dialekt etwas verfasst worden ist und gesprochen wurde. Dazu kommt: Mundart hat keine einheitliche Grammatik und oft auch keine exakt gleiche Ausdrucksweise. Und dann gibt es noch die diversen Dialekte mit jeweils eigenen Wörtern und Ausdrücken. Das macht es extrem schwierig, ein Modell so zu trainieren, dass es tatsächlich Dialekt sprechen kann.

Ist Wallissertitsch oder Bärndütsch also einfach AI-untauglich?

Nicht unbedingt. Die Dialekte an sich sind nicht schwieriger oder einfacher als andere Sprachen. Aber das Modell braucht einfach länger mehr Input dafür. Wenn jetzt viele Schweizerinnen und Schweizer ihre Dialekte aufnähmen und für das Training zur Verfügung stellten, lernte es sicher viel schneller. Auch, wenn jetzt viele Menschen anfangen, über die «Advanced Voice»-Funktion mit ChatGPT Dialekt zu sprechen, wird das Modell dazulernen.

Wieso klingt es ein wenig so, als versuchte ein Deutscher, Schweizerdeutsch zu sprechen?

Wenn ChatGPT zu wenig Daten für die Aussprache eines Wortes hat oder einen Ausdruck nicht kennt, versucht es vermutlich, die Ausdrucksweise dafür einfach zu «erfinden». Darum kann aus einem «chasch» dann auch einmal ein «schasch» werden. Und Hochdeutsch spricht es bereits ziemlich gut, weshalb es möglicherweise daraus die Schweizerdeutschen Wörter und Ausdrucke abzuleiten versucht.

Wie viele Daten bräuchte es denn, um das Modell besser zu trainieren?

Wir haben das vor ein paar Jahren selber einmal probiert und ungefähr 200’000 Textsätze gefunden in verschiedenen schweizerdeutschen Dialekten. Auf Englisch werden diese Modelle mit Milliarden von Texten gefüttert. Wenn man dann auch noch alle verschiedenen Dialekte trainieren müsste, bräuchte es sehr, sehr viel mehr Daten.

Spricht man direkt mit ChatGPT, anstatt es einen Text vorlesen zu lassen, klingt es etwas besser. Wieso?

Der Text ist in Schweizerdeutsch geschrieben und das Modell versucht, ihn irgendwie auszusprechen. Da es keine standardisierte Schriftsprache für Schweizerdeutsch gibt, ist das schwierig. Wenn ChatGPT direkt mit Schweizerdeutscher Sprache antwortet, entfällt der Zwischenschritt über den Text – und damit eine potenzielle Fehlerquelle.

Der Experte

Mark Cieliebak ist Leiter der «Natural Language Processing Group» am Zentrum für künstliche Intelligenz an der Zürcher Hochschule für angewandte Wissenschaften.

Mark Cieliebak ist Leiter der «Natural Language Processing Group» am Zentrum für künstliche Intelligenz an der Zürcher Hochschule für angewandte Wissenschaften.

Mark Cieliebak ist Leiter der «Natural Language Processing Group» am Zentrum für künstliche Intelligenz an der Zürcher Hochschule für angewandte Wissenschaften.

ZHAW

Folgst du schon 20 Minuten auf Whatsapp?

Eine Newsübersicht am Morgen und zum Feierabend, überraschende Storys und Breaking News: Abonniere den Whatsapp-Kanal von 20 Minuten und du bekommst regelmässige Updates mit unseren besten Storys direkt auf dein Handy.

Deine Meinung zählt

26 Kommentare
Kommentarfunktion geschlossen