Das Telekommunikationsunternehmen Veon, der Mobilfunkbetreiber Beeline Kazakhstan, das Barcelona Supercomputing Center und die Lobbygruppe GSMA erklärten am Mittwoch, dass sie zusammenarbeiten werden, um eine "KI-Sprachlücke" für unterrepräsentierte Sprachen zu schließen.

Große Sprachmodelle, die "Bots" wie chatGPT antreiben, stützen sich oft auf große Mengen von Online-Daten wie digitale Bücher, Websites, Artikel und Blogs, um zu lernen, wie man menschenähnliche Antworten erzeugt. Aber die Daten und Ressourcen in einigen Sprachen sind begrenzt.

"Von den fast 7000 Sprachen, die auf der ganzen Welt gesprochen werden, gelten nur sieben als ressourcenreiche Sprachen in der digitalen Welt: Englisch, Spanisch, Französisch, Mandarin, Arabisch, Deutsch und Japanisch", so die Gruppen in einer gemeinsamen Erklärung.

Sie werden bei der Entwicklung von Tools und Sprachmodelldokumentationen in unterrepräsentierten Sprachen zusammenarbeiten, einschließlich der Sprachen, die in den Ländern gesprochen werden, in denen Veon tätig ist - Pakistan, Ukraine, Bangladesch, Kasachstan, Usbekistan und Kirgisistan.

Eine weitere Sprache war Katalanisch, das von etwa 10 Millionen Menschen gesprochen wird, heißt es in der Erklärung.

"Der Mangel an Ressourcen in anderen Sprachen führt zu einer KI-Sprachlücke, die zu einer suboptimalen Benutzererfahrung in KI-Anwendungen führt, die Verzerrungen in KI-Modellen vertieft und das Risiko birgt, die digitale Kluft in KI-Technologien zu vertiefen", heißt es weiter. (Berichterstattung durch Olivier Sorgho; Bearbeitung durch Alexander Smith)