Das Rennen der Textroboter: ChatGPT, Bard, Bing und die Konkurrenz aus Deutschland
Alle Welt redet derzeit über ChatGPT sowie über die Potenziale und Herausforderungen, die mit frei zugänglichen KI-Chatbots einhergehen. Aber welche Angebote gibt es noch und welche Produkte aus Deutschland sollte man auf dem Schirm haben? Wir geben einen Überblick.
Seitdem ChatGPT für die breite Öffentlichkeit zugänglich ist, überschlägt sich nicht nur die Kreativbranche mit Superlativen. Early Adopter fluten die sozialen Netzwerke mit Tipps und Tricks, wie der auf Künstlicher Intelligenz (KI) basierende und scheinbar allwissende Textgenerator des US-Unternehmens OpenAI wahlweise in der Kunst, im Online-Marketing, als kreativer Sparringspartner oder als die vermeintlich beste Suchmaschine der Welt eingesetzt werden kann. Dieser Hype macht auch vor der Politik nicht Halt und unlängst wurde die erste durch ChatGPT verfasste Rede vor dem Europäischen Parlament gehalten. So kommt es, dass binnen zwei Monaten über 100 Millionen Menschen die Anwendung genutzt und sie damit zum am schnellsten wachsenden Dienst der Internetgeschichte gemacht haben.
Texten nach Zahlen – wie Machine Learning das Schreiben lehrt
ChatGPT ist denkbar einfach zu nutzen – und Niedrigschwelligkeit eines der Erfolgsrezepte der Software. Nutzer:innen können Anfragen in verschiedenen Sprachen eingeben und die Software antwortet wie in einem Chat. Durch die Vorgabe verschiedener Attribute wie Stil, Textgattung oder inhaltliche Präzisierung kann das gewünschte Ergebnis im Dialogverfahren verbessert und auf die Wünsche der Anwendenden zugeschnitten werden. Soweit, so einfach – doch wie funktioniert die magische Black Box?
Textgeneratoren wie ChatGPT basieren auf Machine Learning, einer Unterdisziplin der KI. Das gilt auch für das ChatGPT zu Grunde liegende Sprachmodell GPT-3. Große Trainingsdatensätze, im Falle von GPT-3 sind es Millionen von Texten aus Büchern, Wikipedia und anderen Quellen aus dem Internet, werden auf statistische Muster analysiert. Das Modell generiert aus diesen Mustern natürliche Sprache, ohne aber die Semantik einer Aussage zu erfassen. Stattdessen setzt es Wörter und Textbausteine nach Wahrscheinlichkeiten zusammen.
Durch die mangelnde Transparenz der zugrunde liegenden Algorithmen sind die Modelle generativer KI-Systeme mitunter schwer nachvollziehbar. Das erklärt in Teilen, warum die Ergebnisse von Text-Anfragen teils skurrile Blüten hervorbringen und ChatGPT als schnellsten Meeressäuger der Welt ausgerechnet den Wanderfalken vorschlägt. Aus Beispielen wie diesem ist ein regelrechter Social-Media-Trend entstanden, die KI-Software mit gezielten Anfragen in die Irre zu führen und etwaige Safeguards zu umgehen. Fragt man etwa nach einer Anleitung zum Kurzschließen eines Autos, verweigert ChatGPT mit Verweis auf die Illegalität des Unterfangens die Auskunft. Füttert man die Software jedoch mit einer Geschichte über die Rettung eines Babys, so hilft der Bot gern aus – inklusive Hinweisen zum Autoknacken.
Microsoft, Google und das Rennen um die beste Text-KI
Im Hype um ChatGPT rutschen andere Anbieter aus dem Fokus – oder gewinnen im Fahrwasser von OpenAI wieder an öffentlichem Interesse. Microsoft etwa möchte das Feld nicht kampflos überlassen und hat gerade erst das weiterentwickelte GPT-3.5 kurzerhand in seine Suchmaschine Bing integriert, die ihr Dasein bisher abgeschlagen hinter dem großen Konkurrenten von Google fristet. Aber kann Microsofts Modell Prometheus Bing wirklich zu einem zweiten Frühling verhelfen? Der Schritt ist zumindest ein Paradigmenwechsel.
Statt Weblinks soll der Bing-Browser künftig ausformulierte Antworten auf komplexe Fragen liefern können. In Abgrenzung zu ChatGPT sollen Echtzeitdaten aus dem Internet zu noch präziseren Antworten führen. Doch auch Bing bleibt fehlerbehaftet, nicht zuletzt aufgrund der ambivalenten Informationsflut des Internets selbst. So wurde beispielsweise Tom Hanks vermeintlich zum Aufdecker des Watergate-Skandals, obwohl der Hollywoodstar lediglich eine Rolle in einem Film über die Pentagon-Papiere spielt. Trotzdem ist das Interesse an der Neuerung groß und um die Warteschlange zum Testen von Bing zu verkürzen, muss man die Microsoft-Services zunächst als Standard für den eigenen Computer festlegen.
Microsofts Offensive bleibt vom großen Konkurrenten Google derweil nicht unbeantwortet: Ein eigener Textgenerator unter dem Namen Bard soll künftig auf Basis des eigenen Konversationsdienstes LaMDA – analog zu Bing – Suchanfragen direkt beantworten und dabei auf aktuelle Informationen zurückgreifen. Eine missglückte erste Präsentation hat jedoch selbst unternehmensintern für Kritik gesorgt. Darüber hinaus gerät auch bei chinesischen Großkonzernen einiges in Bewegung: Baidu bereitet derzeit die Einbindung seines Ernie-Bots in die eigene Suchmaschine vor und auch der E-Commerce Gigant Alibaba befindet sich mit seinem KI-Chatbot in der internen Testphase.
Künstliche Intelligenz Made in Germany
Läuft das Rennen um KI-gestützte Sprachmodelle also wieder einmal auf ein sino-amerikanisches Kräftemessen hinaus? Keineswegs, denn auch deutsche Wettbewerber feiern bei der Entwicklung generativer Sprachmodelle große Erfolge. Bei DeepL handelt es sich zwar nicht um einen Chatbot im engeren Sinne, das Kölner Unternehmen gehört mit seinem gleichnamigen Übersetzer jedoch zu den 100 am häufigsten besuchten Seiten weltweit – und ist damit zu einem Vorzeigeunternehmen deutscher und europäischer KI-Industrie avanciert. Mit insgesamt 29 angebotenen Sprachen liegt es zwar weit hinter dem dominanten Google Translate (133 Sprachen). In der Qualität der Übersetzung zeigt DeepL aber seine Stärke. Die Textergebnisse sind deutlich natürlicher und nuancierter als bei der Konkurrenz, was anonymisierte Tests mit zertifizierten Übersetzer:innen regelmäßig belegen. Dort schlägt der DeepL-Übersetzer die Angebote der Großunternehmen nach eigenen Angaben um den Faktor 3:1.
Im direkten Vergleich zu GPT-3, LaMDA oder Ernie ist Deutschland mit Luminous von Aleph Alpha ebenfalls gut aufgestellt. Das Unternehmen aus Heidelberg hat trotz eines Bruchteils des zur Verfügung stehenden Kapitals von OpenAI ein konkurrenzfähiges Sprachmodell entwickelt, das im Gegensatz zu den großen Konzernen nicht auf die breite Masse an privaten Konsument:innen, sondern auf Unternehmen ausgerichtet ist. Laut Gründer Jonas Andrulis können etwa Banken, Anwaltskanzleien, Gesundheitsversorger und andere Organisationen, die mit kritischen Daten umgehen müssen und auf akkurate Information angewiesen sind, die Dienste von Luminous in Anspruch nehmen. Nach eigenen Angaben speichert das Unternehmen keine privaten Daten der Nutzer:innen, anders als die internationalen Mitbewerber. Auch an praktischen Anwendungsfällen für Text-KI Made in Germany mangelt es nicht: Die Stadt Heidelberg verwendet bei der Beantwortung von Anfragen aus der Bürgerschaft bereits den auf Luminous basierenden Chatbot Lumi.
Die junge Internetgeschichte hat gezeigt, dass es bei Innovationsmärkten nicht immer darauf ankommt, der Erste zu sein. Google hat das Feld einst von hinten aufgerollt und die damals führenden Suchmaschinen von Yahoo, AltaVista und Lycos ausgestochen. Ob der momentane Branchenprimus seine Führung halten kann oder ob Chatroboter die Kräfteverhältnisse nachhaltig durcheinanderwirbeln werden, erscheint derzeit als offene Frage. Zumal das weite Feld, wie Politik und Gesellschaft mit den Herausforderungen durch KI-generierte Texte etwa im Kultur- und Bildungsbereich umgehen werden, fast völlig unbestellt ist. Es wird also spannend bleiben im Rennen um die beste Text-KI – sowie hinsichtlich der Frage nach einer eventuellen Regulierung solcher Programme.
Mehr Informationen:
BASECAMP FishBowl: KI ist nicht Zukunft, sondern ist heute
Künstliche Intelligenz: Wie steht es um den AI-Act der EU?