Der Chatbot Bard tritt gegen ChatGPT von OpenAI und Microsoft an. Was die Künstliche Intelligenz unterscheidet und wie sie funktioniert. Die wichtigsten Antworten.
Google Bard
Der Chatbot kann menschenähnliche Dialoge führen und Texte erstellen.
Bild: IMAGO/NurPhoto
Google ist das führende Unternehmen im Bereich Künstliche Intelligenz (KI). Seit Jahren publizieren der Konzern und seine britische Tochter Deepmind die mit Abstand wichtigsten Forschungspapiere. Allerdings waren es andere, die das Thema KI nach vorn brachten. Das Start-up OpenAI und dessen Investor Microsoft präsentierten Ende 2022 den Chatbot ChatGPT, der wie von Menschen verfasste Texte erstellen kann.
Das brachte einiges in Bewegung. Google legt nun seine bisherige Zurückhaltung ab und macht seinen Chatbot Bard zugänglich – allerdings mit einigen Einschränkungen. Warum das lange Zögern? Und wie gut ist Bard mit der zugrunde liegenden Google-KI?
So wie ChatGPT ist Bard ein Chatbot, der menschenähnliche Dialoge führen und Texte erstellen kann. Bard ist nach dem englischen Wort für „Dichter“ oder „Barde“ benannt.
Der Chatbot basiert wie ChatGPT auf einem „Large Language Model“ (LLM). Ein „großes Sprachmodell“ besitzt nach dem Vorbild des menschlichen Gehirns neuronale Netze. Die werden mit großen Mengen Textdaten trainiert; das LLM lernt Sprachstrukturen und kann mit hoher Wahrscheinlichkeit das nächste Wort in einem Satz vorhersagen.
Anders als mit ChatGPT können Menschen mit Bard derzeit nur in Englisch kommunizieren. Es sollen aber weitere Sprachen dazukommen. ChatGPT ist nur mit Daten bis 2021 trainiert worden, Bard hingegen kann Fragen mit einem Datenbestand bis in die Gegenwart beantworten.
ChatGPT basiert auf dem Sprachmodell GPT, von dem OpenAI im März 2023 die vierte Version herausbrachte. Google setzt bei Bard auf Lamda, was für „Language Model for Dialogue Applications“ steht. Um Rechenleistung zu sparen und die Verfügbarkeit zu erhöhen, nutzt Bard eine abgespeckte und optimierte Version von Lamda.
>> Lesen Sie auch: Wie ChatGPT Ihr Leben verändern wird
Sowohl GPT als auch Lamda arbeiten mit einer riesigen Anzahl von Parametern, die im Modell bestimmte Bezüge und Wahrscheinlichkeiten bestimmen. Ein Beispiel: Ein Parameter könnte sein, dass nach dem Wort „Sonne“ sehr wahrscheinlich „scheint“ kommt. Nach neuesten Angaben der Unternehmen arbeitet GPT mit 175 Milliarden, Lamda mit 137 Milliarden Parametern.
Bard funktioniert wie eine erweiterte Google-Suche. In einem Suchfeld kann man seine Fragen oder Aufforderungen formulieren. So kann man Bard etwa anweisen, ein Gedicht, einen Liedtext oder einen Essay zu schreiben.
Der Chatbot versieht seine Antworten mit Quellenangaben. Bard generiert anders als ChatGPT zudem mehrere Vorschläge, sogenannte „Entwürfe“, aus denen man auswählen kann.
Die Antworten müssen wie bei ChatGPT aber nicht unbedingt richtig sein – sowohl OpenAI als auch Google arbeiten daran, das sogenannte „Halluzinieren“ von Sprachmodellen zu vermindern. Das versuchen beide unter anderem mit dem „Reinforcement Learning from Human Feedback“ (RLHF). Mitarbeiter überwachen bei dieser Trainingsmethode das System und belohnen es, je nachdem ob Antworten stimmen oder nicht.
Googles Chatbot Bard befindet sich derzeit noch in der Testphase. Nur ausgewählte Teilnehmer aus den USA und Großbritannien können mitmachen. Interessierte können sich auf der Website bard.google.com auf eine Warteliste setzen lassen – anscheinend ist der Andrang groß. Eine Ausweitung auf andere Länder ist geplant.
Anders als das Start-up OpenAI und Microsoft hat Google viel beim Suchgeschäft zu verlieren, das durch Onlineanzeigen sehr lukrativ ist. Google kommt auf einen Marktanteil von weit mehr als 90 Prozent, während Microsofts Bing nur etwa drei Prozent abdeckt. Google will das Geschäft und sein Image nicht mit einer „halluzinierenden“ KI gefährden, die falsche oder irreführende Antworten geben könnte.
>> Lesen Sie dazu: Peter Thiel im Interview: „Google ist völlig im Panikmodus“
Doch mit der Veröffentlichung von ChatGPT und der Integration von GPT-4 in Bing änderte sich der Markt. ChatGPT hat einer breiten Öffentlichkeit verdeutlicht, was ein Chatbot ist – mit all seinen Vor- und Nachteilen. Jetzt geht es um die Vorherrschaft in der Wahrnehmung: Welches Unternehmen hat die beste KI?
Google brachte seinen Sprachassistenten 2016 auf den Markt. „Ok Google“ versteht 30 Sprachen und kann Fragen zum Wetter oder zum Tagesablauf beantworten. Mehr als 700 Millionen Menschen nutzen das System weltweit. Es sorgte 2018 für Schlagzeilen, da es für Smartphone-Besitzer Anrufe erledigen kann – beispielsweise um einen Tisch im Restaurant zu buchen.
Google arbeitet an vielen KI-Modellen, die teilweise aufeinander aufbauen. Bei Ok Google geht es um die Wandlung von gesprochener Sprache in Text und nicht wie bei Bard um eine Texteingabe. Der Assistent erkennt über die Kamera und eine Bilderkennung, ob der Nutzer zum Smartphone blickt und spricht. Insgesamt seien fünf verschiedene Maschinenlernmodelle im Einsatz, um das Gespräch „so natürlich wie möglich“ zu gestalten, erklärten Tuan Anh Nguyen und Sourhis Chaudhuri, zwei Softwareingenieure von Google, in einem Blogbeitrag von 2022.
Lamda ist ein großes KI-Projekt von Google. Zugrunde liegt ein sogenanntes Transformer-Modell, ein neuronales Netzwerk, das der Konzern 2017 mitentwickelte. Auf einem Transformer-Modell basieren auch GPT und ChatGPT.
>> Lesen Sie auch: Diese Branchen könnte KI revolutionieren
Anders als andere Sprachmodelle wurde Lamda nicht nur auf Texte, sondern vor allem auf Dialoge trainiert. Damit kann es laut Google besser die Nuancen einer Unterhaltung aufgreifen.
Um die Antworten kreativer und interessanter zu machen, drehen die Google-Ingenieure an der „Temperatur“, was im Fachjargon eine Modelleinstellung meint. „Die Modelle können aus vertretbaren, aber etwas weniger wahrscheinlichen nächsten Wörtern wählen, die interessantere Antworten ermöglichen“, sagte James Manyika, Technologiechef von Google.
Lamda basiert auf der Transformer-Methode. Damit kann ein Computer bestimmte Signale oder Informationen „transformieren“, beispielsweise um einen Text in eine andere Sprache zu übersetzen oder zusammenzufassen.
Transformer gehören zu den Deep-Learning-Modellen. Das „tiefe Lernen“ erreichen sie durch neuronale Netze, die in zahlreichen Zwischenschichten eine komplexe Struktur und Hierarchie bilden. Vorbild dabei ist das menschliche Hirn.
Lamda wurde mit insgesamt rund 1,6 Billionen Wörter vor allem aus Dialogen „vortrainiert“, wie es in der Fachsprache heißt. Dann kommt das „Feintuning“, bei dem die möglichen Antworten in einem Dialog nach sogenannten SSI-Faktoren („Sinnhaftigkeit, Spezifität, Interessantheit“) bewertet werden, um das Gespräch sinnvoll, genau und lebendig zu gestalten. Miteinbezogen werden auch die Prinzipien Sicherheit und Bodenständigkeit, um kontroverse oder unsinnige Antworten zu vermeiden.
Ja, technisch gesehen ist das kein Problem, Lamda transformiert auch Sprache in Text. Zugang gibt es aber nur eingeschränkt. Die Funktion bietet Google in der speziellen App „AI Test Kitchen“ an, die es seit Herbst 2022 nur in den USA, Großbritannien und Australien herunterzuladen gibt. Allerdings können auch dort nur ausgewählte Nutzer mitmachen.
Die Antworten des Sprachmodells Lamda sind anscheinend so gut und überzeugend, dass der Google-Entwickler Blake Lemoine ihm 2022 ein Bewusstsein zuschrieb – woraufhin er prompt seinen Job verlor. Google bezeichnet Lemoines Aussagen als „völlig unbegründet“, er habe gegen „Arbeits- und Datensicherheitsvorschriften verstoßen“.
>> Lesen Sie auch: Bill Gates im Interview über Künstliche Intelligenz
Laut dem Amerikaner entwickelte Lamda Gefühle, beispielsweise Angst oder Unsicherheit. Nach seiner Aussage konnte er Lamda so verunsichern, dass es gegen die internen Google-Richtlinien verstoßen würde.
Hat Lamda ein Bewusstsein? Diese Frage ist schwer zu beantworten. Denn was genau ist „Bewusstsein“? Aber eines ist klar: Lamda macht nur das, was es gelernt hat. Es simuliert möglichst genau und überzeugend menschliche Gespräche. Dazu gehören neben den SSI-Faktoren auch Stress und Unsicherheit: zwei Gefühle, die in Unterhaltungen eine große Rolle spielen.
Lamda 2 ist eine neue, feiner eingestellte Version von Googles Dialog-Sprachmodell. Der Konzern stellte sie im Mai 2022 vor. Zugänglich ist sie nur einem kleinen Kreis von Nutzern auf der Google-App „AI Test Kitchen“.
In der gleichen Zeit stellte Google Palm vor. Palm steht für „Pathways Language Model“. Das ist ein Sprachmodell auf Grundlage von Pathways, eine von Google 2021 vorgestellte KI-Architektur. „Heutige KI-Modelle sind normalerweise darauf trainiert, nur eine Sache zu tun“, sagte Jeff Dean, Chef von Google Research, bei der Einführung. „Pathways wird es uns ermöglichen, ein einziges Modell darauf zu trainieren, Tausende oder Millionen Dinge zu tun.“
>> Lesen Sie auch: Drei gut bezahlte IT-Jobs für Quereinsteiger
Pathways arbeitet mit „verschiedenen Sinnen“, kann beispielsweise das Wort Leopard, das Bild eines Leoparden oder das Fauchen eines Leoparden erkennen. Genauso wie das menschliche Gehirn nutzt es je nach Aufgabe nur Teile des neuronalen Netzwerks. So soll es schneller werden und weniger Energie verbrauchen. Laut Dean nutzt Pathways „kleine Pfade“ – daher der Name des Modells.
Palm ist mit extrem vielen Parametern (540 Milliarden) ausgestattet. Es wird auf Chips mit der vierfachen Rechenkapazität von Lamda trainiert – und anders als bei Lamda nicht nur auf Dialoge, sondern mit „qualitativ hochwertigen Webdokumenten, Büchern, Wikipedia, Gesprächen und Programmiercode“. Entsprechend gut kann es Software erstellen, Witze verstehen oder Videos erzeugen.
Google gewährt Firmenkunden und Entwicklern seit März 2023 Zugang, die damit „per Sprachbefehl Texte, Bilder, Code, Videos, Audio und mehr erschaffen können“.
Mehr: Wie ChatGPT funktioniert
Erstpublikation: 27.03.2023, 17:27 Uhr.
Auf tippen, dann auf „Zum Home-Bildschirm“ hinzufügen.
Auf tippen, dann „Zum Startbildschirm“ hinzufügen.
×