Die neue Version des KI-Systems von OpenAI bringt deutliche Verbesserungen. Partner Microsoft präsentiert am Donnerstag schon KI-Anwendungen – und kontert damit Google.
ChatGPT
GPT-4 soll ein Kernproblem von KI-gestützten sogenannten großen Sprachmodellen besser lösen.
Bild: IMAGO/NurPhoto
Austin, Düsseldorf, San Francisco Am Montag hatte Doris Weßels ihren Vortrag über „KI und Lehrermangel“, den sie am Donnerstag auf der Kultusministerkonferenz in Berlin halten will, bereits fertig. Doch einen Tag später musste die Professorin und Wirtschaftsinformatikerin der FH Kiel ihn rasch umarbeiten – weil das US-Unternehmen OpenAI überraschend die neue Version GPT-4 seiner Künstlichen Intelligenz (KI) vorstellte. „Ich bin beeindruckt“, urteilt die Wissenschaftlerin knapp, aber entschieden.
GPT-4 ist tatsächlich eine grundlegende Verbesserung zur Vorgängerversion GPT-3.5. Mit der vierten Version hat OpenAI ein „multimodales Modell“ entwickelt, das neben Texten auch Bilder verwerten kann. Zudem analysiert und schreibt es mit rund 24.000 Wörtern viermal so lange Texte. Dazu kommen Neuheiten wie eine „Systembotschaft“, mit der Nutzer der KI eine genaue Nutzung oder einen Nutzungsstil vorschreiben können.
OpenAI hatte im vergangenen November mit dem Sprachmodell ChatGPT, das auf GPT-3.5 basierte, für weltweite Aufmerksamkeit gesorgt. Weniger als ein halbes Jahr später bringt das Start-up bereits eine neue Version des KI-Systems heraus. „In keiner anderen Technologie erleben wir solche Taktzyklen“, sagt Weßels. „Dahinter stecken kommerzielle Interessen, es wird viel Kapital investiert.“
In der Tat: Microsoft will bis zu zehn Milliarden Dollar in OpenAI investieren und stellt seine Cloud-Infrastruktur Azure zur Verfügung. Am Donnerstag will der Windows-Konzern KI-Anwendungen in einer „Future of Work“-Präsentation demonstrieren. CEO Satya Nadella verspricht nicht weniger als die „Neuerfindung der Produktivität durch KI“. Analysten erwarten, dass er die Integration von GPT-4 nicht nur in die Suchmaschine Bing, sondern auch in andere Office-Anwendungen wie Word oder das E-Mail-Programm Outlook ankündigen wird.
Google hatte bereits am Dienstag neue KI-Anwendungen in der Cloud vorgestellt. Dort werden Funktionen seiner KI-Modelle in die „Workspace“-Softwareprogramme eingebettet. Mit ihrer Hilfe können Nutzer beispielsweise E-Mails in Gmail schreiben oder Dokumente im Textverarbeitungsprogramm Docs erstellen. Sowohl bei Microsoft als auch bei Google werden die KI-Anwendungen in Pilotprojekten getestet, zu denen nur ausgewählte Kunden Zugang haben.
Bereits im vergangenen Februar lieferten sich die beiden Tech-Konzerne ein Fernduell. In der gleichen Woche stellte Google das KI-Sprachmodell Lamda vor, als Microsoft ChatGPT präsentierte. „Google arbeitet seit langer Zeit daran“, sagt Mike Gualtieri, Analyst von Forrester, „aber die Konkurrenz von Microsoft und OpenAI hat sie gezwungen, alles früher auf den Markt zu bringen.“
GPT-4 soll ein Kernproblem von KI lösen. Bislang produzieren die Algorithmen zwar beeindruckende Texte, sie können darin jedoch falsche Aussagen einbauen und Quellen erfinden. Fachleute sprechen von „halluzinieren“. Laut OpenAI soll das Tool „nach unseren internen Auswertungen mit 40 Prozent höherer Wahrscheinlichkeit sachlichere Antworten als GPT-3.5 produzieren“.
Ein weiterer Fortschritt: Durch Filter und Training reagiere GPT-4 weniger auf „unerlaubte Inhalte“, wie OpenAI mitteilt. Laut dem Start-up hat sich mit GPT-4 die Wahrscheinlichkeit dazu um mehr als 80 Prozent verringert.
Auf Twitter wurde die Veröffentlichung der neuen Version am Dienstag breit diskutiert. „GPT-4 ist ein größerer Schritt, als ihn GPT-3 darstellte“, schrieb OpenAI-Entwickler Jason Wei. GPT-4 erreiche menschliche Qualitäten bei vielen Aufgaben und werde „eine gesellschaftliche Revolution“ auslösen, „bei der KI jede Industrie erreicht, beginnend mit der Technologiebranche“.
Jim Fan, KI-Forscher beim Chiphersteller Nvidia, erklärte mit Verweis auf die Ergebnisse bei mehreren Zugangstests: „Die Wahrheit ist, dass GPT-4 sich schon heute in Stanford als Student einschreiben kann.“ Das Urteilsvermögen der KI übersteige die gängigen Skalen. „Exponentielles Wachstum ist ein beängstigendes Ding, nicht wahr.“
Auch auf der wichtigen Technologiemesse „South by Southwest“ (SXSW) in Texas war die neue KI-Version ein Thema. „Wir sind sehr begeistert, dass mit der Veröffentlichung der neuen GPT-4-Version ein weiterer KI-Meilenstein erreicht wurde“, sagte der Chef der US-Foto-App Prequel, Timur Khabirov, dem Handelsblatt.
Die neuen Funktionen könnten „für die generative Bildverarbeitung wegweisend sein“, so Khabirov, „insbesondere die Fähigkeit, Bilder in Text umzuwandeln, was KI-Anwendungen in neue Richtungen führen wird“.
Prequel wurde 2017 gegründet und kreiert mithilfe von KI verfremdete, künstlerische Bilder und Videos auf Basis realer Vorlagen. Prominente wie Katy Perry und Bella Hadid, aber auch Modekonzerne wie Gucci nutzen die Anwendung bereits.
„ChatGPT ist jetzt smarter als die meisten Anwälte in den USA und kann bei einer Biologie-Olympiade ganz oben mitmischen“, erklärte Christian Byza, Chef der KI-Lernplattform Learn.xyz. Für sein Unternehmen sei der Start von GPT-4 eine „sensationelle Nachricht“, so Byza. „GPT-4 ist deutlich smarter“, gehöre etwa bei der US-Anwaltszulassungsprüfung zu den besten zehn Prozent der Teilnehmer.
Zudem könne GPT-4 nicht nur mit Text, sondern auch mit Bildern arbeiten, sagte Byza. Die eigenen Kurse, die auf GPT-4 aufbauten, beispielsweise Geschichtsseminare, würden so deutlich besser. Der Wermutstropfen: GPT-4 sei zwar zu 40 Prozent besser darin, „sich Dinge nicht auszudenken“, aber es bestehe „immer noch viel Luft nach oben“.
Auch ein anderes Problem großer Sprachmodelle löst GPT-4 noch nicht: Die Anwendung wurde auf Basis Abertausender existierender Texte und Bilder aus dem Internet trainiert. Viele davon wurden von ihren Machern urheberrechtlich geschützt. Daher laufen bereits mehrere Klagen gegen OpenAI, unter anderem von der Bildagentur Getty.
Die Fotodatenbank Shutterstock geht nun einen neuen Weg. Der Anbieter hat KI-Funktionen in seine Bilddatenbank aufgenommen, Kunden können sich durch die Eingabe weniger Stichworte Bilder passend kreieren lassen. Die Künstler und Fotografen, auf deren Grundlage die KI-Systeme trainiert wurden, werden jedoch entschädigt. „Unsere einfach zu bedienende generative Plattform wird die Art und Weise, wie Menschen ihre Geschichten erzählen, verändern“, sagte Shutterstock-Chef Paul Hennessy dem Handelsblatt.
Ähnlich sieht es Prequel-Chef Khabirov: „Wir werden in Zukunft noch enger mit Fotografen und anderen Kreativen zusammenarbeiten. Wir sagen ganz klar: Wir wollen eure Fotos nicht stehlen!“ Im Gegenteil: Künftig könnten Fotografen mit Prequel Partnerschaften abschließen und so etwa die Vorlagen eines einmal getätigten Fotoshootings anderen Kreativen zur KI-Bearbeitung bereitstellen. „Fotografen können so deutlich mehr an einem Shooting verdienen“, glaubt Khabirov.
GPT-4 soll für OpenAIs Plus-Abonnenten verfügbar sein. Microsoft setzt es allerdings bereits seit Wochen in seinem Suchdienst Bing ein. In einem Beta-Test können ausgewählte Nutzer mit GPT-4 im Internet suchen.
OpenAI hatte GPT-3 im Jahr 2020 veröffentlicht. Zusammen mit der Nachfolgerversion 3.5 wurde das Programm zur Entwicklung des Chatbots ChatGPT und der Bilderzeugungssoftware Dall-E verwendet. Beide Produkte erregten bei ihrer prominenten Vorstellung im vergangenen Herbst große öffentliche Aufmerksamkeit und sorgten für einen Hype um die möglichen Einsatzfelder von KI.
Seither wurde darüber spekuliert, ob das nächste Modell noch leistungsfähiger sein und möglicherweise zusätzliche Aufgaben übernehmen kann.
Erstpublikation: 14.03.2023, 23:06 Uhr.
Auf tippen, dann auf „Zum Home-Bildschirm“ hinzufügen.
Auf tippen, dann „Zum Startbildschirm“ hinzufügen.
×