In Handarbeit bereiten Arbeiter weltweit Daten auf, mit denen etwa Systeme für autonome Fahrzeuge trainiert werden. Viele der Clickworker arbeiten unter harten Bedingungen.
Clickworker
Diese Digitalarbeiter heißen Clickworker. Ihre Aufgabe: Sie modellieren die Umwelt. Im Fachjargon heißt das semantische Segmentierung.
Bild: Reuters
Berlin, Düsseldorf, Hannover Der Blick auf den Bildschirm ist starr und angestrengt. Straßen sind zu sehen, Autos, Rollerfahrer, Radfahrer, Fußgänger, Häuser, Bäume, Ampeln und Verkehrsschilder. Per Computermaus werden die Objekte mit einem Umriss versehen und benannt, also „gelabelt“.
Es ist das Profil eines Knochenjobs, den hunderte Millionen Menschen weltweit machen – jeden Tag zehn bis zwölf Stunden lang. Sie sitzen vor ihren Computern in Indien, auf den Philippinen, in Venezuela, Brasilien, Malaysia, Kenia und vielen anderen Ländern.
Diese Digitalarbeiter heißen Clickworker. Ihre Aufgabe: die digitale Modellierung unserer Umwelt, im Fachjargon semantische Segmentierung genannt. Das Ziel: Künstliche Intelligenz (KI) trainieren. Das Prinzip lässt sich vorstellen wie bei einem Kind, das die Welt erkundet. Anfangs muss es mühsam beigebracht bekommen, was ein Spielzeug ist, was ein Mensch ist, was essbar und was giftig ist.
Ähnlich läuft es auch bei den KI-Systemen. Viele Aufnahmen stammen etwa von Autokonzernen, Zulieferern und IT-Unternehmen, die damit Systeme für selbstfahrende Autos trainieren wollen. Ungelernte Systeme können mit Rohaufnahmen nichts anfangen. Der Künstlichen Intelligenz, die in den Fahrzeugen zum Einsatz kommen soll, muss erst einmal beigebracht werden, beispielsweise ein spielendes Kind von einem Verkehrsschild zu unterscheiden.
Am Ende sollen die Systeme den Menschen übertreffen und schneller Gefahrensituationen erkennen können – wenn sie denn ausreichend und mit guten Daten vorbereitet wurden. Dazu werden gewaltige Datenmengen aufbereitet – mithilfe von Menschen, die fast ausschließlich in Entwicklungsländern leben und für wenige Dollar im Akkord Videoaufnahmen labeln. Prekäre Arbeitsverhältnisse sind die Regel, Festeinstellungen selten, Clickworker-Gewerkschaften nicht vorhanden.
Die Freelancer hangeln sich von einem Kleinauftrag zum nächsten und kommen mit ihrem Lohn kaum über die Runden. Sie sind sozusagen die unsichtbare Werkbank der Autoindustrie, die Fließbandarbeiter der Gegenwart – für die die Unternehmen noch nicht einmal mehr eine Fabrik aufstellen müssen.
Und sie sind der Schlüssel zum Billionenmarkt autonomes Fahren. Hersteller wie VW, BMW und Daimler, Zulieferer wie Continental, Bosch und Hella und vor allem die IT-Konzerne Google, Amazon und Apple pumpen Milliarden in die Entwicklung, um das erste völlig autonom fahrende Auto auf die Straße zu bringen. Der Markt verspricht ein gigantisches Potenzial. Analysten der Schweizer Investmentbank UBS schätzen es auf eine Billion Dollar bis 2030.
Doch die Vorarbeit bis dahin ist gigantisch. Das weiß Marc Mengler, Chef des Berliner Start-ups Under-stand.ai, das sich auf das Labeln von Videodaten für die Autoindustrie spezialisiert hat, bestens. „Ohne manuelle Nachbearbeitung sind die besten Algorithmen nicht gut genug“, sagt Mengler. Kunden von Under-stand.ai, zu denen namhafte Autohersteller zählen, wie ein Blick auf die Homepage des Start-ups verrät, schicken Mengler die Video-Rohdaten, die anschließend Bild für Bild mithilfe eines speziellen Programms gelabelt werden.
„Das heißt: Jedes Objekt, das für das autonome Fahren relevant ist, muss markiert werden – und zwar zum Teil pixelgenau“, erklärt Mengler. Ansonsten würde die KI nicht wissen, was auf den Videoaufnahmen zu sehen ist. Oder anders gesagt: Die KI wäre blind.
Eine Rechnung lässt den unvorstellbaren Arbeitsaufwand erahnen: Ein einstündiges Video, gedreht mit 30 Bildern pro Sekunde, setzt sich aus 108.000 Bildern zusammen. Nimmt ein Autokonzern hunderttausend Stunden Videomaterial auf, was nicht unüblich im Bereich des autonomen Fahrens ist, ergeben sich daraus fast elf Milliarden Bilder. Das Labeln komplexer Verkehrssituationen kann pro Bild bis zu drei Stunden in Anspruch nehmen. Würde ein einziger Mensch diese Arbeit durchführen, bräuchte er dafür über 32 Milliarden Stunden oder fast 3,7 Millionen Jahre.
„Geisterarbeit“ nennen Mary L. Gray und Siddharth Suri diese Art der Arbeit in ihrem gleichnamigen Buch („Ghostwork“). Die Clickworker sind den beiden Autoren zufolge das neue digitale Proletariat, die wie moderne Wanderarbeiter je nach Bedarf massenweise mechanische, sich ständig wiederholende Aufgaben übernehmen.
Die Anfänge des Clickworkings gehen auf das Jahr 2005 zurück, als Amazon seine Crowdsourcing-Plattform Mechanical Turk (MTurk) ins Leben rief. Dort konnten Unternehmen digitale Kleinstarbeiten an Freelancer auf der ganzen Welt auslagern. Anfangs mussten diese beispielsweise für Start-ups wie das Bewertungsportal Yelp Inhalte kuratieren oder Kundenbewertungen redigieren. Kurze Zeit später gründeten sich immer mehr Crowdsourcing-Plattformen, wie zum Beispiel Mighty AI, Hive und Playment, die aufwendige Aufgaben im Clickworking-Bereich übernehmen.
Wie aus dem Nichts wurden diese Start-ups ab 2017 dann mit Aufträgen aus der Autoindustrie überflutet. Seit Februar 2019 hat Mighty AI eine Kooperation mit der University Michigan in Zusammenarbeit mit GM, Ford, Honda, Toyota, Intel, LG und Verizon.
Über das Internet kann sich jeder bei den Plattformen anmelden und zum Clickworker werden. Nach der Anmeldung durchlaufen die Nutzer kurze Tutorials, sammeln mit ersten Kleinaufträgen Erfahrungspunkte und arbeiten sich so hoch zu den lukrativeren Aufgaben. Zwischen den Clickworkern aus der Crowd und den Auftraggebern aus der Autobranche gibt es keinen unmittelbaren Kontakt.
Die Autokonzerne senden Video-Rohdaten an die Plattformen, diese wiederum teilen sie in kleine Ausschnitte auf. Jeder Videoausschnitt ist ein Auftrag, den ein Clickworker, der auf dem Portal angemeldet ist, entgegennehmen kann. Für jeden Auftrag werden in Regel ein paar wenige Dollar bezahlt.
Viele dieser „Labeler“ kommen derzeit aus Venezuela, wie eine Analyse der Hans-Böckler-Stiftung zeigt. 75 Prozent des Gesamt-Traffics auf den Portalen Mighty AI und Hive stammen aus dem südamerikanischen Land. Parallel zur drastischen Verschlechterung der wirtschaftlichen Lage in Venezuela ließen sich immer mehr Menschen dort zu Clickworkern „ausbilden“. Der Grund dafür ist nachvollziehbar: Die Clickworking-Portale zahlen in der Regel in US-Dollar. Es gilt: Je größer die wirtschaftliche Not eines Landes, desto höher ist auch die Bereitschaft der Einwohner, zum Clickworker zu werden.
Christian Papsdorf, Professor an der TU Chemnitz und Experte für Techniksoziologie, kritisiert, dass Clickworker unsichere Arbeitsverhältnisse eingingen, die an die Frühzeit der Industrialisierung erinnern würden, als Stundenlöhner für geringe Gehälter ausgebeutet wurden – mit einem Unterschied: „Nun haben wir es mit Minutenlöhnern zu tun.“
Demetrio Aiello, Leiter des Forschungsbereichs Künstliche Intelligenz und Robotik bei Continental, sieht bei der Entwicklung der KI für das autonome Fahren bislang allerdings keine Alternative zur menschlichen Arbeitskraft. „Maschinelles Lernen funktioniert nur im Zusammenspiel mit dem Menschen“, sagt Aiello.
„Er muss die Bilder interpretieren, die während der Testfahrten aufgenommen werden.“ Erschwerend hinzu kommen die hohen Sicherheitsanforderungen. „Im Gegensatz zum Labeling von Daten im Entertainmentbereich ist der Qualitätsanspruch beim autonomen Fahren deutlich höher“, erklärt Aiello.
Deswegen wurden Versuche, Videoaufnahmen mithilfe des Amazon-Dienstes MTurk zu labeln, schnell eingestellt, da er für die hohen Ansprüche nicht ausreicht. Continental greift auf Spezialfirmen zurück. Eines dieser Partnerunternehmen ist Samasource.
Auf tippen, dann auf „Zum Home-Bildschirm“ hinzufügen.
Auf tippen, dann „Zum Startbildschirm“ hinzufügen.
×