Künstliche Intelligenz wird in der Tech-Industrie allerorts in den Mund genommen, um Hype zu generieren. Selbst einfachste Algorithmen bewirbt man inzwischen mit dem Label „KI“. Denkt man an Unternehmen, die von dem ganzen Rummel am stärksten profitiert haben, kommt man schnell auf Nvidia. Letztere liefern nämlich an so gut wie alle Anbieter die passenden Chips. Doch jetzt heißt es, im Hintergrund habe Team Green nicht ganz koscher gearbeitet. Um nämlich wiederum seine eigenen KI-Modelle zu trainieren, soll Nvidia massenhaft Scraping betrieben haben.
Unter anderem habe Nvidia dafür auch urheberrechtlich geschützte Inhalte verwendet. Demnach habe Nvidia Mitarbeiter damit beauftragt, z. B. Videos von Netflix und YouTube herunterzuladen. Verwendet hat man das geschützte Material dann für kommerzielle KI-Projekte. Beispielsweise soll Nvidia mit den Daten seine Omniverse-Projekte, die Arbeit an selbstfahrenden Technologien und auch seine „digitalen Menschen“ der Reihe ACE vorangetrieben haben.
Gegenüber Engadget hat man sich damit verteidigt, dass man sich nach eigener Ansicht an das Urheberrecht halte. Man argumentiert ähnlich wie Suno und vergleicht das massenweise Einsammeln und Auswerten von Daten durch Software mit menschlichen Lernprozessen und kreativer Inspiration. Sprecher YouTubes haben bereits anders argumentiert und betont, dass das Scraping auf der Plattform untersagt sei.
Nvidia soll interne Bedenken weggewischt haben
Mitarbeiter, die intern rechtliche oder moralische Bedenken angemeldet hatten, soll man zurechtgewiesen haben. Dabei soll Nvidia auch freimütig interne Datenbanken mit Videomaterial aus Games, die Trailer-Datenbank MovieNet und mehr beansprucht haben. Einige herangezogenen Daten sollen nur für die Forschung, nicht aber für die kommerzielle Verwendung freigegeben worden sein – etwa Material von HD-VG-130M, das über 130 Mio. YouTube-Videos gesammelt hat. Das habe Nvidia aber nicht weiter zum Zögern gebracht.
Um beispielsweise nicht von YouTube beim Scraping ertappt zu werden, soll Nvidia Virtual Machines (VMs) mit wechselnden IP-Adressen verwendet haben. Der Bericht mit einer ausführlichen Beschreibung dieser Praktiken ist bei 404Media zu finden. Offenbar konnte man die Informationen über zugespielte E-Mails, interne Slack-Absprachen und weitere Dokumente direkt von Nvidia nachvollziehen.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.



