Kanäle
Jetzt personalisiertes
Audiomagazin abonnieren
Log-in registrieren
forum verwendet Cookies und andere Analysewerkzeuge um den Dienst bereitzustellen und um dein Website-Erlebnis zu verbessern.

handverlesenswert

Kluge Köpfe filtern für dich relevante Beiträge aus dem Netz.
Entdecke handverlesene Artikel, Videos und Audios zu deinen Themen.

Du befindest dich im Kanal:

Technologie und Gesellschaft

Explorer für das Datenset einer Illustrations-AI

René Walter
Grafik-Designer, Blogger, Memetiker | goodinternet.substack.com

Irgendwas mit Medien seit 1996, Typograph, Grafiker, Blogger. Ask me anything.

Zum picker-Profil
René WalterMittwoch, 31.08.2022

Ich hatte in der Vergangenheit hier bereits aufgeschrieben, wie Bild-Generatoren wie Dall-E die Arbeit von Illustratoren und Designern verändern und warum diese Bild-Generatoren sich möglicherweise in rechtlichen Fallstricken wiederfinden könnten, die die kommerzielle Anwendung dieser Technologie verzögern könnten. 

Piqd-Kollege Ole Wintermann hat hier auf einen Text im Wired-Magazin hingewiesen, in dem einige Künstler zu Wort kommen, deren Arbeiten in dem Datenset zu finden sind, auf dem nun Stable Diffusion, das "Most Important AI Art Model Ever", trainiert wurde. Stable Diffusion wurde vor einer Woche als Open Source-Model veröffentlicht und die Geschwindigkeit der Innovationen ist atemberaubend. Schon jetzt finden sich unzählige Adaptionen der Technologie für Video-Anwendungen, Plugins für Bildbearbeitungsprogramme wie Photoshop, GIMP und Krita und neu implementierte Techniken wie img2img erzeugen Präzision in der Illustrations-Generation, die mit Bildgeneratoren wie Dall-E vor ein paar Tagen noch nicht möglich gewesen wäre. Der Beruf des Illustrators wird sich wahrscheinlich alleine durch die Veröffentlichung von Stable Diffusion in rasender Geschwindigkeit verändern und nicht wenige der eher unqualifizierten Illustratoren dürften auf absehbare Zeit ihren Job verlieren: Das AI-Modell ermöglicht bereits jetzt den vollständig automatisierten Einsatz in Low End-Anwendungsfällen wie User-Avataren.

Das Problem und der von mir oben angerissene rechtliche Fallstrick: Keiner der Künstler in dem gigantischen Datenset, auf dem Stable Diffusion trainiert wurde, hat sein Einverständnis gegeben. Das Web-Crawling für solche Datensätze ist zwar legal, allerdings in engen Anwendungsgebieten und ich fürchte, dass das Web-Crawling für den Einsatz für kommerzielle Anwendungen schlichtweg illegal ist. Das bedeutet, dass hier eine komplette technologische Infrastruktur mit extrem mächtigen Werkzeugen zur Produktion von Illustrationen entsteht, die auf einem rechtlich angreifbaren Fundament aufgebaut werden. Auch das dürfte ein Grund dafür sein, warum sich Adobe, die selbst an Systemen von Creative AI forschen und Technologien zur Bild-Forensik vorgestellt haben, bislang in diesem Sektor auffällig zurückhalten.

Um die rechtliche Lage der Bild-Generatoren einzuschätzen, wäre es hilfreich, die Daten erforschen zu können, auf dem diese Kreativmaschinen aufgebaut werden. Der bekannteste Bildgenerator Dall-E wurde auf 400 Millionen Bildern und ihren Textbeschreibungen trainiert, OpenAI verschweigt allerdings bislang die genaue Quelle der Bilder. Im Gegensatz dazu hat Stable Diffusion seine Datenquellen offengelegt.

Andy Baio und Simon Willis haben nun die Datensätze kopiert und ein Tool gebaut, mit dem man einen kleinen Teil der verwendeten Bilder erforschen kann: "about 2% of the 600 million images used to train the most recent three checkpoints, and only 0.5% of the 2.3 billion images that it was first trained on".

In einem langen Artikel hat Andy Baio die Daten nun ausgewertet und alleine die Verwendung der Comic-Figuren in einem Data-Set, das nun Einzug in kommerzielle wie nicht-kommerzielle Werkzeuge auf der ganzen Welt findet und einen ganzen Berufszweig nachhaltig verändern wird, dürfte in den Rechtsabteilungen von Disney alle Alarmglocken klingeln lassen.

Characters from the MCU like Captain Marvel (4,993 images), Black Panther (4,395), and Captain America (3,155) are some of the best represented in the dataset. Batman (2,950) and Superman (2,739) are neck and neck. Luke Skywalker (2,240) has more images than Darth Vader (1.717) and Han Solo (1,013). Mickey Mouse barely breaks the top 100 with 520 images.

Mit anderen Worten: Wer sich bereits zu Napster-Zeiten hervorragend über die absurdistische rechtliche Situation des Urheberrechts in digitalen Zeiten amüsiert hat, dürfte in den kommenden Jahren voll auf seine Kosten kommen.

Explorer für das Datenset einer Illustrations-AI

Möchtest du kommentieren? Dann werde jetzt kostenlos Mitglied!

Bleib immer informiert! Hier gibt's den Kanal Technologie und Gesellschaft als Newsletter.

Abonnieren

Deine Hörempfehlungen
direkt aufs Handy!

Einfach die Hörempfehlungen unserer KuratorInnen als Feed in deinem Podcatcher abonnieren. Fertig ist das Ohrenglück!

Öffne deinen Podcast Feed in AntennaPod:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Apple Podcasts:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Downcast:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Instacast:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Apple Podcasts:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Podgrasp:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Bitte kopiere die URL und füge sie in deine
Podcast- oder RSS-APP ein.

Wenn du fertig bist,
kannst du das Fenster schließen.

Link wurde in die Zwischenablage kopiert.

Öffne deinen Podcast Feed in gpodder.net:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Pocket Casts:

Wenn alles geklappt hat,
kannst du das Fenster schließen.