Lösungen & Produkte
ArvatoSystems_KI Bildproduktion_AdobeStock_760824256

Bildproduktion mithilfe von Künstlicher Intelligenz

Wie imagejet durch neue Workflows die Bildproduktion revolutioniert

Transformation der Bildproduktion durch Künstliche Intelligenz
27.08.2024
Cloud
Digitale Transformation
Technisch
Künstliche Intelligenz

In den letzten Jahren hat sich die Bildproduktion für unsere Kunden durch den Einsatz von Generativer Künstlicher Intelligenz (GenAI) rasant weiterentwickelt. Früher legte Arvato Systems den Fokus auf einen methodischen Ansatz, bei dem Kunden Excel-Tabellen mit Produktvarianten bereitstellten. Diese Informationen wurden anschließend mit 3D-Modellen, Materialien und Szenen kombiniert, um ansprechende Bilder zu rendern. Um den wachsenden Anforderungen gerecht zu werden und neue Technologien optimal auszuschöpfen, haben wir nun innovative GenAI-Methoden in unsere Arbeitsabläufe integriert. Dabei kommen leistungsstarke Tools wie ControlNet, Stable Diffusion und LoRAs in Verbindung mit ComfyUI zum Einsatz. LoRAs (Low-Rank Adaptation) sind eine revolutionäre Technik zur Modell-Feinabstimmung, die es uns ermöglicht, große Modelle mit signifikant weniger Parametern zu optimieren und sie so effizient für spezifische Aufgaben zu nutzen.

 

In diesem Artikel werden die vier neuartigen Workflows vorgestellt, die die Bildproduktion durch imagejet revolutionieren.

Anwendung von GenAI in der Bildproduktion mit imagejet und ComfyUI
Anwendung von GenAI in der Bildproduktion mit imagejet und ComfyUI

Arbeitsablauf I: Generierung von Trainingsdaten mit imagejet

Der erste Workflow umfasst die Erzeugung von Trainingsdaten mit imagejet, um LoRAs oder Stable Diffusion-Modelle zu trainieren. Diese Modelle ermöglichen es uns, Materialien auf Sofas in Bildern zu ändern oder das Sofa selbst in einer Szene zu ersetzen.

 

Schritte im Arbeitsablauf I:

  • Datenerfassung: Umfassendes Sammeln und Kategorisieren von Bildern und Texturen. Dazu gehört die Erstellung von Computergrafiken (CG), die traditionell in der Bildproduktion mit imagejet gerendert wurden, sowie die Nutzung vorhandener Archivdaten und Sammlungen im Kundenbestand.
  • Beschriftung: Präzise Beschriftung jedes Bildes, um eine effektive Modelltraining zu gewährleisten.
  • Erzeugung von Trainingsdaten: Einsatz von imagejet zur Schaffung umfangreicher Trainingsdatensätze. Dies umfasst die Erstellung großer und vielfältiger Sets von besprochenen Bildern, aus denen die Modelle lernen können.
  • Modell-Training: Schulung von LoRAs und Stable Diffusion-Modellen mit den generierten Daten. Hierbei wird den Modellen beigebracht, wie sie Aufgaben wie Materialaustausch oder Szenenanpassungen erfolgreich durchführen können.

Dieser Arbeitsablauf ermöglicht es uns, eine hohe Präzision beim Materialaustausch und bei der Anpassung des Sofas in verschiedenen Szenen zu erreichen. Der Einsatz von imagejet hat sich als äußerst effizient erwiesen und bietet eine skalierbare Lösung für die Erzeugung von Trainingsdaten.

Arbeitsablauf II: Automatisierter Bildaustauschprozess

KI_Bildpoduktion_Sofa_Inpaint
Automatisch erzeugter Bildcontent zu Themenschwerpunkten mittels LoRA und Inpainting.

Im zweiten Workflow nutzen wir die trainierten LoRAs und haben einen automatisierten Prozess entwickelt, um Bilder schnell und effizient mittels Inpainting zu veredeln.

 

Schritte in Arbeitsablauf II:

  • Einsatz des Modells: Implementierung der trainierten LoRAs.
  • Automatisierung: Entwicklung eines automatisierten Systems zur Durchführung von Aufgaben wie Inpainting oder der Änderung von Stilen und Materialien für Bildinhalte. Das System kann automatisch Teile eines Bildes modifizieren oder neue Texturen und Designs auf Objekte anwenden.
  • Validierung: Überprüfung der modifizierten Bilder auf Konsistenz und Qualität.

Dieser Prozess erlaubt es uns, die Anforderungen unserer Kunden zügig zu erfüllen und abwechslungsreiche Material- und Farbkombinationen ohne manuellen Aufwand zu generieren. Die Automatisierung führt zu einer signifikanten Einsparung von Zeit und Ressourcen und stellt sicher, dass die Ergebnisse höchsten Qualitätsstandards entsprechen.

Arbeitsablauf III: Nutzung stabiler Diffusion für die Szenenerstellung

KI_Bildproiduktion_Scene_Reconstruction

Der dritte Workflow kombiniert vorhandene Hintergrundbilder mit Stable Diffusion, um sie so genau wie möglich nachzubilden. Anschließend wird ein Rendering in einer Studioszene erstellt, und das Sofa wird in die neu erstellte Szene integriert, sodass die Szene nicht mehr in 3D aufgebaut werden muss.

 

Schritte im Arbeitsablauf III:

  • Hintergrund-Analyse: Analysieren des vorhandenen Hintergrundbildes.
  • Stabile Diffusion: Verwendung von Stable Diffusion, um den Hintergrund so genau wie möglich nachzubilden.
  • Platzierung des Sofas: Rendering des Sofas in einer Studioszene und nahtlose Einbindung in den neu gestalteten Hintergrund.
  • Feinabstimmung: Anpassen von Beleuchtung und Schatten, um ein realistisches Bild zu erzeugen.

 

Dieser Workflow bietet eine kostengünstige Alternative zur traditionellen 3D-Szenenentwicklung und ermöglicht eine flexible Anpassung an unterschiedliche Umgebungen. Die Kombination von Stable Diffusion mit Studiorenderings führt zu beeindruckenden und realistischen Ergebnissen.

Arbeitsablauf IV: Erstellung und Verwendung von 3D-Avataren

Der vierte Workflow umfasst die Erstellung von 3D-Avataren, ihre Animation mit NVIDIA ACE und ihre Animation in Echtzeit mit LipSync. In Kombination mit einem benutzerdefinierten Large Language Model (LLM) können diese Avatare als Unternehmensvertreter für den First-Level-Support eingesetzt werden.

 

Schritte im Arbeitsablauf IV:

  • Avatar-Erstellung: Design ansprechender und realistischer 3D-Avatare.
  • Animation: Verwendung von NVIDIA ACE zur Animation der Avatare.
  • LipSync: Echtzeit-LipSync, der den Avataren eine natürliche Sprechart verleiht.
  • LLM-Integration: Einbindung der Avatare in ein maßgeschneidertes LLM, um eine effiziente und rechtssichere Kommunikation mit Kunden zu gewährleisten.

 

Dieser Workflow bietet eine innovative Lösung für den Kundenservice und ermöglicht die direkte Interaktion mit Kunden durch virtuelle Vertreter. Der Einsatz dieser Avatare kann die Effizienz des Supports steigern und eine einheitliche Kommunikation sicherstellen.

Fazit

Die Integration von GenAI in die Bildproduktionsprozesse hat zu signifikanten Fortschritten in Effizienz, Flexibilität und Qualität geführt. Durch die sorgfältige Entwicklung und Implementierung der vier beschriebenen Arbeitsabläufe sind wir in der Lage, die wachsenden Anforderungen unserer Kunden zu erfüllen und neueste Technologien effektiv zu nutzen. Der Einsatz von imagejet zur Generierung von Trainingsdaten, die Automatisierung des Bildaustauschprozesses, die Kombination von Stable Diffusion mit Studiorenderings sowie die Entwicklung interaktiver 3D-Avatare demonstrieren die beeindruckenden Möglichkeiten von GenAI in der zeitgenössischen Bildproduktion.

Das könnte Sie auch interessieren

imagejet - Plattform für digitale Bildproduktion mit 3D-Assets

Imagejet von Arvato Systems ist die cloudbasierte All-in-One-Plattform für kollaborative Massenproduktion von Bildern auf der Grundlage von 3D-Assets.

Arvato Systems revolutioniert 3D-Visualisierung mit Google Cloud

87 % der Verbraucher bevorzugen bei Online-Käufen visuelle Darstellungen von Produkten und ziehen hochwertige Bilder detaillierten Beschreibungen vor. „imagejet“, angetrieben von NVIDIA GPUs und Google Cloud, ermöglicht lebensechte 3D-Renderings für AR/VR und verbessert den E-Commerce mit skalierbaren Bildgebungslösungen in Studioqualität.

Verfasst von

Götz Moritz Bongartz
Götz Moritz Bongartz
Entwicklungsingenieur Imagejet