*Questoarticolo è basato su un video di YouTube di Sophie Hundertmark, esperta nell’uso dell’intelligenza artificiale con particolare attenzione ai chatbot e alle applicazioni strategiche dell’intelligenza artificiale nelle aziende e nelle istituzioni pubbliche. Sophie è ricercatrice e docente presso l’Università di Scienze Applicate e Arti di Lucerna e sta svolgendo un dottorato in IA conversazionale presso l’Università di Friburgo. Il testo del blog è stato creato utilizzando un modello GPT personalizzato che è stato addestrato in base al contenuto del video, allo stile linguistico e all’esperienza di Sophie. Ne risultano articoli fondati e aggiornati, basati sull’esperienza di Sophie Hundertmark.
Puoi trovare il link al video alla fine di questo articolo.
In diesem Beitrag schauen wir uns ein Feature an, das aktuell besonders bei Google Gemini auffällt: die integrierte Videogenerierung. Während viele von euch für Videos sofort an spezialisierte KI-Tools denken, zeigt Gemini sehr eindrucksvoll, dass auch All-in-one-Systeme komplexe Videoaufgaben übernehmen können.
Videogenerierung direkt aus komplexen Texten
Das Spannende an dieser Funktion ist, dass sie nicht auf einfache Stichpunkte oder kurze Skripte beschränkt ist. In meinem Beispiel habe ich ein 15-seitiges wissenschaftliches Paper hochgeladen, das in sehr fachlicher Sprache verfasst ist. Die Aufgabe an Gemini war bewusst einfach formuliert:
Aus diesem Dokument soll ein Video entstehen.
Auf Basis dieses umfangreichen Textdokuments wurde automatisch ein kurzes Video generiert, das die zentralen Inhalte zusammenfasst und visuell aufbereitet.
Erste Ergebnisse: überraschend solide
Das Ergebnis war ein kurzes, aber in sich schlüssiges Video. Inhalte, Animationen und Struktur haben gut zusammengepasst, obwohl der Ausgangstext sehr komplex war. Die Kernaussagen des Papers wurden verständlich transportiert und visuell unterstützt.
Natürlich gab es kleinere Schwächen, etwa einzelne Rechenfehler oder Ungenauigkeiten. Für einen ersten automatisierten Entwurf ist das jedoch völlig normal – vor allem, da das Video anschließend weiter bearbeitet werden kann.
Optimierung durch bessere Prompts und Storyboards
Ein klarer Vorteil der Videogenerierung in Gemini ist die Möglichkeit zur Iteration. Du kannst:
- Inhalte gezielt korrigieren
- das Video Schritt für Schritt verfeinern
- von Beginn an ein detailliertes Storyboard oder einen präziseren Prompt vorgeben
Gerade ein sauber ausgearbeitetes Storyboard hilft dabei, Struktur, Dramaturgie und inhaltliche Schwerpunkte deutlich zu verbessern. Je klarer deine Vorgaben, desto passender wird das Ergebnis.
Videofunktionen direkt im Gemini-Workflow
Innerhalb der Gemini-Oberfläche kannst du gezielt unterschiedliche Tools auswählen. Für dieses Beispiel wurde explizit das Video-Feature genutzt. Das macht den Workflow besonders effizient, da Textanalyse, Videoerstellung und Optimierung in einer Umgebung stattfinden.
Fazit: Starker Einstieg in KI-basierte Videoproduktion
Die Videogenerierung mit Google Gemini zeigt sehr gut, wie leistungsfähig multimodale KI inzwischen ist. Allein aus einem wissenschaftlichen Text ein erstes Video zu erzeugen, eröffnet neue Möglichkeiten für Wissensvermittlung, Content Creation und interne Kommunikation.
Wenn du bereit bist, mit Prompts und Storyboards zu arbeiten, kann Gemini ein sehr spannendes Werkzeug sein, um komplexe Inhalte schnell in visuelle Formate zu überführen.
Ci sono altre domande?
Hai qualche domanda? Sarò felice di sostenerti, di fare da sparring partner e di rispondere alle tue domande. Sono sempre felice di ricevere i tuoi messaggi, preferibilmente tramite messaggio WhatsApp o e-mail.