Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

Video-Ki Gemini Omni vorgestellt - PCtipp hat sie ausprobiert

Google präsentiert mit Gemini Omni ein neues Modell, das aus allen möglichen Eingaben wie Audio, Text, Video oder Bildern vielfältige Ausgaben erzeugen kann – angefangen bei Videos. Wir haben es getestet.
Screenshot von einem Video, das mit der Omni KI von Gemini erstellt wurde
© Google / Youtube

An der Entwicklerkonferenz Google I/O 2026 wurde unter anderem Gemini Omni vorgestellt.

Das neue Gemini Omni kombiniert Geminis Fähigkeiten zum Schlussfolgern mit der Fähigkeit, Neues zu kreieren. Omni ist ein neues Modell von Google, das aus allen möglichen Eingaben vielfältige Ausgaben erzeugen kann – angefangen bei Videos. Mit Omni können die Nutzer bei der Eingabe Bilder, Audio, Video und Text kombinieren und so hochwertige Videos erstellen, die auf Geminis Allgemeinwissen fundiert sind.

Wir vom PCtipp haben Gemini Omni einem ersten kurzen Test unterzogen. Hier das Resultat im Video:

Der Prompt dazu

Für das Video haben wir ein Foto des Journalisten sowie ein Bild vom PCtipp-Logo und den folgenden Prompt verwendet:

let this person fly in an open old style airplane over switzerland. show the plane from outside. at any moment show a close up of the upper part of the person. The plane is trailing a banner featuring the logo shown in the picture.

An der I/O wurde das erste Modell der Omni-Familie vorgestellt: Gemini Omni Flash. Es ist für alle Abonnenten von Google AI Plus, Pro und Ultra weltweit über die Gemini App sowie Google Flow verfügbar. Gemini Omni Flash wird ausserdem kostenlos für die Nutzer von YouTube Shorts und YouTube Create eingeführt. Schon bald sollen Ausgabeformate wie Bild und Audio unterstützt werden.

Videos per Spracheingabe bearbeiten

Mit Gemini Omni lassen sich Videos einfacher bearbeiten, und zwar mit natürlicher Sprache. Jede Anweisung baut auf der vorherigen auf.Charaktere bleiben konsistent, physische Eigenschaften sind realitätsgetreu und Szenen basieren auf dem, was vorher geschah.

Videos aus jeder beliebigen Kombination von Eingaben

Alles referenzieren. Omni verwandelt jede Referenz – sei es Bild, Text, Video oder Audio – in ein einziges, stimmiges Ergebnis. Während zu Beginn erstmal nur Sprachreferenzen für Audio unterstützt werden, wird Google schon bald weitere Arten von Audio-Eingaben einführen.

Wasserzeichen SynthID

Alle mit Omni erstellten Videos enthalten das unsichtbare digitale Wasserzeichen SynthID. Mit der Gemini App, Gemini in Chrome und der Google Suche lässt sich einfach überprüfen, ob Videos mit Gemini Omni erstellt wurden.

Kommentare

Google Künstliche Intelligenz Apps Smartphone & Apps Videos
Anzeige
Anzeige

Neueste Beiträge

Samsung und Google zeigen intelligente Brillen
Auf der Google-Entwicklerkonferenz I/O hat der Webriese zwei Designs einer smarten Brille gezeigt, die zusammen mit Samsung und zwei Brillenmarken entwickelt wurde. Die erste Kollektion soll im Herbst auf den Markt kommen.
3 Minuten
21. Mai 2026
«MWST-Abrechnung easy» wird abgeschaltet
Die ESTV hat die wichtigsten Onlineservices ins neue ESTV-Portal überführt. Aufgrund erhöhter Sicherheitsanforderungen kann «MWST-Abrechnung easy» nicht mehr genutzt werden.
2 Minuten
20. Mai 2026
Das erste Trump-Smartphone wird endlich ausgeliefert
Mit einer Verzögerung von mehreren Monaten startet jetzt doch in den USA die Auslieferung des ersten Smartphones der Trump Organization. Der US-Sender NBC konnte bereits ein Exemplar ausprobieren.
2 Minuten
20. Mai 2026

Das könnte Sie auch interessieren

Publireportage
Ist öffentliches WLAN sicher? Das solltest du wissen
Öffentliche WLAN-Netze sind überall: in Flughäfen, Hotels, Bibliotheken, Einkaufszentren und vielen anderen Orten. Sich schnell und kostenlos mit dem Internet zu verbinden, war noch nie so einfach. Doch so praktisch diese Netzwerke auch sind – für Cyberkriminelle sind sie ein echtes Einfallstor.
3 Minuten
Bessere Qualität der swisstopo Geodaten dank neuer Luftbildkameras
Zum Start der Flugsaison 2026 führt das Bundesamt für Landestopografie swisstopo eine Kamera neuster Generation für die Aufnahme von Luftbildern ein. Diese Weiterentwicklung dient der Erneuerung von Aufnahmesystemen, die das Ende ihres Lebenszyklus erreicht haben. 
3 Minuten
23. Apr 2026
Schweizer Geoportal zeigt die Schweiz aus 1000 Perspektiven
Das vom Bundesamt für Landestopografie swisstopo betriebene Geoportal umfasst seit Mai 2026 schon 1000 Datensätze zu unterschiedlichsten Themen wie Gesellschaft, Umwelt, Energie bis hin zu historischen Karten, Landschaftsmodellen und Luftbildern.
3 Minuten
19. Mai 2026
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige

Kommentare