Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

Video-Ki Gemini Omni vorgestellt - PCtipp hat sie ausprobiert

Google präsentiert mit Gemini Omni ein neues Modell, das aus allen möglichen Eingaben wie Audio, Text, Video oder Bildern vielfältige Ausgaben erzeugen kann – angefangen bei Videos. Wir haben es getestet.
Screenshot von einem Video, das mit der Omni KI von Gemini erstellt wurde
© Google / Youtube

An der Entwicklerkonferenz Google I/O 2026 wurde unter anderem Gemini Omni vorgestellt.

Das neue Gemini Omni kombiniert Geminis Fähigkeiten zum Schlussfolgern mit der Fähigkeit, Neues zu kreieren. Omni ist ein neues Modell von Google, das aus allen möglichen Eingaben vielfältige Ausgaben erzeugen kann – angefangen bei Videos. Mit Omni können die Nutzer bei der Eingabe Bilder, Audio, Video und Text kombinieren und so hochwertige Videos erstellen, die auf Geminis Allgemeinwissen fundiert sind.

Wir vom PCtipp haben Gemini Omni einem ersten kurzen Test unterzogen. Hier das Resultat im Video:

Der Prompt dazu

Für das Video haben wir ein Foto des Journalisten sowie ein Bild vom PCtipp-Logo und den folgenden Prompt verwendet:

let this person fly in an open old style airplane over switzerland. show the plane from outside. at any moment show a close up of the upper part of the person. The plane is trailing a banner featuring the logo shown in the picture.

An der I/O wurde das erste Modell der Omni-Familie vorgestellt: Gemini Omni Flash. Es ist für alle Abonnenten von Google AI Plus, Pro und Ultra weltweit über die Gemini App sowie Google Flow verfügbar. Gemini Omni Flash wird ausserdem kostenlos für die Nutzer von YouTube Shorts und YouTube Create eingeführt. Schon bald sollen Ausgabeformate wie Bild und Audio unterstützt werden.

Videos per Spracheingabe bearbeiten

Mit Gemini Omni lassen sich Videos einfacher bearbeiten, und zwar mit natürlicher Sprache. Jede Anweisung baut auf der vorherigen auf.Charaktere bleiben konsistent, physische Eigenschaften sind realitätsgetreu und Szenen basieren auf dem, was vorher geschah.

Videos aus jeder beliebigen Kombination von Eingaben

Alles referenzieren. Omni verwandelt jede Referenz – sei es Bild, Text, Video oder Audio – in ein einziges, stimmiges Ergebnis. Während zu Beginn erstmal nur Sprachreferenzen für Audio unterstützt werden, wird Google schon bald weitere Arten von Audio-Eingaben einführen.

Wasserzeichen SynthID

Alle mit Omni erstellten Videos enthalten das unsichtbare digitale Wasserzeichen SynthID. Mit der Gemini App, Gemini in Chrome und der Google Suche lässt sich einfach überprüfen, ob Videos mit Gemini Omni erstellt wurden.

Kommentare

Google Künstliche Intelligenz Apps Smartphone & Apps Videos
Anzeige
Anzeige

Neueste Beiträge

PC-Maus
Im Test – Logitech Mobi Fold
Nach dem Klapp-Handy kommt die faltbare Maus. Logitechs Mobi Fold soll der ideale Begleiter für unterwegs sein. Ob das alles nur grosse Klappe ist oder auch was dahintersteckt, verrät unser Test.
3 Minuten
12. Jun 2026
Prüfung des Einsatzes von Linked Data Services
Linked Data Service (LINDAS) ist eine IT-Dienstleistung des Bundesarchivs (BAR). Mit LINDAS können Bund, Kantone und Gemeinden frei verfügbare, sogenannte offene Verwaltungsdaten (Open Government Data – OGD) vernetzen und publizieren.
2 Minuten
11. Jun 2026
Digitalstudie: Junge Nutzer wollen weniger online sein
Die Deutschen verbringen weiterhin mehr als 67 Stunden pro Woche im Internet. Vor allem bei den unter 40-Jährigen zeichnet sich jedoch ein gegenläufiger Trend ab: Viele wollen ihre Online-Zeit bewusst reduzieren, insbesondere bei Social Media und Messenger-Diensten.
3 Minuten
11. Jun 2026

Das könnte Sie auch interessieren

NFC-Angriffe auf Android verdreifacht
Cyberkriminelle nutzen zunehmend NFC-Technologie, um Bankdaten von Android-Nutzern zu stehlen. Die Angriffszahlen sind in wenigen Monaten dramatisch gestiegen.
2 Minuten
28. Mai 2026
Radios können Gesuche einreichen
BAKOM publiziert UKW-Frequenzen
Das Bundesamt für Kommunikation BAKOM hat am 28. Mai 2026 die Frequenzpakete für die Verbreitung von UKW publiziert.
2 Minuten
29. Mai 2026
Schweizer Geoportal zeigt die Schweiz aus 1000 Perspektiven
Das vom Bundesamt für Landestopografie swisstopo betriebene Geoportal umfasst seit Mai 2026 schon 1000 Datensätze zu unterschiedlichsten Themen wie Gesellschaft, Umwelt, Energie bis hin zu historischen Karten, Landschaftsmodellen und Luftbildern.
3 Minuten
19. Mai 2026
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige

Kommentare