Kurze Zusammenfassung
Das Video demonstriert die neuen Gemini-Funktionen von Google, die es ermöglichen, über einen Live-Kamerastream oder Bildschirmfreigabe in Echtzeit Fragen zu dem zu stellen, was man sieht. Der Sprecher testet die Funktion anhand verschiedener Szenarien, um ihre Nützlichkeit im Alltag zu bewerten. Dabei werden sowohl die Stärken (Produktidentifizierung, Erläuterung von Kameraeinstellungen, Zusammenfassung von Kommentaren) als auch die Schwächen (falsche Identifizierungen, ungenaue Anweisungen, langsame Reaktionszeiten) der Funktion aufgezeigt.
- Die Funktion ist derzeit nur für Gemini Advanced-Abonnenten verfügbar.
- Die Genauigkeit variiert je nach Szenario, wobei einige Informationen korrekt und andere fehlerhaft sind.
- Die Reaktionszeiten können langsam sein, und es fehlt ein Audio-Feedback, um den Benutzer über den Fortschritt zu informieren.
Einführung
In der Einleitung wird die neue Gemini-Funktion von Google vorgestellt, die es Nutzern ermöglicht, über einen Live-Kamerastream oder Bildschirmfreigabe Fragen zu stellen. Diese Funktion, die erstmals auf der IO-Veranstaltung von Google als Project Astra angekündigt wurde, ist nun für die Öffentlichkeit zugänglich. Das Video zielt darauf ab, die praktische Anwendung und den Nutzen dieser Funktion im täglichen Gebrauch zu demonstrieren.
Wie fange ich an?
Um die Funktion zu nutzen, muss man Gemini öffnen und auf die Live-Taste tippen. Verfügbare Nutzer sehen dann zwei neue Optionen: eine für die Kamera und eine für die Bildschirmfreigabe. Diese Funktionalität ist exklusiv für Gemini Advanced-Abonnenten. Im Video wird zunächst die Videostream-Option getestet.
Video Stream Szenarien
In diesem Abschnitt werden verschiedene Szenarien mit dem Videostream durchgespielt. Zunächst wird Gemini nach dem Modell einer Lampe gefragt, die korrekt als LifeSmart Cololight Pro identifiziert wird. Anschließend wird nach einem grauen Telefon gefragt, das fälschlicherweise als Nokia Lumia 920 anstelle des korrekten Nokia Lumia 925 identifiziert wird. Bei der Identifizierung einer GoPro Hero 12 Black ist Gemini erfolgreich und gibt sogar hilfreiche Tipps zu den Videoeinstellungen, einschließlich der Erläuterung der verschiedenen Modi wie L+, LW und SV. Als Nächstes wird versucht, ein Wahrzeichen zu identifizieren, wobei eine Moschee fälschlicherweise als "Shik Zed Ajan Moschee" bezeichnet wird, obwohl sie eigentlich Ahmed heißt. Ein Hotel wird jedoch korrekt als Rison Blue Hotel, Azan, identifiziert, einschließlich seiner Fünf-Sterne-Bewertung. Abschließend wird ein Einkaufszentrum im Freien korrekt als City Center Aman identifiziert, und es wird bestätigt, dass es dort einen Samsung Store gibt, aber kein Boss Store gefunden werden kann.
Screen Sharing Szenarien
Der Abschnitt über die Bildschirmfreigabe untersucht verschiedene Anwendungsmöglichkeiten. Im ersten Szenario soll Gemini eine Zusammenfassung der Kommentare unter einem YouTube-Video (Pixel 9a Review) erstellen. Zunächst verwechselt Gemini das Video mit einem Nokia-Review, korrigiert sich aber nach einem Hinweis und liefert eine akkurate Zusammenfassung der Kommentare, die die Diskussionen über Ähnlichkeiten zu Samsung-Telefonen, die Dicke der Ränder, die Kameraleistung und den Wert des Telefons hervorhebt. Kritisiert wird jedoch die lange Reaktionszeit ohne Audio-Feedback. Im zweiten Szenario soll Gemini helfen, eine Funktion (automatisches Umschalten in den Vibrationsmodus bei der Ankunft am Arbeitsplatz) auf einem Pixel 9 Pro XL zu aktivieren. Gemini gibt jedoch mehrfach falsche Anweisungen, verwechselt die Menüführung und gibt schließlich zu, falsche Informationen gegeben zu haben. Erst nach direkter Anleitung durch den Sprecher gelingt es, die Funktion über die "Regeln" unter "System" korrekt einzustellen. Im dritten Szenario wird Gemini gebeten, Informationen über ein Auto (Koenigsegg Regera) zu liefern, das korrekt identifiziert wird. Gemini liefert Informationen zu Motor, Beschleunigung und Höchstgeschwindigkeit, wiederholt aber am Ende der Konversation mehrfach die Frage nach der Anzahl der noch existierenden Regeras, ohne eine Antwort zu geben.
Abschließende Gedanken
Abschließend wird festgestellt, dass die Gemini-Funktion noch weit von perfekt entfernt ist. Sie macht Fehler und kann langsam sein, ist aber in einigen Fällen nützlich. Der Sprecher betont, dass er sich derzeit nicht vollständig darauf verlassen kann, hofft aber auf Verbesserungen durch vermehrte Nutzung. Er lädt die Zuschauer ein, ihre Meinung in den Kommentaren zu teilen.