Gemini Live Video is incredible.

Gemini Live Video is incredible.

Kurze Zusammenfassung

Das Video behandelt die neue visuelle, KI-gestützte Funktion von Gemini, die langsam ausgerollt wird und nun breiter verfügbar ist. Es wird erklärt, wie man darauf zugreift, was man damit machen kann und ob sich die Nutzung lohnt.

  • Gemini Live bietet neue Möglichkeiten zur Interaktion mit der Umgebung und zur Unterstützung bei Aufgaben.
  • Der Zugriff erfordert ein Google One AI Advanced-Abonnement.
  • Die Genauigkeit ist nicht perfekt, und es kann zu Fehlern kommen.

Einführung in Gemini Live

Google rollt die visuelle, KI-gestützte Funktion von Gemini langsam aus, aber sie wird nun breiter verfügbar. Die Kamera- und Bildschirmfreigabefunktionen sind technisch Teil des April 2025 Pixel Drop, funktionieren aber auf fast jedem Android-Telefon. Pixel-Nutzer erhalten in den nächsten Tagen ein Update. Nach dem Start von Gemini wird ein Pop-up angezeigt, das die neuen Funktionen ankündigt.

Zugriff und erste Schritte

Um auf die neuen visuellen Modi zuzugreifen, ist ein Google One AI Advanced-Abonnement erforderlich. Besitzer bestimmter Pixel- und Galaxy-Modelle erhalten eine kostenlose Testphase. Der einfachste Weg, die neuen Steuerelemente zu nutzen, ist über die Gemini-App. Dort gibt es eine Kamera- und eine Präsentationsschaltfläche. Über eine Schaltfläche kann die Bildschirmfreigabe gestartet werden, wobei der gesamte Bildschirm freigegeben werden muss.

Benutzung und Funktionen

Der Start und die Einführung sind sehr schnell. Die Benutzeroberfläche ähnelt der Pixel-Kamera-UI. Es kann zwischen der Haupt- und der Selfie-Kamera gewechselt werden. Der Fokus der Kamera kann etwas ungenau sein. Gemini ist schnell bei der Erkennung von Objekten und der Bereitstellung von Informationen. Es fehlt eine Zoomfunktion. Die besten Anwendungsfälle sind detailliertere Fragen zu Objekten, Orten und Bereichen. Beispiele sind die Bestimmung des Kaloriengehalts von Lebensmitteln oder Allergeninformationen.

Beispiele und Übersetzungen

Es werden Beispiele für die Verwendung von Gemini Live gezeigt, darunter die Frage, ob ein Lippenbalsam für Vegetarier und Veganer geeignet ist, und Ratschläge zur Reinigung eines Kamerasensors. Auch Echtzeitübersetzungen wurden getestet, die recht genau erscheinen. Gemini Live zeigt jedoch keinen Text auf dem Bildschirm an, sondern gibt nur Audio-Antworten. Textbasierte Antworten sind erst nach dem Beenden der Sitzung im Chatprotokoll sichtbar.

Anwendungsfälle und Bildschirmfreigabe

Gemini Live kann als visuelle Lernhilfe oder für Tutorials verwendet werden. Die Videofunktionen funktionieren reibungslos. Die Bildschirmfreigabe wirkt weniger natürlich, da es kein visuelles Feedback gibt. Nützlich ist die Funktion, um Webseiten zusammenzufassen oder weitere Informationen zu erhalten, ohne die Seite zu verlassen. Es wird erwartet, dass zukünftige Integrationen, wie das Hinzufügen von Artikeln zur Einkaufsliste oder Flugdaten zum Kalender, die Funktion verbessern werden.

Genauigkeit und Fehler

Gemini ist nicht perfekt und kann Fehler machen. Bei bestimmten Artikeln konnte Gemini keine genauen Informationen liefern. Es besteht die Gefahr von Halluzinationen, insbesondere bei Dingen, die man nicht kennt. In einem Beispiel wurde ein Game Boy-Spiel falsch identifiziert. Eine klare Sicht auf das Objekt im Sucher hilft, Fehler zu vermeiden. Die Informationen sollten nicht blind vertraut werden.

Fazit und Ausblick

Android XR- und AR-Plattformen werden stark auf Gemini angewiesen sein. Gemini Live ist ein erster Schritt in diese Richtung. Es ist ein guter Anfang, aber man sollte den Informationen nicht blind vertrauen. Die Funktion wird sich mit der Zeit verbessern. Die Bildschirmfreigabe ist noch begrenzt und wirkt wie ein "Showeffekt". Es wird gehofft, dass sich die Funktion weiterentwickelt.

Share

Summarize Anything ! Download Summ App

Download on the Apple Store
© 2024 Summ