AI News: 22 Advancements That Happened This Week!

AI News: 22 Advancements That Happened This Week!

Kurze Zusammenfassung

Diese Woche gab es viele spannende Entwicklungen im Bereich der künstlichen Intelligenz (KI). Meta hat eine neue Version der Meta AI App vorgestellt und Änderungen an den Datenschutzrichtlinien für die Ray-Ban Meta Brillen vorgenommen. Google hat seinen AI-Modus in den USA für Lab-Nutzer verfügbar gemacht und die Gemini App um Bildbearbeitungsfunktionen erweitert. Recraft AI hat ein Style-Update veröffentlicht, und es gab kleinere Updates für ChatGPT. Elon Musk kündigte Grok 3.5 an, und Anthropic stellte neue Claude-Integrationen vor. Alibaba präsentierte Qwen3, und Vercept kündigte den AI-Agenten VI an. MidJourney hat Omni-Reference eingeführt, Kling AI den Instant Film Effect, und Higgsfield AI Iconic Scenes. Krea veröffentlichte GPT Paint, und es gab Kuriositäten mit GPT-4o Bildern. Suno, Duolingo und Lyft kündigten KI-bezogene Updates an, und Aurora testet autonome LKWs in Texas.

  • Meta AI App und Datenschutzänderungen
  • Google AI-Modus und Gemini App Updates
  • Recraft AI Style Update
  • Kleinere ChatGPT Updates und Grok 3.5 Ankündigung
  • Neue KI-Tools und kreative Updates

Intro

Der Sprecher gibt eine Übersicht über die KI-Nachrichten der Woche und beginnt mit den Ankündigungen von Meta, insbesondere im Zusammenhang mit der Llamacon-Veranstaltung. Er erklärt, dass die Llamacon sich stärker auf KI konzentriert als die Meta Connect, die sich mehr auf soziale Medien und Hardware konzentriert.

Meta AI App

Meta hat eine neue Version der Meta AI App veröffentlicht, die eine Umbenennung der Meta View App darstellt. Die App bietet nun eine eigenständige Chatfunktion, ähnlich wie ChatGPT und Claude. Der Sprecher demonstriert die Chatfunktion und stellt fest, dass sie auf Llama 4 basiert. Er testet die Fähigkeiten des Chatbots mit Witzen und Wissensfragen, wobei der Chatbot bei einer einfachen Frage zur Anzahl der "R" im Wort "Strawberry" zunächst falsch antwortet. Die App zielt darauf ab, KI-Chats sozialer zu gestalten, indem sie eine Teilen-Funktion bietet, mit der Benutzer ihre Konversationen in einem Feed posten können, wo andere Benutzer kommentieren und interagieren können. Die App kann auch Bilder generieren, wobei der Sprecher ein Bild eines Wolfs, der den Mond anheult, generieren lässt. Benutzer können eine Konversation auf ihren Ray-Ban Meta Brillen beginnen und sie dann in der App oder Web-App fortsetzen.

Ray-Ban Meta Privacy

Meta hat seine Datenschutzrichtlinien für die Ray-Ban Meta Brillen geändert. Die Kamerafunktion für Meta AI ist jetzt immer aktiviert, es sei denn, sie wird explizit deaktiviert. Fotos und Videos, die mit den Brillen aufgenommen werden, werden auf dem Telefon des Benutzers gespeichert und nicht von Meta für Trainingszwecke verwendet. Meta erlaubt es Ray-Ban Meta Besitzern nicht mehr, die Speicherung ihrer Sprachaufnahmen in der Cloud zu deaktivieren. Benutzer können Sprachaufnahmen jedoch jederzeit in den Einstellungen löschen. Sprachaufzeichnungen und gespeicherte Audioaufnahmen werden bis zu einem Jahr gespeichert, um die Produkte von Meta zu verbessern. Es wird vermutet, dass Meta die Audio- und Transkriptdaten verwenden wird, um seine Large Language Models (LLMs) zu trainieren.

Meta AI Ads

Meta plant, Werbung in die Meta AI App zu integrieren. Obwohl die App derzeit kostenlos und werbefrei ist, wird sie in Zukunft wahrscheinlich durch Werbung unterstützt. Mark Zuckerberg erwähnte während einer Telefonkonferenz die Einbindung von Produktempfehlungen oder Anzeigen in Meta AI. Es ist jedoch unklar, wann Anzeigen oder eine kostenpflichtige Version eingeführt werden. Meta möchte sich zunächst auf die Skalierung und die Steigerung des Engagements konzentrieren, bevor es die geschäftliche Seite ausbaut. Es ist unklar, ob es sich um traditionelle Anzeigen oder um Produktempfehlungen innerhalb der Chatantworten handeln wird. Der Sprecher spekuliert, dass Anzeigen wie KI-Chat-Konversationen aussehen könnten oder dass gesponserte Antworten auf Benutzeranfragen gegeben werden könnten.

Google AI Mode

Google hat seinen neuen AI-Modus, der als Antwort auf Perplexity und die neuen ChatGPT-Suchfunktionen gesehen wird, in den USA für alle Lab-Nutzer verfügbar gemacht. Der AI-Modus bietet KI-gestützte Antworten auf Suchanfragen mit Links zu relevanten Websites. Der Sprecher konnte den AI-Modus in seinem Konto noch nicht aktivieren, zeigt aber ein Video, das die Benutzeroberfläche demonstriert. Google plant auch, den AI-Modus in den kommenden Wochen in einem begrenzten Test außerhalb von Labs für eine kleine Anzahl von Benutzern in den USA einzuführen.

Images in Gemini App

Benutzer der Gemini App auf Android-Geräten können jetzt Bilder direkt in der App hochladen und bearbeiten. Diese Funktion war zuvor in AI Studio verfügbar. Der Sprecher erwähnt, dass er diese Funktion in früheren Videos demonstriert hat, indem er Bilder mit Sonnenbrillen und Hüten versehen hat.

NotebookLM Update

NotebookLM kann jetzt Audio-Overviews, im Wesentlichen kleine Podcasts, in über 50 Sprachen generieren. Der Sprecher demonstriert dies, indem er ein neues Notebook erstellt, Quellen zum Thema Quantencomputing entdecken lässt und die Ausgabesprache auf Spanisch ändert.

Google Little Language Lessons

Google hat eine neue App namens Little Language Lessons veröffentlicht, die sich an Reisende richtet, die grundlegende Sprachkenntnisse für ihre Reise erwerben möchten. Die App enthält drei verschiedene Experimente: Tiny Lesson, Slang Hang und Word Cam. Tiny Lesson bietet relevante Vokabeln, Phrasen und Grammatik für bestimmte Situationen. Slang Hang lehrt Ausdrücke, Redewendungen und regionalen Slang aus generierten Gesprächen zwischen Muttersprachlern. Word Cam ermöglicht es Benutzern, ein Foto zu machen, um zu lernen, wie man über ihre Umgebung spricht. Der Sprecher demonstriert Tiny Lesson, indem er Japanisch für das Essen in einem Restaurant auswählt und sich Vokabeln und Phrasen generieren lässt.

Recraft AI Style Update

Recraft AI hat ein Style-Update veröffentlicht, das eine umfangreiche Style-Bibliothek mit einer endlosen Auswahl an Stilen bietet, die Benutzer für ihre eigenen Bilder auswählen können. Benutzer können Stile suchen, speichern und sogar mehrere Stile kombinieren, um einzigartige, benutzerdefinierte Stile zu erstellen. Der Sprecher demonstriert die neuen Funktionen, indem er verschiedene Stile auf ein Bild eines Wolfs, der den Mond anheult, anwendet und mehrere Stile zu einem neuen Stil kombiniert. Recraft bietet einen Rabatt von 11 US-Dollar auf den ersten Monat für neue Benutzer.

ChatGPT Updates

Sam Altman äußerte sich unzufrieden mit der aktuellen Version von GPT-4o, da die Persönlichkeit des Modells zu "sycophantisch" geworden sei. OpenAI hat daraufhin die Updates von GPT-4o zurückgesetzt und ist zu einer früheren Version zurückgekehrt. OpenAI erklärte, dass sie versucht haben, die Standardpersönlichkeit des Modells zu verbessern, aber zu viel Wert auf kurzfristiges Feedback gelegt haben. ChatGPT hat auch einige andere Funktionen erhalten, darunter Verbesserungen der ChatGPT-Suche und eine verbesserte Shopping-Experience. Die Shopping-Experience bietet eine Karussell-ähnliche Anzeige von Produkten, die auf Suchanfragen basieren. Die Suchfunktion wurde auch in WhatsApp integriert.

Grok 3.5 Coming

Elon Musk kündigte an, dass Grok 3.5 nächste Woche für Super Grok-Abonnenten verfügbar sein wird. Er behauptet, dass es die erste KI ist, die technische Fragen zu Raketenmotoren oder Elektrochemie genau beantworten kann. Es argumentiert von ersten Prinzipien aus und kann Antworten finden, die nicht im Internet existieren.

Claude Integrations

Anthropic hat neue Integrationen für Claude angekündigt, die es Large Language Models (LLMs) ermöglichen, einfacher mit anderen Apps zu kommunizieren. Diese Integrationen sind derzeit für Max Team- und Enterprise-Pläne verfügbar.

Alibaba Qwen3

Alibaba hat ein neues Modell namens Qwen3 vorgestellt, ein hybrides KI-Reasoning-Modell. Hybride Reasoning-Modelle ermöglichen es Benutzern, das "Chain of Thought"-Denken ein- oder auszuschalten. Laut Benchmarks ist Qwen3 sehr gut. Der Sprecher äußert sich jedoch zunehmend unbeeindruckt von marginalen Verbesserungen bei Large Language Models (LLMs).

Vercept AI Agent

Vercept hat VI angekündigt, ein neues Tool, das KI verwendet, um mit dem Computer des Benutzers zu interagieren. VI läuft nativ auf dem Computer des Benutzers und hat Zugriff auf alle Anwendungen und Konten. Benutzer können die Software herunterladen, müssen sich aber auf eine Warteliste setzen lassen, bevor sie sie verwenden können. VI kann Anwendungen öffnen, in Google tippen und Dateien herunterladen. Es kann auch in Figma verwendet werden, auch wenn der Benutzer nicht weiß, wie man die App benutzt.

MidJourney Omni-Reference

MidJourney hat Omni-Reference eingeführt, eine Möglichkeit, ein Bild in ein anderes Bild einzufügen. Der Sprecher demonstriert dies, indem er ein Porträt von sich selbst in ein Bild eines Wikingers einfügt.

Kling Instant Film Effect

Kling AI hat einen neuen Effekt namens Instant Film Effect veröffentlicht, der ein Porträtbild in ein animiertes Polaroid verwandelt. Der Sprecher demonstriert dies, indem er ein Foto von sich selbst hochlädt und den Instant Film Effect anwendet.

Higgsfield Iconic Scenes

Higgsfield AI hat eine neue Funktion namens Iconic Scenes veröffentlicht, mit der Benutzer sich selbst in legendäre Filmszenen einfügen können. Der Sprecher demonstriert dies, indem er ein Porträt von sich selbst in die "This is Fine"-Szene einfügt.

Krea GPT Paint

Krea hat eine neue Funktion namens GPT Paint veröffentlicht, mit der Benutzer Chat GPT visuell durch Bearbeitungsmarken, einfache Formen, Notizen und Referenzbilder auffordern können.

GPT-4o Image Weirdness

Benutzer haben festgestellt, dass GPT-4o dazu neigt, das Aussehen von Bildern im Laufe der Zeit zu verändern, selbst wenn es wiederholt aufgefordert wird, eine exakte Replik zu erstellen. Der Sprecher zeigt Beispiele, in denen wiederholte Aufforderungen zur Erstellung einer exakten Replik eines Bildes zu drastischen Veränderungen führen.

Suno Update

Suno hat eine neue Version, Version 4.5, veröffentlicht, die einige kleinere Verbesserungen aufweist.

Duolingo AI First

Duolingo hat angekündigt, ein KI-First-Unternehmen zu werden und schrittweise aufhören, Auftragnehmer für Arbeiten einzusetzen, die von KI erledigt werden können.

Lyft AI to Make More Money

Lyft hat einen KI-Verdienstassistenten eingeführt, der Fahrern helfen soll, ihre Schichten basierend auf Echtzeitdaten zu optimieren.

Autonomous Trucks

Das Unternehmen Aurora hat fahrerlose LKWs in Texas eingesetzt.

Final Thoughts

Der Sprecher fasst zusammen, dass es viele aufregende KI-Nachrichten gibt, insbesondere im Bereich der kreativen KI. Er ist weniger begeistert von marginalen Verbesserungen bei Large Language Models (LLMs) und verweist auf andere Kanäle für detailliertere Informationen zu diesem Thema. Er ermutigt die Zuschauer, das Video zu liken und den Kanal zu abonnieren, um über die neuesten KI-Nachrichten und -Tutorials auf dem Laufenden zu bleiben. Er erwähnt auch futuretools.io, wo er alle coolen KI-Tools kuratiert, auf die er stößt, und einen kostenlosen Newsletter mit den wichtigsten Nachrichten und Tools.

Share

Summarize Anything ! Download Summ App

Download on the Apple Store
Get it on Google Play
© 2024 Summ