Kurze Zusammenfassung
Das Video fasst die neuesten Modelle von Open AI zusammen, darunter GPT-4.5, GPT-4.1, O3 und O4 Mini. Es wird erklärt, welche Modelle für welche Anwendungen am besten geeignet sind, wobei zwischen Modellen mit allgemeinem Weltverständnis und solchen, die auf logisches Denken und Argumentation (Reasoning) spezialisiert sind, unterschieden wird. Außerdem wird eine Kontroverse um die Trainingsdaten des O3-Modells angesprochen.
- GPT-4.5 und GPT-4.1 bieten verbessertes Weltverständnis und emotionale Intelligenz.
- O3 und O4 Mini sind neue Reasoning-Modelle, die sich besonders gut für Logik, Mathematik und Programmierung eignen.
- O4 Mini ist ein kostengünstiges Modell, das sich gut für schnelle Automatisierungsaufgaben eignet.
- Die Verwendung von Trainingsdaten im O3-Modell, die auch im Test verwendet wurden, wird kritisiert.
Überblick über die Modelle
Das Standardmodell für kostenlose Nutzer ist weiterhin GPT-4, ein älteres Modell, das jedoch für die Bilderzeugung verwendet wird. Es gibt auch Mini-Varianten, die kleiner und schneller sind und sich für Echtzeit-Anwendungen wie Chatbots eignen. Größere Modelle haben mehr Weltverständnis, sind aber teurer und langsamer.
GPT 4.5 und GPT 4.1
GPT 4.5 wurde am 27. Februar veröffentlicht und zeichnet sich durch ein verbessertes Weltverständnis aus. GPT 4.1 ist eine neue Modellfamilie, die nur für Entwickler über die API verfügbar ist. Es gibt auch Mini- und Nano-Versionen davon, wobei die Nano-Version sehr günstig, aber auch schlecht ist, während die Mini-Version für einfache Anfragen geeignet ist. Die emotionale Intelligenz der Modelle nimmt mit der Größe und Aktualität zu.
Reasoning Modelle
Reasoning-Modelle sind auf Logik und Denken trainiert. Die "O"-Modelle stehen für Multimodalität oder Reasoning, je nachdem, ob es sich um ein normales oder ein Reasoning-Modell handelt. O1 Mini ist wie GPT-4O, aber zusätzlich auf Denken trainiert. O1 ist besser als O1 Mini, da es ein größeres Modell ist. O1 Pro ist wie O1, denkt aber länger nach.
O3 und O4 Mini
O3 ist das neue große Reasoning-Modell, während O4 Mini ein günstigeres Modell für schnellere Automatisierung ist. O3 basiert vermutlich auf GPT 4.1, während O4 Mini möglicherweise auf GPT 4.5 Mini basiert. Das neue kostenlose Nachdenkmodell ist jetzt O4 Mini Medium. O3 und O4 Mini sind in Mathe besser als O3 Mini High. O4 Mini ist in Mathe sogar besser als O3, aber O3 ist in anderen Bereichen besser.
NordVPN
EU-Nutzer erhalten neue Modelle oft später aufgrund von Vorschriften wie dem AI Act, der DSGVO und dem DSA. NordVPN ermöglicht es, den Standort zu verschleiern und so schneller auf neue Versionen zuzugreifen. NordVPN bietet auch Spezialserver wie Onion Over VPN und Double VPN sowie einen Bedrohungsschutz, der betrügerische Websites blockiert.
Warum O3 und O4 Mini gleichzeitig veröffentlicht wurden
O3 ist für Open AI teurer als O4 Mini. Durch die gleichzeitige Veröffentlichung beider Modelle sollen die Nutzer eher das günstigere O4 Mini wählen. O3 ist jedoch in einigen Bereichen besser, z. B. beim Testen des Fachwissens von Experten. O4 Mini ist in diesem Bereich etwas schlechter als O3, aber immer noch besser als die meisten Experten.
Humanity Last Exam und Simple QA
Humanity Last Exam und Simple QA testen Bereiche, in denen KI-Modelle nicht so gut sind, z. B. das Beantworten einfacher Fragen, bei denen man sich spezielles Wissen aneignen muss. Simple QA wurde von Open AI entwickelt, aber sie haben ihre Modelle nicht damit getestet. O3 ist das beste Modell, wenn es um die Schwachstellen von KI geht, die man damit ausmerzen will.
Programmierung
O3 und O4 Mini sind die neuen Flaggschiff-Modelle für die Programmierung. Sie sind Reasoning-Modelle und deutlich günstiger als bisherige Modelle wie Cloud 3.7 Sonet Thinking. O4 Mini ist ein Drittel so teuer wie Cloud 3.7 Sonet und fast so gut im Software Engineering Benchmark.
Kontroverse um Trainingsdaten
Open AI hat zugegeben, dass sie O3 mit 75 % der Trainingsdaten trainiert haben, die auch im AGI-Test verwendet wurden. Dies ist ein No-Go, da es den Benchmark unsinnig macht. Es testet nicht mehr die eigentliche Fähigkeit, Aufgaben zu verstehen und zu lösen, sondern eher, wie gut es diese Aufgaben in seinem Trainingsdatensatz verarbeitet hat.
Neuerungen
O3 stellt neue wissenschaftliche Hypothesen auf, was die Grundlage für Forschung ist. Die Modelle können jetzt auch mit Bildern argumentieren und diese logisch verarbeiten. O4 Mini ist ein starkes und günstiges Modell für Programmierer. Die Modelle sind für agentisches Benutzen optimiert, d. h. sie können Tools verwenden, um Aufgaben zu erledigen.