Краткое резюме
В этом видео OpenAI представляет GPT 4.5, свою последнюю языковую модель, которая доступна в виде исследовательского превью для пользователей ChatGPT Pro и разработчиков через API. GPT 4.5 - это самая большая и самая знающая модель OpenAI на сегодняшний день, которая обучена с использованием двух парадигм: неконтролируемого обучения и рассуждения. Неконтролируемое обучение повышает точность и интуицию модели, а рассуждение позволяет ей думать перед ответом, что особенно полезно для задач, требующих логического мышления, таких как наука, математика и сложные вопросы. GPT 4.5 демонстрирует улучшенное понимание контекста и более глубокие знания, что делает ее более естественной в общении и полезной для различных задач, таких как улучшение письма, программирование и решение практических проблем.
- GPT 4.5 - это самая большая и самая знающая модель OpenAI на сегодняшний день.
- GPT 4.5 обучена с использованием двух парадигм: неконтролируемого обучения и рассуждения.
- GPT 4.5 демонстрирует улучшенное понимание контекста и более глубокие знания.
Введение GPT 4.5
В этом видео OpenAI представляет GPT 4.5, свою последнюю языковую модель, которая доступна в виде исследовательского превью для пользователей ChatGPT Pro и разработчиков через API. GPT 4.5 - это самая большая и самая знающая модель OpenAI на сегодняшний день, которая обучена с использованием двух парадигм: неконтролируемого обучения и рассуждения. Неконтролируемое обучение повышает точность и интуицию модели, а рассуждение позволяет ей думать перед ответом, что особенно полезно для задач, требующих логического мышления, таких как наука, математика и сложные вопросы.
Демонстрация GPT 4.5
В этом разделе видео демонстрируется GPT 4.5 в действии. В качестве примера используется задача написания текстового сообщения другу, который постоянно отменяет встречи. GPT 4.5 демонстрирует способность понимать контекст и предлагать более нюансные и конструктивные ответы, в отличие от предыдущих моделей, которые могли бы просто следовать инструкциям и генерировать более агрессивный текст.
Выравнивание GPT 4.5
В этом разделе видео обсуждается процесс выравнивания GPT 4.5, который направлен на обучение модели лучшему пониманию человеческих потребностей и намерений. OpenAI разработала новые масштабируемые методы выравнивания, которые позволили обучить модель с использованием данных, полученных от более мелких моделей. Это позволило GPT 4.5 развить более глубокую "модель мира", что привело к улучшению точности и снижению уровня галлюцинаций.
Оценка GPT 4.5
В этом разделе видео обсуждаются результаты оценки GPT 4.5. Модель была протестирована на различных задачах, включая вопросы на точность и фактичность, сложные вопросы в профессиональной среде и новые тесты "Vibes", которые измеряют творческий интеллект. GPT 4.5 продемонстрировала превосходные результаты во всех категориях, особенно в тестах "Vibes", которые измеряют эмоциональный интеллект модели, ее способность к сотрудничеству и теплоту тона.
Обучение GPT 4.5
В этом разделе видео обсуждается процесс обучения GPT 4.5. Из-за огромного размера модели потребовалось масштабировать инфраструктуру пост-тренировки, так как соотношение между обучающими данными и размером модели значительно отличается на этапах предварительной и пост-тренировки. OpenAI разработала новый механизм обучения, который позволяет дообучать такую большую модель с использованием гораздо меньшего объема данных. Модель была дообучена в несколько итераций с использованием комбинации контролируемого обучения с подкреплением и обратной связи от человека.
Безопасность GPT 4.5
В этом разделе видео обсуждается безопасность GPT 4.5. OpenAI уделила большое внимание обеспечению безопасности модели перед ее выпуском, проведя тщательные оценки безопасности и готовности. Результаты этих оценок доступны в системной карте.
Масштабирование GPT 4.5
В этом разделе видео обсуждается процесс масштабирования GPT 4.5. OpenAI использовала все доступные вычислительные ресурсы для обучения модели, что потребовало разработки новых системных решений. Например, для максимальной оптимизации графических процессоров использовалось обучение с низкой точностью, а для использования большего объема вычислительных ресурсов, чем доступно в одном дата-центре, модель была обучена в нескольких дата-центрах одновременно.
Эволюция GPT
В этом разделе видео демонстрируется эволюция моделей GPT, начиная с GPT-1 и заканчивая GPT 4.5, на примере ответа на вопрос "Почему океан соленый?". Ответы моделей демонстрируют прогресс в понимании контекста, точности и способности к рассуждению. GPT 4.5 дает наиболее полный и интересный ответ, демонстрируя улучшенное понимание мира и способность к творческому выражению.
Результаты GPT 4.5
В этом разделе видео обсуждаются результаты GPT 4.5 на различных эталонных тестах. Модель демонстрирует значительное улучшение по сравнению с GPT-4 в традиционных тестах на понимание языка, особенно в тестах, требующих глубоких знаний о мире. Однако GPT 4.5 все еще отстает от моделей, способных к рассуждению, таких как OpenAI O3 mini, в тестах, требующих логического мышления.
Доступность GPT 4.5
В этом разделе видео обсуждается доступность GPT 4.5. Модель доступна для всех пользователей ChatGPT Pro через веб, мобильные и настольные приложения, а также через API. В ближайшие недели доступ к модели получат пользователи ChatGPT Plus, а затем пользователи образовательных и корпоративных аккаунтов.
Заключение
В заключении видео подчеркивается важность рассуждения как ключевой способности будущих моделей. Однако OpenAI также считает, что неконтролируемое обучение и рассуждение дополняют друг друга. Модели, такие как GPT 4.5, которые обладают более глубокими знаниями о мире и более развитым интеллектом, станут более прочной основой для будущих моделей, способных к рассуждению. OpenAI приглашает пользователей исследовать возможности неконтролируемого обучения вместе с ними и с нетерпением ждет новой эры интуитивного, знающего искусственного интеллекта и взаимодействия человека с ним.