Краткое содержание
В этом видео обсуждается AlphaEvolve, агент от Google Deepmind, который может генерировать более качественные подсказки для разработки улучшенного кода. Рассматриваются ограничения AlphaEvolve, её достижения, такие как обнаружение тензорного разложения для умножения матриц и улучшение оптимизации центра обработки данных Google, а также будущие улучшения, включая расширение эволюционной базы данных и интеграцию с Gemini 3. Подчёркивается, что AlphaEvolve не является признаком скорого технологического взрыва из-за ограничений в автоматизированной оценке задач.
- AlphaEvolve - это кодирующий агент, улучшающий код на основе оценочных показателей.
- Он уже привел к реальному повышению эффективности работы центра обработки данных Google и математическим прорывам.
- Основным ограничением Alpha Evolve является то, что он обрабатывает проблемы, для которых можно разработать и представить автоматизированный оценщик.
Введение
Введение посвящено инструментам ИИ, помогающим улучшать другие ИИ, в частности, AlphaEvolve от Google Deepmind. AlphaEvolve генерирует более качественные подсказки для разработки улучшенного кода, что приводит к повышению эффективности. Отмечается, что, хотя AlphaEvolve не является признаком скорого технологического взрыва, она демонстрирует, что языковые модели (LM) ещё не достигли своего предела и только начинают раскрывать свой потенциал.
AlphaEvolve
AlphaEvolve - это система, которая принимает проблему, код и оценочные показатели от человека, а затем использует Gemini 2 для генерации идей и предложений по улучшению кода. Система сохраняет и выбирает лучшие подсказки и языковые модели на основе метрик успешности. AlphaEvolve улучшает код, представленный человеком, в соответствии с оценочными показателями, и в 75% случаев соответствует последнему слову техники в поставленных задачах, а в 20% случаев превосходит его.
Ограничения
Основным ограничением AlphaEvolve является то, что она обрабатывает проблемы, для которых можно разработать и представить автоматизированный оценщик. Это справедливо для многих задач в математических и вычислительных науках, но не для всех областей, таких как естественные науки, где не все эксперименты можно смоделировать или автоматизировать. Несмотря на это, AlphaEvolve может помочь ученым оценить новые научные эксперименты и стать лучшим научным соавтором.
Достижения
AlphaEvolve достигла значительных успехов, включая обнаружение тензорного разложения ранга 48 для умножения комплексных матриц 4x4, что является улучшением 50-летнего рекорда. Это позволяет значительно ускорить вычисления для очень больших матриц, необходимых для различных вычислений и операций ИИ. Кроме того, AlphaEvolve помогла улучшить оптимизацию центра обработки данных Google (Борг), что позволило восстановить 0,7% мировых вычислительных ресурсов. AlphaEvolve также усовершенствовала следующее поколение чипов Google — TPU Ironwood, сократив время обучения Gemini на 1%.
Будущие улучшения
В будущем AlphaEvolve может быть улучшена за счет расширения эволюционной базы данных, в которой хранятся решения и их оценки для задач. Эта база данных может стать огромной библиотекой знаний для будущих моделей. Кроме того, AlphaEvolve не зависит от модели, поэтому по мере совершенствования оборудования и извлечения знаний из процесса можно будет создать лучшую версию Gemini 3, что, в свою очередь, позволит создать более качественную версию LLM в AlphaEvolve. Авторы также предвидят, что ценность создания большего количества сред и надежных функций оценки станет более широко признанной, что приведет к более ценным практическим открытиям.
Странности
Несмотря на передовые возможности AlphaEvolve, она все еще использует подсказки, чтобы действовать как экспертный разработчик программного обеспечения и итеративно улучшать кодовую базу. AlphaEvolve пока не может создать саму себя с нуля, хотя может улучшать свои отдельные части. Подчеркивается, что направление итерации и поиска является еще одним способом использования вычислительных ресурсов.
Заключительные мысли
В заключение отмечается, что Google имеет значительные шансы вырваться вперед в области ИИ, так как компания работает над AGI и самосовершенствованием дольше других лабораторий и обладает большими ресурсами. Google прошла путь от "смехотворно плохого" Bard до Gemini 2.5, который, по крайней мере, находится на одном уровне с GPT4. Подчеркивается важность надежных функций оценки и стимулов для их создания, учитывая наличие системы для оптимизации по ним.