Яндекс выпустил Alice AI LLM Flash — лёгкую модель для бизнеса, в пять раз дешевле флагманской

Новая модель оптимизирована под массовые однотипные задачи — диалоги, модерацию контента, классификацию обращений. По заявлениям компании, в 56 % случаев она опережает по качеству GPT-5.4 mini.

Яндекс представил новую языковую модель Alice AI LLM Flash — более лёгкую и быструю версию своей флагманской Alice AI LLM, которую компания открыла для бизнеса в ноябре 2025 года. Модель уже доступна корпоративным клиентам через платформу Yandex AI Studio. Главное отличие — Flash рассчитана на работу с большими потоками однотипных задач, где критичны скорость отклика и стоимость, а не глубина рассуждений.

По заявлению Яндекса, Alice AI LLM Flash работает почти в пять раз дешевле флагманской версии и оптимизирована под наиболее массовые корпоративные сценарии — работу с текстами и документами, на которые приходится около 60 % всех b2b-запросов к моделям компании. Среди типичных задач — модерация пользовательского контента, классификация обращений в техподдержку и ведение диалога с клиентом. Целевая аудитория — банки, ритейлеры, операторы связи и другие компании с большим объёмом однотипных операций.

По внутренним замерам Яндекса, в 56 % случаев Flash превосходит по качеству решения бизнес-задач западный аналог GPT-5.4 mini, в диалоговых сценариях разрыв ещё больше — 73 % в пользу российской модели, в задачах структурирования текста — 66 %, в поиске данных по файлам и базам знаний — 61 %. Важно учитывать, что речь идёт о сравнительных данных самого Яндекса; независимых публичных бенчмарков, подтверждающих эти цифры, на момент анонса нет.

Параллельно с собственной разработкой Yandex AI Studio открыл доступ к опенсорсной модели DeepSeek V4 Flash — по словам компании, это первая в России доступная в облаке модель с контекстным окном в 1 млн токенов. Она ориентирована на разработку корпоративных ИИ-агентов, анализ объёмных документов и решение сложных многоэтапных задач. По сравнению с предыдущей версией, DeepSeek V3.2, новая модель в полтора раза дешевле.