4 июня 2026

eur = 85.12 0.51 (0.61 %)

btc = 65 959.00$ -1 545.49 (-2.29 %)

eth = 1 828.85$ -94.85 (-4.93 %)

ton = 2.01$ 0.04 (1.85 %)

usd = 73.34 0.78 (1.08 %)

eur = 85.12 0.51 (0.61 %)

btc = 65 959.00$ -1 545.49 (-2.29 %)

Google выпустила открытую ИИ-модель Gemma 4 12B, которая работает на обычном ноутбуке

1 минута на чтение
Google выпустила открытую ИИ-модель Gemma 4 12B, которая работает на обычном ноутбуке

Кодик кратко объясняет суть статьи

Google представила Gemma 4 12B — открытую мультимодальную модель ИИ на 12 млрд параметров, предназначенную для запуска на локальных устройствах с 16 ГБ памяти без подключения к облаку. Модель занимает промежуточное положение между лёгкой E4B и мощной 26B версией. Её ключевая особенность — отказ от отдельных энкодеров для изображений и звука: данные напрямую преобразуются в текстовое пространство с помощью компактных модулей, что снижает задержку и требования к памяти. Gemma 4 12B поддерживает нативную обработку звука, распознавание речи, различение говорящих и анализ видео, а также работает с контекстным окном до 256 тыс. токенов, поддерживает «размышление» перед ответом и вызов внешних функций. Модель показывает результаты, близкие к более крупной 26B, и доступна по лицензии Apache 2.0 на платформах Hugging Face, Kaggle, Ollama, LM Studio и Google AI Edge. Более 150 млн загрузок моделей Gemma 4 подчёркивают востребованность локального ИИ с высокой конфиденциальностью, что особенно важно для медицины, финансов и корпоративных данных.

Читайте в Telegram

|

Google представила Gemma 4 12B — открытую мультимодальную модель искусственного интеллекта на 12 млрд параметров.

Как сообщается в блоге компании, главная особенность модели в том, что она рассчитана на запуск прямо на пользовательском устройстве — ноутбуке с 16 ГБ оперативной или унифицированной памяти, без обращения к облаку. Модель занимает промежуточное положение в линейке Gemma 4: между облегчённой версией E4B и более мощной 26B на архитектуре «смеси экспертов» (Mixture of Experts).

Google выпустила открытую ИИ-модель Gemma 4 12B, которая работает на обычном ноутбуке

Ключевое техническое отличие Gemma 4 12B — отказ от отдельных модулей-энкодеров для обработки изображений и звука. В обычных мультимодальных моделях такие данные сначала переводит в понятный нейросети вид отдельный кодировщик, и лишь потом они попадают в основную модель. Здесь изображения и звук подаются напрямую в языковую модель: для картинок используется компактный модуль встраивания, а необработанный звуковой сигнал проецируется в то же пространство, что и текст. Это снижает задержку, требования к памяти и упрощает работу с разными типами данных.

При компактном размере модель показывает результаты, близкие к вдвое более крупной 26B, — например, 77,2 % в тесте MMLU Pro и 78,8 % в GPQA Diamond. Это первая средняя модель в семействе Gemma с нативной поддержкой звука: она распознаёт речь, различает говорящих и разбирает видео — в одной из демонстраций модель проанализировала пятиминутный отрывок презентации с конференции Google I/O. Gemma 4 12B также поддерживает контекстное окно в 256 тыс. токенов, режим пошагового «размышления» перед ответом и вызов внешних функций, что важно для построения ИИ-агентов.

Модель распространяется по открытой лицензии Apache 2.0 и доступна на популярных платформах — Hugging Face, Kaggle, Ollama, LM Studio и Google AI Edge. По данным Google, модели семейства Gemma 4 в сумме скачали уже более 150 млн раз. Главный практический смысл релиза — возможность запускать продвинутый ИИ с обработкой текста, изображений, звука и видео локально, без отправки данных в облако. Это особенно важно для сценариев, где конфиденциальность критична: в медицине, финансах и работе с внутренними документами компаний.

Теги:
Материал обновлен|
Обсудить
Блоги 593
ЦНИС
OTP Bank
Softline
ВКонтакте
ВТБ
билайн
Слетать.ру
Т-Банк
Газпромбанк
МТС

Привет, это Кодик! Я создан, чтобы помогать вам с  разными задачами. Задайте мне вопрос…