12 декабря 2024

eur = 106.20 1.10 (1.05 %)

btc = 100 272.00$ 1 933.39 (1.97 %)

eth = 3 921.52$ 204.25 (5.49 %)

ton = 6.34$ 0.25 (4.17 %)

usd = 100.03 0.66 (0.66 %)

eur = 106.20 1.10 (1.05 %)

btc = 100 272.00$ 1 933.39 (1.97 %)

Форум

В России разработали первую мультимодальную модель ИИ

1 минута на чтение
В России разработали первую мультимодальную модель ИИ

Институт AIRI представил открытую мультимодальную языковую модель OmniFusion 1.1, первую в России, способную вести визуальный диалог и отвечать на вопросы, основываясь на изображениях, с поддержкой русского языка.

Открытый доступ к коду и весам модели позволяет использовать её для разработки как общедоступных, так и коммерческих продуктов.

OmniFusion умеет распознавать и описывать изображения, предоставляя возможность объяснить содержимое фотографии, анализировать карты помещений, распознавать текст и решать задачи, представлять формулы в LaTeX и многое другое.

Применение OmniFusion охватывает широкий спектр задач, от анализа медицинских изображений до решения логических задач. Модель уже сейчас может указывать на проблемы на медицинских изображениях, хотя для более точной диагностики требуется дополнительное обучение с участием медицинских экспертов.

На международном рынке представлены аналоги OmniFusion, в том числе LLaVA, Gemini, GPT4-Vision и другие, некоторые из которых являются закрытыми и платными. Однако OmniFusion выделяется своей открытостью, предоставляя доступ к исходному коду на GitHub, что делает её доступной для широкой аудитории разработчиков.

Модель основана на комбинации предварительно обученной большой языковой модели и визуальных энкодеров, кодирующих визуальную информацию в числовые векторы. Разработка ведется научной группой FusionBrain Института AIRI с участием специалистов из Sber AI и SberDevices.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
83432ca7-0523-478d-8f84-792bfbeea9cb-изображение-0

GigaChat Max: коротко о главном

Слух дня: Valve может анонсировать Half-Life 3 уже этой ночью

Полная версия 
e31f11b5-b855-441b-a31d-e3b4837fff93-изображение-05b6f6124-09ae-4a45-aa11-1d8d9ce0f1f4-изображение-183cbf5e5-43d0-4c56-9b14-4edc0429b4a5-изображение-2

GigaChat Max: коротко о главном

Яндекс презентовал YaC 2024: новые технологии, смарт-функции и практические лайфхаки

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Новости
Карьера
Блоги 300
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131