15 декабря 2024

eur = 110.48 1.92 (1.77 %)

btc = 101 894.00$ 86.56 (0.09 %)

eth = 3 884.52$ -26.71 (-0.68 %)

ton = 6.27$ -0.06 (-0.94 %)

usd = 103.95 0.68 (0.66 %)

eur = 110.48 1.92 (1.77 %)

btc = 101 894.00$ 86.56 (0.09 %)

Форум

Разработчики ВКонтакте создали нейросеть для генерации новостных заголовков

2 минуты на чтение
Разработчики ВКонтакте создали нейросеть для генерации новостных заголовков

Команда прикладных исследований ВКонтакте разработала нейросеть, которая создаёт новостные заголовки на русском и английском языках. Об этом «Коду Дурова» сообщили в пресс-службе ВКонтакте.

Для обучения нейросети разработчики ВКонтакте использовали тексты информационного агентства «РИА Новости» и издания The New York Times. Чтобы сгенерировать заголовок, нужен только текст новости. Алгоритмы обрабатывают текст и формулируют заголовок из фрагментов слов новости — это позволяет нейросети в ходе генерации заголовка добиваться правильных падежей и склонений.

«РИА Новости»: «Роскосмос» проследит за защитой МКС от космического мусора

Разработчик-исследователь ВКонтакте Даниил Гаврилов заявил, что такая технология может использоваться для различных задач, связанных с удобством потребления контента:

Наша и другие разработки помогут быстро выделять главную мысль из длинных текстов — это действительно полезно, ведь информации вокруг нас уже много и становится только больше. Например, ВКонтакте [эту технологию] потенциально можно применить для умного сокращения постов в ленте пользователя или для создания новостных дайджестов.

Отмечается, что по некоторым показателям нейросеть ВКонтакте показывает себя лучше, чем другие существующие подходы генерации заголовков. Результат работы моделей определяется метриками, оценивающими, насколько сгенерированный заголовок пересекается с оригинальным, который был написан человеком.

«РИА Новости»: «Мстители. Финал» побили мировой рекорд по кассовым сборам

Как сообщают ВКонтакте, стандартные метрики не могут корректно оценивать случаи, когда смысл новости в сгенерированных и оригинальных заголовках передан верно, но по строению полностью отличаются друг от друга. Именно поэтому разработчики провели исследование, в ходе которого показывали добровольцам новость и два заголовка к ней: в 45% случаев сгенерированный заголовок был не хуже оригинального, а в 15% — лучше:

Исследование с добровольцами показало, что заголовки, созданные нейросетью, пока не всегда получаются такими же качественными, как написанные человеком. Однако мы не перестаём улучшать модель — и непременно добьёмся равных результатов. Наша и другие разработки помогут быстро выделять главную мысль из длинных текстов — это действительно полезно, ведь информации вокруг нас уже много и становится только больше, — считает Гаврилов.

Для создания нейросети Команда прикладных исследований ВКонтакте использовала архитектуру Universal Transformer и технику компрессии данных Byte Pair Encoding, которые обычно применяются в машинном переводе и позволяют для генерации заголовков ограничиваться небольшим словарём:

Сотрудники ВКонтакте — первые, кто использовал BPE для модели суммаризации текста, а также первые, кто обучал такую модель на русскоязычных новостных материалах, — уверяют в компании.

Презентация работы нейросети состоялась на Европейской конференции по информационному поиску, которая прошла в этом году 14-18 апреля в Кёльне. Подробная статья по поводу технологии была опубликована в соответствующем сборнике.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
bfc5e6c3-5e3c-41ec-bbe7-97cb39296225-изображение-0caa5f53d-c148-46f9-be3b-795f7a443ddf-изображение-1

GigaChat Max: коротко о главном

Какие самые популярные слова искали в Яндексе в 2024 году

Полная версия 
973c20aa-79d4-4842-97cf-4fc2ae0ff6bb-изображение-0

GigaChat Max: коротко о главном

Бывший исследователь OpenAI, который обвинил компанию в нарушении авторских прав, был найден мёртвым в своей квартире

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 301
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131