13 декабря 2024

eur = 108.56 2.36 (2.22 %)

btc = 99 807.00$ - 830.23 (-0.82 %)

eth = 3 867.01$ 48.67 (1.27 %)

ton = 6.30$ -0.13 (-2.07 %)

usd = 103.27 3.24 (3.24 %)

eur = 108.56 2.36 (2.22 %)

btc = 99 807.00$ - 830.23 (-0.82 %)

Форум

8 интересных сервисов на основе нейросетей

5 минут на чтение
8 интересных сервисов на основе нейросетей

Искусственный интеллект, безусловно, самая популярная тема этого года. Прямо сейчас он уже меняет привычный нам мир, помогая людям в выполнении как повседневных бытовых задач, так и сложных научных расчётов.

Одна из ключевых областей, где ИИ демонстрирует свой потенциал, – это нейросети, виртуальные модели, имитирующие работу человеческого мозга. И в этой статье мы собрали подборку из нескольких крутых сервисов на основе нейросетей, которые могут упростить вашу работу в той или иной области.

Сразу хочу отметить, что в данной подборке мы не будем говорить о мастодонтах рынка вроде ChatGPT, Midjourney, Stable Diffusion и т.д. Мы рассмотрим менее масштабные и известные, но также заслуживающие внимание сервисы.


Perplexity: GPT-3.5 с цитированием

Одним из главных недостатков ChatGPT является отсутствие внешних ссылок на источники информации. И хотя OpenAI обещает внедрить для платных подписчиков такую возможность, Perplexity решает эту проблему уже сейчас, бесплатно.

Perplexity — это чат-бот, выполняющий функции ИИ-поисковика, разработанный на базе языковой модели GPT-3.5 и предоставляющий точные и актуальные ответы на запросы пользователей. Главная особенность сервиса заключается в том, что он использует цитирование и внешние ссылки в ответах, позволяя пользователям самим углубиться в тематику запроса и проверить бота на достоверность информации.

Благодаря этой особенности Perplexity применим во многих сферах — от профессионального использования для поиска качественных источников, так и просто для лучшего поиска в Интернете.

Пользоваться сервисом просто — он работает онлайн, не требует регистрации и полностью бесплатен. Кроме того, доступно расширение Perplexity – Ask AI для браузеров, которое можно быстро и легко интегрировать в браузеры на движке Chromium.

ChatPDF: диалог с документом

ChatPDF — удобный инструмент для студентов и не только, который значительно упростит поиск информации в конкретном документе, учебнике, книге.

Сервис позволяет загрузить PDF-документ и задавать нейросети вопросы по нему. ChatPDF поддерживает любой язык документа, при этом сам может отвечать на любом предпочтительном языке для пользователя. Например, можно загрузить документ на английском языке, а ответы из него получать уже на русском.

Сервис бесплатен и доступен без регистрации, но с ограничениями – 3 документа в день, объёмом до 120 страниц каждый, 10 MB максимальный размер файла и 50 вопрос в день. С платной подпиской в $5 эти ограничения снимаются.

Gamma: презентации в один клик

Gamma — веб-приложение, способное создавать презентации за секунды. С его помощью вы можете легко генерировать документы, презентации и веб-страницы, используя мощный ИИ-генератор, который затем позволяет вам дорабатывать и настраивать полученный результат.

Этот сервис подходит как для новичков, так и для опытных пользователей, предлагая удобные инструменты для создания ярких и эффективных проектов, включая текст, изображения. Для создания презентации достаточно написать её тему, затем ИИ сам предложит содержание для документа, при желании пользователь может отредактировать темы в содержании на необходимые ему.

Для работы в Gamma нужно создать аккаунт и свое рабочее пространство, где будут храниться все ваши проекты и презентации. Также доступны готовые примеры, которые помогут вам быстрее и легче начать работу.

Сервис может генерировать работы на любом языке, включая русский, но лучше справляется с этой задачей всё же на английском. Пока что Gamma полностью бесплатен, но с ограничением на количество генераций. В будущем разработчики планируют внедрить платный тарифный план.

Графический редактор Gyre

Gyre — бесплатный редактор изображений с открытым кодом, способный внедрять мощь ИИ-искусства в ваши фотографии. Он обладает широким спектром возможностей, которые за счёт использования базы Stable Diffusion и прочих обученных моделей превосходят популярный Photoshop в некоторых задачах.

Ключевая особенность Gyre – возможность значительно менять структуру изображения в один клик на основе текстовых промтов. Например, за счёт популярной ИИ-модели ControlNet редактор может легко удалять фон с объекта и одним кликом менять стиль картинки, сохраняя главный объект. Коротко возможности программы продемонстрированы в видео ниже.

Однако важно отметить, что для установки Gyre требуется мощный компьютер и желательно немного навыков программирования. Если ранее вы имели опыт работы со Stable Diffusion, то вам будет проще – здесь всё работает аналогично.

  • Для работы потребуется компьютер с видеокартой NVIDIA с количеством видеопамяти 4GB+. (либо установить программу на мощный сервер, например Google Colab).
  • Необходимо установить Cuda.
  • Скачать сам установщик по этой ссылке.
  • Распаковать его и запустить install_or_update.cmd.
  • Дождаться завершения установки и запустить run.cmd.
  • Для установки нужно около 30 гигабайт свободного места на системном диске.

GFP-GAN: восстановление старых фотографий

GFP-GAN — бесплатная нейросеть для восстановления старых некачественных фотографий.

Инструмент был разработан исследователями из китайской компании Tencent и в отличие от своих аналогов, GFP-GAN использует информацию из двух моделей искусственного интеллекта, одна – делает акцент на сохранении «идентичности» людей на фотографиях, с особым акцентом на чертах лица. А другая улучшает сами фотографии.

Такой подход позволяет GFP-GAN достигать впечатляющих результатов, в то время как классические методы апскейлинга часто приводят к неудовлетворительным результатам, теряя черты лица людей.

Итогом является значительное улучшение качества старых или низкокачественных фотографий, сохраняя при этом лицевые детали.

Нейросеть можно запустить локально на компьютере или воспользоваться веб-приложением от сообщества Hugging Face.

Suno AI Bark: синтез текста и не только

Bark — модель трансформации текста в аудио, созданная компанией Suno AI. Модель способна генерировать реалистичную речь на множестве языков, включая русский, множеством голосов.

Кроме того она способна создавать другие аудиофрагменты – от музыки и фонового шума до простых звуковых эффектов. Также она способна воспроизводить невербальные звуки, такие как смех, вздохи и плач.

Запускается локально на компьютере, инструкцию можно найти на GitHub. Протестировать также можно через веб-приложение от сообщества Hugging Face.

Lalal.ai: создание инструментала, обработка звука

Lalal.ai — онлайн-сервис для разделения дорожек вокала и музыки. Вырезать вокал из песни мож­но в один клик, а сам про­цесс занима­ет всего нес­коль­ко минут.

Система Lalal.ai использует свою нейросеть для анализа трека и извлечения информации об отдельных инструментах и партиях. База данных сервиса включает огромное количество студийных звукозаписей высокого качества, используемых для тренировки ИИ, что позволяет системе работать с минимальными ошибками.

Помимо разделения вокала и самой музыки сервис также может вытаскивать из трека определённые звуки — например, гитару, пианино и другое. Также сервис предоставляет возможность очистки аудиозаписей от шумов, основанный на сложных алгоритмах искусственного интеллекта.

Для бесплатного использования доступна только обработка 10 минут – за последующие нужно платить. Обработанный звук на бесплатном тарифе также нельзя перематывать или скачать.

SteosVoice синтез речи

SteosVoice — ИИ-платформа с российскими корнями, предназначенная для преобразования текста в аудиофайлы. Имеет обширную библиотеку, где пользователи могут выбрать из более чем 100 уникальных голосов, говорящих на русском и английском языках.

Главная особенность SteosVoice — наличие множества узнаваемых голосов, в частности, есть голоса героев популярных видеоигр, таких как Warcraft III, Ведьмак 3, Overwatch, Dota 2, Valorant и другие. Сервис доступен бесплатно, но с ограничениями по количеству синтезируемых символов в день. Помимо сайта, доступен бесплатный Telegram-бот.


Если вы знаете какие-либо ещё интересные проекты на основе ИИ, то не стесняйтесь поделиться ими в комментариях. Лучшие из них включим в следующую подборку.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
1c590b60-84bf-4be6-b17f-318e45ddb7f5-изображение-0

GigaChat Max: коротко о главном

В России не собираются запрещать Steam

Полная версия 
51e2c050-017e-414f-9f1e-65386bddad87-изображение-06c29907c-530a-4ff7-9d8e-7496bf2b671b-изображение-1

GigaChat Max: коротко о главном

iPhone 17 Slim действительно получит дизайн, похожий на Google Pixel 9

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 301
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131