Искусственный интеллект, безусловно, самая популярная тема этого года. Прямо сейчас он уже меняет привычный нам мир, помогая людям в выполнении как повседневных бытовых задач, так и сложных научных расчётов.
Одна из ключевых областей, где ИИ демонстрирует свой потенциал, – это нейросети, виртуальные модели, имитирующие работу человеческого мозга. И в этой статье мы собрали подборку из нескольких крутых сервисов на основе нейросетей, которые могут упростить вашу работу в той или иной области.
Сразу хочу отметить, что в данной подборке мы не будем говорить о мастодонтах рынка вроде ChatGPT, Midjourney, Stable Diffusion и т.д. Мы рассмотрим менее масштабные и известные, но также заслуживающие внимание сервисы.
Perplexity: GPT-3.5 с цитированием
Одним из главных недостатков ChatGPT является отсутствие внешних ссылок на источники информации. И хотя OpenAI обещает внедрить для платных подписчиков такую возможность, Perplexity решает эту проблему уже сейчас, бесплатно.
Perplexity — это чат-бот, выполняющий функции ИИ-поисковика, разработанный на базе языковой модели GPT-3.5 и предоставляющий точные и актуальные ответы на запросы пользователей. Главная особенность сервиса заключается в том, что он использует цитирование и внешние ссылки в ответах, позволяя пользователям самим углубиться в тематику запроса и проверить бота на достоверность информации.
Благодаря этой особенности Perplexity применим во многих сферах — от профессионального использования для поиска качественных источников, так и просто для лучшего поиска в Интернете.
Пользоваться сервисом просто — он работает онлайн, не требует регистрации и полностью бесплатен. Кроме того, доступно расширение Perplexity – Ask AI для браузеров, которое можно быстро и легко интегрировать в браузеры на движке Chromium.
ChatPDF: диалог с документом
ChatPDF — удобный инструмент для студентов и не только, который значительно упростит поиск информации в конкретном документе, учебнике, книге.
Сервис позволяет загрузить PDF-документ и задавать нейросети вопросы по нему. ChatPDF поддерживает любой язык документа, при этом сам может отвечать на любом предпочтительном языке для пользователя. Например, можно загрузить документ на английском языке, а ответы из него получать уже на русском.
Сервис бесплатен и доступен без регистрации, но с ограничениями – 3 документа в день, объёмом до 120 страниц каждый, 10 MB максимальный размер файла и 50 вопрос в день. С платной подпиской в $5 эти ограничения снимаются.
Gamma: презентации в один клик
Gamma — веб-приложение, способное создавать презентации за секунды. С его помощью вы можете легко генерировать документы, презентации и веб-страницы, используя мощный ИИ-генератор, который затем позволяет вам дорабатывать и настраивать полученный результат.
Этот сервис подходит как для новичков, так и для опытных пользователей, предлагая удобные инструменты для создания ярких и эффективных проектов, включая текст, изображения. Для создания презентации достаточно написать её тему, затем ИИ сам предложит содержание для документа, при желании пользователь может отредактировать темы в содержании на необходимые ему.
Для работы в Gamma нужно создать аккаунт и свое рабочее пространство, где будут храниться все ваши проекты и презентации. Также доступны готовые примеры, которые помогут вам быстрее и легче начать работу.
Сервис может генерировать работы на любом языке, включая русский, но лучше справляется с этой задачей всё же на английском. Пока что Gamma полностью бесплатен, но с ограничением на количество генераций. В будущем разработчики планируют внедрить платный тарифный план.
Графический редактор Gyre
Gyre — бесплатный редактор изображений с открытым кодом, способный внедрять мощь ИИ-искусства в ваши фотографии. Он обладает широким спектром возможностей, которые за счёт использования базы Stable Diffusion и прочих обученных моделей превосходят популярный Photoshop в некоторых задачах.
Ключевая особенность Gyre – возможность значительно менять структуру изображения в один клик на основе текстовых промтов. Например, за счёт популярной ИИ-модели ControlNet редактор может легко удалять фон с объекта и одним кликом менять стиль картинки, сохраняя главный объект. Коротко возможности программы продемонстрированы в видео ниже.
Однако важно отметить, что для установки Gyre требуется мощный компьютер и желательно немного навыков программирования. Если ранее вы имели опыт работы со Stable Diffusion, то вам будет проще – здесь всё работает аналогично.
- Для работы потребуется компьютер с видеокартой NVIDIA с количеством видеопамяти 4GB+. (либо установить программу на мощный сервер, например Google Colab).
- Необходимо установить Cuda.
- Скачать сам установщик по этой ссылке.
- Распаковать его и запустить install_or_update.cmd.
- Дождаться завершения установки и запустить run.cmd.
- Для установки нужно около 30 гигабайт свободного места на системном диске.
GFP-GAN: восстановление старых фотографий
GFP-GAN — бесплатная нейросеть для восстановления старых некачественных фотографий.
Инструмент был разработан исследователями из китайской компании Tencent и в отличие от своих аналогов, GFP-GAN использует информацию из двух моделей искусственного интеллекта, одна – делает акцент на сохранении «идентичности» людей на фотографиях, с особым акцентом на чертах лица. А другая улучшает сами фотографии.
Такой подход позволяет GFP-GAN достигать впечатляющих результатов, в то время как классические методы апскейлинга часто приводят к неудовлетворительным результатам, теряя черты лица людей.
Итогом является значительное улучшение качества старых или низкокачественных фотографий, сохраняя при этом лицевые детали.
Нейросеть можно запустить локально на компьютере или воспользоваться веб-приложением от сообщества Hugging Face.
Suno AI Bark: синтез текста и не только
Bark — модель трансформации текста в аудио, созданная компанией Suno AI. Модель способна генерировать реалистичную речь на множестве языков, включая русский, множеством голосов.
Кроме того она способна создавать другие аудиофрагменты – от музыки и фонового шума до простых звуковых эффектов. Также она способна воспроизводить невербальные звуки, такие как смех, вздохи и плач.
Запускается локально на компьютере, инструкцию можно найти на GitHub. Протестировать также можно через веб-приложение от сообщества Hugging Face.
Lalal.ai: создание инструментала, обработка звука
Lalal.ai — онлайн-сервис для разделения дорожек вокала и музыки. Вырезать вокал из песни можно в один клик, а сам процесс занимает всего несколько минут.
Система Lalal.ai использует свою нейросеть для анализа трека и извлечения информации об отдельных инструментах и партиях. База данных сервиса включает огромное количество студийных звукозаписей высокого качества, используемых для тренировки ИИ, что позволяет системе работать с минимальными ошибками.
Помимо разделения вокала и самой музыки сервис также может вытаскивать из трека определённые звуки — например, гитару, пианино и другое. Также сервис предоставляет возможность очистки аудиозаписей от шумов, основанный на сложных алгоритмах искусственного интеллекта.
Для бесплатного использования доступна только обработка 10 минут – за последующие нужно платить. Обработанный звук на бесплатном тарифе также нельзя перематывать или скачать.
SteosVoice синтез речи
SteosVoice — ИИ-платформа с российскими корнями, предназначенная для преобразования текста в аудиофайлы. Имеет обширную библиотеку, где пользователи могут выбрать из более чем 100 уникальных голосов, говорящих на русском и английском языках.
Главная особенность SteosVoice — наличие множества узнаваемых голосов, в частности, есть голоса героев популярных видеоигр, таких как Warcraft III, Ведьмак 3, Overwatch, Dota 2, Valorant и другие. Сервис доступен бесплатно, но с ограничениями по количеству синтезируемых символов в день. Помимо сайта, доступен бесплатный Telegram-бот.
Если вы знаете какие-либо ещё интересные проекты на основе ИИ, то не стесняйтесь поделиться ими в комментариях. Лучшие из них включим в следующую подборку.
Читать первым в Telegram-канале «Код Дурова»