OpenAI представила модель Operator которая может работать за компьютером вместо пользователя

Кодик кратко объясняет суть статьи
OpenAI представила исследовательский ИИ-агент Operator, способный решать задачи в интернете по запросу пользователя: искать авиабилеты, подбирать товары, взаимодействовать с сайтами посредством ввода текста, кликов и прокрутки. Base Operator — модель Computer-Using Agent, объединяющая GPT-4o и методы взаимодействия с интерфейсом. Агент анализирует HTML-код страниц и имитирует действия мыши и клавиатуры без использования API. Operator способен самокорректироваться, передавать контроль пользователю при затруднениях и запрашивать разрешение на ввод личных данных. Инструмент доступен пока только подписчикам ChatGPT Pro в США ($200/мес.), позже планируется интеграция в тариф Plus.
Читайте в Telegram
|
OpenAI анонсировала исследовательскую версию ИИ-агента под названием Operator, который может выполнять задачи в интернете по запросу пользователя.
Он способен находить авиабилеты, подбирать товары и взаимодействовать с веб-страницами, используя ввод текста, клики и прокрутку. В основе Operator лежит модель Computer-Using Agent, объединяющая возможности GPT-4o и методов обучения с взаимодействием UI. Агент анализирует код веб-страниц и взаимодействует с их интерфейсами, имитируя действия виртуальной мыши и клавиатуры, что позволяет ему работать без интеграции через API.
Operator может самокорректироваться и передавать управление пользователю при возникновении сложностей. Также он запрашивает разрешение на ввод конфиденциальных данных, таких как пароли или отправка писем и отклоняет вредоносные запросы.
Инструмент пока доступен только в США для подписчиков ChatGPT Pro за $200 в месяц, но OpenAI планирует внедрить его в Plus-тариф через несколько недель.







