Forklog
2025-01-21 09:50:07

OpenAI приблизилась к запуску ИИ-агента

Известный точными инсайдами о будущих ИИ-продуктах программист Тибор Блахо обнаружил доказательства существования агента OpenAI под кодовым названием «Оператор». Confirmed - the ChatGPT macOS desktop app has hidden options to define shortcuts for the desktop launcher to "Toggle Operator" and "Force Quit Operator" https://t.co/rSFobi4iPN pic.twitter.com/j19YSlexAS— Tibor Blaho (@btibor91) January 19, 2025 По его информации, в десктоп-версии ChatGPT на macOS есть скрытые функции для включения и выключения «Оператора». Аналогичную информацию предоставил пользователь X под ником M1. Блахо также обнаружил упоминание ИИ-агента на сайте OpenAI и его сравнение с решениями конкурентов.  OpenAI website already has references to Operator/OpenAI CUA (Computer Use Agent) - "Operator System Card Table", "Operator Research Eval Table" and "Operator Refusal Rate Table"Including comparison to Claude 3.5 Sonnet Computer use, Google Mariner, etc.(preview of tables… pic.twitter.com/OOBgC3ddkU— Tibor Blaho (@btibor91) January 20, 2025 Приведенные в таблице цифры говорят о том, что «Оператор» не совсем надежен в некоторых задачах.  В бенчмарке OSWorld, который имитирует реальную компьютерную среду, ИИ-агент от OpenAI набирает 38,1%. Показатель выше решения от Anthropic, но не дотягивает до набранных человеком 72,4%. В то же время «Оператор» превосходит человеческие показатели в WebVoyager, который оценивает способности искусственного интеллекта в навигации по веб-сайтам.  С задачей создать биткоин-кошелек нейросеть справилась в 10% случаев. Успех регистраций у облачного провайдера выше — в 60%.  Просочившиеся в сеть графики указывают на хорошие показатели ИИ-агента в области безопасности — он сопротивляется попыткам совершать «незаконные действия» и искать «чувствительные личные данные». Напомним, в ноябре стало известно о планах OpenAI запустить собственного ИИ-агента «Оператор».

Получите Информационный бюллетень Crypto
Прочтите Отказ от ответственности : Весь контент, представленный на нашем сайте, гиперссылки, связанные приложения, форумы, блоги, учетные записи социальных сетей и другие платформы («Сайт») предназначен только для вашей общей информации, приобретенной у сторонних источников. Мы не предоставляем никаких гарантий в отношении нашего контента, включая, но не ограничиваясь, точность и обновление. Никакая часть содержания, которое мы предоставляем, представляет собой финансовый совет, юридическую консультацию или любую другую форму совета, предназначенную для вашей конкретной опоры для любых целей. Любое использование или доверие к нашему контенту осуществляется исключительно на свой страх и риск. Вы должны провести собственное исследование, просмотреть, проанализировать и проверить наш контент, прежде чем полагаться на них. Торговля - очень рискованная деятельность, которая может привести к серьезным потерям, поэтому проконсультируйтесь с вашим финансовым консультантом, прежде чем принимать какие-либо решения. Никакое содержание на нашем Сайте не предназначено для запроса или предложения