Forklog
2025-01-21 09:50:07

OpenAI приблизилась к запуску ИИ-агента

Известный точными инсайдами о будущих ИИ-продуктах программист Тибор Блахо обнаружил доказательства существования агента OpenAI под кодовым названием «Оператор». Confirmed - the ChatGPT macOS desktop app has hidden options to define shortcuts for the desktop launcher to "Toggle Operator" and "Force Quit Operator" https://t.co/rSFobi4iPN pic.twitter.com/j19YSlexAS— Tibor Blaho (@btibor91) January 19, 2025 По его информации, в десктоп-версии ChatGPT на macOS есть скрытые функции для включения и выключения «Оператора». Аналогичную информацию предоставил пользователь X под ником M1. Блахо также обнаружил упоминание ИИ-агента на сайте OpenAI и его сравнение с решениями конкурентов.  OpenAI website already has references to Operator/OpenAI CUA (Computer Use Agent) - "Operator System Card Table", "Operator Research Eval Table" and "Operator Refusal Rate Table"Including comparison to Claude 3.5 Sonnet Computer use, Google Mariner, etc.(preview of tables… pic.twitter.com/OOBgC3ddkU— Tibor Blaho (@btibor91) January 20, 2025 Приведенные в таблице цифры говорят о том, что «Оператор» не совсем надежен в некоторых задачах.  В бенчмарке OSWorld, который имитирует реальную компьютерную среду, ИИ-агент от OpenAI набирает 38,1%. Показатель выше решения от Anthropic, но не дотягивает до набранных человеком 72,4%. В то же время «Оператор» превосходит человеческие показатели в WebVoyager, который оценивает способности искусственного интеллекта в навигации по веб-сайтам.  С задачей создать биткоин-кошелек нейросеть справилась в 10% случаев. Успех регистраций у облачного провайдера выше — в 60%.  Просочившиеся в сеть графики указывают на хорошие показатели ИИ-агента в области безопасности — он сопротивляется попыткам совершать «незаконные действия» и искать «чувствительные личные данные». Напомним, в ноябре стало известно о планах OpenAI запустить собственного ИИ-агента «Оператор».

Get Crypto Newsletter
Read the Disclaimer : All content provided herein our website, hyperlinked sites, associated applications, forums, blogs, social media accounts and other platforms (“Site”) is for your general information only, procured from third party sources. We make no warranties of any kind in relation to our content, including but not limited to accuracy and updatedness. No part of the content that we provide constitutes financial advice, legal advice or any other form of advice meant for your specific reliance for any purpose. Any use or reliance on our content is solely at your own risk and discretion. You should conduct your own research, review, analyse and verify our content before relying on them. Trading is a highly risky activity that can lead to major losses, please therefore consult your financial advisor before making any decision. No content on our Site is meant to be a solicitation or offer.