Anthropic выпустила новую версию ИИ-агента Claude Sonnet 3.5, который способен автоматизировать работу на компьютере через API Computer Use. Эта модель может эмулировать действия пользователя: нажимать клавиши, кликать мышью и взаимодействовать с различными десктопными приложениями. Работая с доступом к экрану, Claude анализирует скриншоты и точно перемещает курсор, позволяя выполнять широкий спектр офисных задач. Такие возможности могут серьёзно ускорить процессы и автоматизировать рутинные операции, тем самым повысив эффективность работы с программным обеспечением.

Несмотря на то, что подобные ИИ-агенты уже существуют на рынке, включая разработки Microsoft, OpenAI и стартапов вроде Adept и Rabbit, Anthropic утверждает, что Claude 3.5 Sonnet отличается от конкурентов высокой надёжностью и улучшенной производительностью при выполнении сложных задач, таких как программирование. В отличие от многих аналогов, эта модель может самостоятельно справляться с многозадачностью и корректировать свои действия в случае возникновения ошибок. Это даёт ей значительное преимущество в сложных сценариях, требующих последовательного выполнения большого числа шагов.

Тем не менее, не обошлось и без трудностей. Claude 3.5 Sonnet пока сталкивается с проблемами при выполнении простых действий, таких как прокрутка страницы или масштабирование интерфейса. В ходе тестирования, например, при бронировании авиабилетов модель успешно завершила лишь около половины задач, а при возврате билетов точность была ещё ниже — примерно 70%.

Проблемы безопасности также остаются важной темой. Эксперты опасаются, что модели с доступом к ПК могут использоваться злоумышленниками для проведения вредоносных операций, таких как кража личных данных или взлом приложений. Хотя Anthropic не отрицает эти риски, компания уверяет, что предпринимает меры для минимизации угроз. Модель не обучалась на реальных пользовательских данных, а снимки экрана, сделанные Computer Use, хранятся 30 дней для последующего анализа и предотвращения угроз. В случае необходимости Anthropic готова ограничить доступ к определённым функциям, чтобы предотвратить такие действия, как создание учётных записей или публикации в соцсетях.

Компания также анонсировала скорый выход новой модели Claude Haiku 3.5, которая будет предназначена для узкоспециализированных задач и сможет анализировать не только текст, но и изображения. Anthropic продолжает развивать семейство моделей Claude и работает над дальнейшими улучшениями, в том числе планирует выпуск Claude 3.5 Opus, что обещает расширить функционал ИИ для разных потребностей бизнеса.

Разработчики уже могут протестировать новую функцию Computer Use через API Anthropic, а также платформы Amazon Bedrock и Google Cloud Vertex AI, что открывает широкие возможности для интеграции ИИ-агента в различные системы и решения.