Новый инструмент «Думай» от Anthropic позволяет Клоду останавливаться и размышлять в сложных ситуациях использования инструментов
Коротко Anthropic представил инструмент «Думай», который позволяет Клоду добавить дополнительный шаг мышления — с выделенным для него местом — прежде чем прийти к окончательному ответу.
Фирма, специализирующаяся на безопасности и исследованиях ИИ, Антропный представил инструмент «Думай», который предоставляет выделенное пространство для структурированного мышления во время сложных задач. Этот инструмент позволяет Клоду включить дополнительный шаг мышления — с собственным выделенным пространством — прежде чем прийти к окончательному ответу.
Хотя концепция может показаться похожей на расширенное мышление, есть ключевые различия. Расширенное мышление происходит до того, как Клод начинает генерировать ответ, где он глубоко обдумывает и совершенствует свой подход. Напротив, инструмент «Думай» используется после того, как Клод начал генерировать ответ, позволяя ему сделать паузу и оценить, собрал ли он всю необходимую информацию для продолжения. Это особенно полезно во время задач, которые включают в себя длинные последовательности вызовов инструментов или многошаговые разговоры с пользователем.
Инструмент «Думай» особенно эффективен в ситуациях, когда у Клода недостаточно информации только из запроса пользователя и ему необходимо обработать внешние данные (например, результаты вызовов инструментов). Рассуждения, лежащие в основе этого инструмента, менее всеобъемлющи, чем расширенный процесс мышления, и больше сосредоточены на интеграции новой информации, которая появляется в ходе выполнения задачи.
Anthropic рекомендует использовать расширенное мышление для более простых сценариев, таких как непоследовательные вызовы инструментов или простые инструкции. Он также эффективен для таких задач, как кодирование, математика и физика, где Клоду не нужно полагаться на внешние инструменты. Инструмент лучше подходит для более сложных задач, где Клод должен тщательно анализировать выходные данные инструмента, ориентироваться в подробных инструкциях в средах с большим количеством политик или принимать последовательные решения, которые выстраиваются друг на друге, где ошибки могут иметь последствия.
Лучшие практики по внедрению инструмента «Думай»
Чтобы максимально использовать преимущества инструмента «Think» с Клодом, Anthropic рекомендует следующие методы внедрения, основанные на экспериментах τ-bench.
Наиболее эффективная стратегия — предоставить четкие инструкции о том, когда и как использовать инструмент «Думай». Это особенно очевидно в домене авиакомпании τ-bench, где примеры, специфичные для домена, значительно повышают эффективность модели при применении инструмента «Думай». Эти примеры должны включать руководство по нескольким аспектам, таким как: описание уровня детализации, ожидаемого в процессе рассуждения, разбиение сложных инструкций на выполнимые шаги, предоставление деревьев решений для обработки распространенных сценариев и помощь в оценке того, была ли собрана вся необходимая информация.
Работая с Антропный обнаружили, что для длинных или сложных инструкций размещение их в системной подсказке было более эффективным, чем включение их в само описание инструмента. Это позволяет модели лучше интегрировать процесс мышления в ее общее поведение, предоставляя ему более широкий контекст.
Интеграция инструмента «Think» в реализацию Claude относительно проста и может привести к улучшениям. Фирма предлагает начать со сложных вариантов использования, особенно тех, где Claude борется с соблюдением политики или сложными рассуждениями в длинных цепочках вызовов инструментов. Пользователи могут начать с добавления инструмента definition и реализовать настраиваемый инструмент «думать», специфичный для домена. Этот процесс требует минимального кодирования, но способствует более структурированному рассуждению. Пользователи также должны рассмотреть возможность включения инструкций о том, когда и как использовать инструмент, вместе с примерами, относящимися к домену, в системную подсказку.
После внедрения инструмента пользователям предлагается контролировать и совершенствовать его использование, наблюдая за тем, как Клод применяет его на практике. Они могут корректировать подсказки для продвижения более эффективных моделей мышления. Добавление нового инструмента имеет минимальные недостатки с точки зрения производительности. Он не изменит внешнее поведение, если только Клод не захочет его использовать, и он не мешает существующим инструментам или рабочим процессам.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Ledger восстановил контроль над Discord после взлома аккаунта модератора
Краткий обзор Производитель аппаратных кошельков Ledger подвергся взлому Discord в поздний субботний вечер после того, как злоумышленник скомпрометировал аккаунт модератора, сообщила компания. Ledger восстановил контроль и заявил, что принимает дополнительные меры предосторожности для укрепления своей безопасности. Некоторые клиенты Ledger недавно получили физические мошеннические письма с просьбой предоставить их сид-фразы.

Демократические сенаторы предлагают запретить продвижение криптовалюты Трампом и высокопоставленными правительственными чиновниками на фоне спора о законопроекте о стейблкоинах
Краткий обзор Группа из 20 сенаторов-демократов представила законопроект, который запретит президенту, вице-президенту, Конгрессу и утвержденным Сенатом членам Кабинета министров создавать и продвигать криптовалюты, а также некоторым другим лицам. Законопроект был представлен на фоне растущей напряженности вокруг законопроекта Сената о стейблкоинах, после того как ряд демократов отозвали свою поддержку текущей версии законопроекта. Законопроект будет пытаться запретить Трампу и Мелании извлекать прибыль из их мемкоинов, хотя он

Завершился ли медвежий рынок или это временное улучшение – мнения аналитиков разделились

Биткоин отмечает 5 лет с 3-го халвинга
Популярное
ДалееЦены на крипто
Далее








