Нидерландские исследователи создали ИИ-детектор сарказма

Bitget App

Торгуйте разумнее

Incrypted2024/05/17 12:48

Автор:Maryna Hlaiboroda

Исследователи из Гронингенского университета создали ИИ-алгоритм, способный распознавать сарказм.
Для его обучения разработчики использовали датасет с отрывками из американских ситкомов, включая «Друзья» и «Теория большого взрыва».
После тренировки точность модели составила 75%.

Исследователи из Гронингенского университета разработали мультимодальный ИИ-алгоритм для обнаружения сарказма. Работу представили на совместном заседании Американского акустического общества и Канадской акустической ассоциации, пишет The Guardian .

«Мы способны надежно распознавать сарказм и стремимся развивать эту технологию. Мы хотим посмотреть, как далеко можем зайти», — заявил один из разработчиков модели Мэтт Колер.

По его словам, сарказм пронизывает человеческий дискурс больше, чем люди способны представить. Его понимание имеет решающее значение для беспрепятственного общения людей и машин, добавил Колер.

При создании детектора исследователи обнаружили, что ИИ нужны многочисленные сигналы, позволяющие отличить сарказм от искренности.

Специалисты обучили нейросеть на мультимодальных данных ― аудиоклипах, тексте и аннотированном эмоциональном контенте. Они использовали отрывки из американских ситкомов, включая «Друзья» и «Теория большого взрыва». Их взяли из размеченного датасета MUStARD .

Одной из сцен, на которой тренировался ИИ, была попытка Леонарда сбежать из запертого помещения в сериале «Теории большого взрыва». Другая изображала Росса из «Друзей», предлагающего Рэйчел помочь Джоуи и Чендлеру собрать мебель.

Исследователи извлекли из речи акустические параметры, включая высоту тона, скорость и энергию. Затем с помощью автоматического распознавания сказанного они перевели ее в текст для анализа настроений.

«Мы присвоили каждому сегменту речи смайлы, отражающие его эмоциональное содержание. Интегрируя эти мультимодальные сигналы в алгоритм машинного обучения, наш подход использует совокупные преимущества слуховой и текстовой информации вместе со смайликами для всестороннего анализа», ― объяснили специалисты.

После тренировки ИИ научился обнаруживать сарказм в немаркированных репликах из ситкомов почти в 75% случаев. Затем разработчики использовали синтетические данные для повышения точности модели, но это исследование еще не опубликовано.

По словам авторов, алгоритм можно улучшить за счет добавления в датасет визуальных подсказок вроде движения бровей и ухмылок.

«Получится ли у нас на 100% точная система? Этого не могут достичь даже люди», ― отметил один из исследователей.

Напомним, недавно OpenAI представила ИИ-модель GPT-4o, способную выражать эмоции.

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.

APR до 12%. Аирдропы новых токенов.

Внести!