Нидерландские исследователи создали ИИ-детектор сарказма
- Исследователи из Гронингенского университета создали ИИ-алгоритм, способный распознавать сарказм.
- Для его обучения разработчики использовали датасет с отрывками из американских ситкомов, включая «Друзья» и «Теория большого взрыва».
- После тренировки точность модели составила 75%.
Исследователи из Гронингенского университета разработали мультимодальный ИИ-алгоритм для обнаружения сарказма. Работу представили на совместном заседании Американского акустического общества и Канадской акустической ассоциации, пишет The Guardian .
«Мы способны надежно распознавать сарказм и стремимся развивать эту технологию. Мы хотим посмотреть, как далеко можем зайти», — заявил один из разработчиков модели Мэтт Колер.
По его словам, сарказм пронизывает человеческий дискурс больше, чем люди способны представить. Его понимание имеет решающее значение для беспрепятственного общения людей и машин, добавил Колер.
При создании детектора исследователи обнаружили, что ИИ нужны многочисленные сигналы, позволяющие отличить сарказм от искренности.
Специалисты обучили нейросеть на мультимодальных данных ― аудиоклипах, тексте и аннотированном эмоциональном контенте. Они использовали отрывки из американских ситкомов, включая «Друзья» и «Теория большого взрыва». Их взяли из размеченного датасета MUStARD .
Одной из сцен, на которой тренировался ИИ, была попытка Леонарда сбежать из запертого помещения в сериале «Теории большого взрыва». Другая изображала Росса из «Друзей», предлагающего Рэйчел помочь Джоуи и Чендлеру собрать мебель.
Исследователи извлекли из речи акустические параметры, включая высоту тона, скорость и энергию. Затем с помощью автоматического распознавания сказанного они перевели ее в текст для анализа настроений.
«Мы присвоили каждому сегменту речи смайлы, отражающие его эмоциональное содержание. Интегрируя эти мультимодальные сигналы в алгоритм машинного обучения, наш подход использует совокупные преимущества слуховой и текстовой информации вместе со смайликами для всестороннего анализа», ― объяснили специалисты.
После тренировки ИИ научился обнаруживать сарказм в немаркированных репликах из ситкомов почти в 75% случаев. Затем разработчики использовали синтетические данные для повышения точности модели, но это исследование еще не опубликовано.
По словам авторов, алгоритм можно улучшить за счет добавления в датасет визуальных подсказок вроде движения бровей и ухмылок.
«Получится ли у нас на 100% точная система? Этого не могут достичь даже люди», ― отметил один из исследователей.
Напомним, недавно OpenAI представила ИИ-модель GPT-4o, способную выражать эмоции.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Киты скупили биткоин на $8,5 млрд — поднимет ли это цену BTC до $110 000

Топ-3 аирдропа, за которыми стоит следить на этой неделе

Как изменится регулирование криптоиндустрии при новом главе SEC

Парижская полиция разыскивает вооруженных подозреваемых после попытки похищения дочери и внука крипто-предпринимателя
Краткий обзор Двое родственников генерального директора французской криптовалютной компании едва не были похищены среди бела дня на улице в Париже во вторник утром. Эта новость стала пятым известным случаем "атак с гаечным ключом" во Франции с начала года, включая громкое похищение и пытки соучредителя Ledger Дэвида Балланда.

Популярное
ДалееЦены на крипто
Далее








