Oleg А. Chagin (olegchagin) wrote,
Oleg А. Chagin
olegchagin

Categories:

Метафора и ирония

Чат–ботами и голосовыми помощниками уже никого не удивишь.

И хотя большинство из них заточены под конкретные задачи (сообщить погоду, заказать товар и т. д.), постепенно начинают развиваться так называемые социальные чат–боты, которые могут поддерживать беседу на произвольные, отвлечённые темы. Но чтобы заинтересовать человека общением с таким чат–ботом, надо сначала разобраться, а что вообще делает разговор интересным. Исследования показывают, что такие фигуры речи, как метафора и ирония вносят очень большой вклад в поддержание интереса и вовлечённости собеседника в разговор.

Метафоры — это сравнения типа "тупой как пень" или "простой как валенок". Метафоры глубоко укоренены в нашем языке и сознании. Как писал Лакофф в своей книге, "наша обыденная понятийная система метафорична по своей сути". При этом метафору очень сложно формализовать. В чём секрет удачной метафоры (за пределами стандартных клише), и чем она отличается от неудачной? Не так давно Барбару Парти спросили, как можно описать метафору в рамках формальной семантики. Ответ был: "Я понятия не имею, как даже подступиться к этому вопросу".

Но это не остановило авторов статьи по ссылке, и они попытались научить чат–бота использовать метафоры. У них довольно интересный подход и используется много разных источников данных. Они приняли за основу, что метафора, как правило, используется для описания более абстрактных вещей при помощи более конкретных. Что довольно типично, хоть и не покрывает всех случаев метафоры.

Они отобрали сотню абстрактных понятий (взяв за основу поэтические темы и близкие к ним понятия) и несколько тысяч конкретных понятий (из специальной базы данных конкретных понятий(!), в которой даже указан рейтинг конкретности(!) для каждого понятия/слова). В обоих случаях были исключены слова, которые редко встречались в разговорах с их чат–ботом.

Далее надо было найти связующее звено — то общее, что связывает абстрактные понятия с конкретными. И вот это, пожалуй, самое интересное в работе. Они использовали векторную семантику и подобрали такие связующие слова, расстояние до которых в векторном пространстве от каждого из двух слов примерно одинаковое и при этом меньше расстояния между исходными двумя словами.

Потом из этих слов надо было составить предложения. Например, имея два понятия "отношения" и "парк" и связующее слово "ухаживать", составлялась фраза типа "Отношения — как парк, за ними надо ухаживать". Фразы строились по определённым шаблонам, и для их заполнения использовался поиск в интернете.

Дальше следует их слабое место. Они случайным образом отобрали 500 пар абстрактное–конкретное и для каждой пары — по 5 связующих слов каждой части речи (прилагательное, существительное, глагол). И попросили трёх человек оценить, насколько связующее слово адекватно в каждом из 500x15 = 7500 случаев. И тут получилось, что примерно 75% связующих слов получили отрицательные оценки. Но осталось 1965 троек с положительными оценками, и дальше они экспериментировали только с ними. В общем, полностью автоматизировать процесс всё же не удалось.

Из этих 1965 троек им удалось сгенерировать 460 предложений с метафорой, которые они дали оценивать людям по трём критериям: 1) грамматичность (соответствует ли правилам языка), 2) адекватность/удачность метафоры и 3) новизна. Грамматичными оказались 89%, адекватными — 64%, новыми — подавляющее большинство (по этому параметры почему–то есть только график без конкретных цифр).

После этого они провели эксперимент над реальными пользователями чат–бота и выяснили, что метафоры и правда повышают интерес к разговору. Особенно если вставлять "Do you know why?" Например: "Сердце как бриллиант. Знаешь почему? Оба сверкают". В этот момент продолжили общение 41% пользователей против 22%, которым просто сообщалось, что "Сердце сверкает".

https://arxiv.org/abs/2001.00733

Subscribe
Comments for this post were disabled by the author