Модели обработки естественного языка используют статистику для сбора большого количества информации о значениях слов.
В «Зазеркалье» Шалтай-Болтай с презрением говорит: «Когда я использую слово, оно означает именно то, что я выбираю, — ни больше, ни меньше». Алиса отвечает: «Вопрос в том, можете ли вы заставить слова означать так много разных вещей».
Значения слов уже давно являются предметом исследования. Чтобы понять их значение, человеческий разум должен разобраться в сложной сети гибкой, подробной информации.
Теперь обнаружилась более свежая проблема со значением слова. Исследователи изучают, смогут ли машины с искусственным интеллектом имитировать мыслительные процессы человека и так же понимать слова. Исследователи из Калифорнийского университета в Лос- Анджелесе, Массачусетского технологического института и Национального института здравоохранения только что опубликовали исследование, дающее ответ на этот вопрос.
Исследование, опубликованное в журнале Nature Human Behavior , демонстрирует, что системы искусственного интеллекта действительно могут улавливать очень сложные значения слов. Исследователи также нашли простой способ получить доступ к этой сложной информации. Они обнаружили, что система ИИ, на которую они смотрели, представляет значения слов таким образом, который очень напоминает человеческое суждение.
Система искусственного интеллекта, которую исследовали авторы, широко использовалась для анализа значения слов на протяжении последнего десятилетия. Он улавливает значения слов, «читая» огромное количество материалов в Интернете, содержащих десятки миллиардов слов.
Когда слова часто встречаются вместе — например, «стол» и «стул», — система узнает, что их значения связаны. И если пары слов встречаются вместе очень редко — например, «стол» и «планета», — он узнает, что они имеют очень разные значения.
Такой подход кажется логичной отправной точкой, но подумайте, насколько хорошо люди понимали бы мир, если бы единственным способом понять смысл было подсчитывать, как часто слова встречаются рядом друг с другом, без какой-либо возможности взаимодействовать с другими людьми и окружающей средой.
Исследователи обнаружили, что для этих многочисленных объектов и контекстов их метод оказался очень похожим на человеческую интуицию. (Чтобы провести это сравнение, исследователи также попросили группы из 25 человек дать одинаковые оценки каждой из групп из 52 слов.)
Примечательно, что система научилась понимать, что имена «Бетти» и «Джордж» похожи в том смысле, что они относительно «старые», но представляют разные полы. И что «тяжелая атлетика» и «фехтование» похожи тем, что оба они обычно проводятся в помещении, но различаются с точки зрения того, сколько интеллекта они требуют.
Исследование финансировалось Управлением директора национальной разведки по передовым исследовательским проектам разведки через Исследовательскую лабораторию ВВС.