25 декабря 2022
Аспирант Елабужского института учит компьютер понимать русский язык

Об изучении компьютерной лингвистики в рамках работы над кандидатской диссертацией

Компьютерная лингвистика – это относительно новое направление в изучении языка и в его моделировании, хотя основы этого течения были заложены при необходимости расшифровки древних языков. Дело в том, что многие специалисты в языкознании отметили, что зачастую сложность понимания языка заключается в освоении лексики и морфем, а уже позже можно прибегнуть к четко структурированным правилам, создающим гармонию в парадигматических и синтагматических связях слов и предложений. Эту идею в виде существования у человека врожденных универсальных лингвистических структур сформулировал ученый, которого часто называют «отцом современной лингвистики» Ноам Хомский. Его идеи часто используются при обучении нейронных сетей.

Развитие цифровых технологий и вычислительных мощностей сначала позволило машине опередить человека в счете, затем – в шахматах. Уже сегодня при помощи нейронных сетей создаются семантически сложные произведения. Например, не так давно искусственный интеллект смог получить допуск к ЕГЭ, написав декабрьское сочинение, а на крупнейшем ресурсе для иллюстраторов разгорелся конфликт между художниками и нейросетью, которая обучилась создавать уникальные и качественные рисунки быстрее мастеров электронной и реальной кисти. Многие из нас ежедневно пользуются поисковыми системами, голосовыми помощниками и переводчиками текстов. Появление этих технологий стало возможным благодаря компьютерной лингвистике.

Создателем похожего по функциям искусственного интеллекта является аспирант первого года обучения Елабужского института КФУ Алексей Голиков. Он пишет работу, тема которой посвящена компьютерной лингвистике, под руководством доцента Юлии Даниловой.

Основной задачей молодого ученого является создание языковой модели, которая позволит управлять большим количеством проектов. Проект, получивший название «EASY» сможет показать полный цикл работы над поставленной перед исполнителем задачей, получить обратную связь, а также сформулировать четки указания для скорейшего достижения цели.

По словам Алексея Голикова, «EASY» будет уметь превращать текстовый массив в четко сформулированную проблему, которую нужно будет решить. Метод метаморфозы данных строится на автоматическом создании и анализе лексико-семантического поля, а также работы с семантическим уровнем текста.

Углубляясь в технические особенности работы (а в компьютерной лингвистике без них никак), аспирант Елабужского института КФУ научит компьютер не только говорить на русском языке, но и понимать его.

Источник информации: пресс-служба Елабужского института КФУ