02 апреля 2023
Компьютерная лингвистика: как решаются прикладные задачи автоматической обработки текстов и речи?

Для участников СНК «Linguaскоп» состоялась открытая лекция

Многогранность окружающего мира ведет к синтезу наук, обобщению методов для изучения окружающей природы и человека. Для участников студенческого научного кружка «Linguaскоп» ЕИ КФУ, которые занимаются под руководством доцента кафедры русского языка и литературы Юлии Даниловой, состоялась лекция «Компьютерная лингвистика: как решаются прикладные задачи автоматической обработки текстов и речи?», рассказывающая о взаимодействии данных на рубеже двух областей наук: лингвистики и нечеткой логики. Особую актуальность теме придавало присутствие в аудитории учеников IT-класса ОШ «Университетская», которые много времени посвящают близким к программированию темам.

«Если бы весь мир состоял из единиц и нулей, то существовало бы только черное и белое, поэтому булевой алгебры не хватает для описания явлений и жизни вокруг нас. Это понимание неизбежно ведет нас к появлению нечеткой логики», - начал свое выступление спикер, руководитель пресс-службы Елабужского института КФУ Никита Староверов.

Он рассказал о первых попытках Ноама Хомского, автора классификации формальных языков, провести четкие границы для понимания синтаксической роли, семантического содержания того или иного слова в законченном и оформленном по смыслу высказывании, чтобы из этого знания можно было бы определить синтагматические и парадигматические связи.

Теория Хомского хорошо применяется к решению прикладных задач автоматической обработки текстов и речи, если в основе используемого программного обеспечения лежит нечеткая логика. Дело в том, что идеи, выдвинутые Лотфи Заде, описывают лингвистические переменные при помощи термов и помогают нам пользоваться автокоррекцией текста, находить нужное в поисковиках и т.д.

«Если мы будем искать «Мисисипи», то поисковик автоматически включи неправильное написание в некое множество, которое имеет проекцию в правильном варианте, и мы получим «Миссисипи» - как и полагается», - рассказал о принципах обработки естественного языка Никита Дмитриевич.

Разумеется, машина работает по определенным правилам, поэтому исправить, а тем более – написать, все за человека она не может и яркий пример этому – собирательные (по принципу семантического ядра – пересечения мноджеств) название вещей на маркетплейсах, которые также были проанализированы в ходе лекции.

Многогранность современного мира требует синтеза наук, поэтому идея лингвиста Хомского так тесно переплетаются с учением математика Заде. И благодаря объединенным усилиям ученых гуманитарного и естественного цикла мы сегодня можем наблюдать расцвет искусственного интеллекта: решать прикладные задачи автоматической обработки текстов и речи.

Источник информации: Лиана Султанова