Профессор, главный научный сотрудник Института филологии и межкультурной коммуникации КФУ Валерий Соловьев принял участие в работе круглого стола «Цифровизация в гуманитарном образовании» Комиссии по развитию высшего образования и науки Общественной палаты РФ. Мы обратились к нему с рядом вопросов.
Валерий Дмитриевич, с чем связано проведение круглого стола по этой тематике?
Как хорошо известно, цифровизация охватывает фактически все сферы нашей жизни, и гуманитарные науки не исключение. Так что тут есть, что обсуждать. Однако проведение данного круглого стола преследовало и совершенно конкретную цель. В настоящее время Минобрнауки РФ корректирует перечень специальностей подготовки высшего образования. С проектом приказа "Об утверждении перечней специальностей и направлений подготовки высшего образования" и новым перечнем можно познакомиться на сайте https://regulation.gov.ru/projects#npa=115846.
Корректировка перечня специальностей сама по себе вполне уместна, однако некоторые из планируемых решений вызывают серьезное беспокойство. Существующие в настоящее время направления подготовки: Лингвистика, Филология, Фундаментальная и прикладная лингвистика объединяются в направление Языкознание и литературоведение. Кроме того, это направление вместе с журналистикой и еще некоторыми направлениями объединяются в специальность 04. ЯЗЫК, ОБЩЕСТВЕННЫЕ КОММУНИКАЦИИ, МЕДИА И ЖУРНАЛИСТИКА.
Такое укрупнение специальностей приведет к существенным изменениям учебных планов, прежде всего, к расширению общегуманитарных дисциплин на первых двух курсах бакалавриата. Соответственно, будет меньше возможностей для преподавания дисциплин, важных именно в контексте цифровизации лингвистики. Это и обсуждалось на круглом столе.
Валерий Дмитриевич, к каким же выводам пришли участники круглого стола?
Вывод таков, что на данном этапе с учетом повышения роли цифровизации возрастает необходимость усвоения студентами ряда компьютерных и математических дисциплин, причем это в наибольшей степени важно именно для лингвистики. Лингвистика и журналистика весьма далеки друг от другу, и объединение их в одну специальность вряд ли будет удачным. В итоге принято решение направить в Минобрнауки общее мнение участников круглого стола о негативных последствиях подобного укрупнения специальностей и направлений подготовки и целесообразности сохранения лингвистики, филологии, фундаментальной и прикладной лингвистика, как самостоятельных направлений.
Валерий Дмитриевич, каков был состав участников круглого стола?
В работе круглого стола участвовало 82 человека. Как отметил заместитель председателя Комиссии по высшему образованию и науке Общественной палаты РФ М.А. Кронгауз, обычно круглые столы собирают значительно меньше участников. Видимо вопрос об укрупнении специальностей задел многих. Было сделано 8 основных докладов, после чего последовала оживленная дискуссия. В работе круглого стола приняли участие известные ученые, представители ведущих университетов, включая МГУ и СПбГУ, академических институтов, Курчатовского научного центра, а также бизнеса (ABBYY, Сбербанк).
Валерий Дмитриевич, с каким докладом выступили Вы?
Доклад назывался «Три этапа цифровизации лингвистики». Мой основной тезис, который я давно отстаиваю, состоит в том, что лингвистика сейчас отнюдь не чисто гуманитарная наука. В своем развитии она эволюционирует в направлении естественнонаучных и математических наук и прошла уже, по меньшей мере, половину этого пути. На конкретных примерах я стремился показать, что лингвистика занимает совершенно особое место в системе наук, отличаясь по сравнению с другими гуманитарными науками наивысшим уровнем цифровизации. Соответственно, необходимо увеличивать долю математических и компьютерных дисциплин в учебных планах и не объединять ее с чисто гуманитарными дисциплинами, такими как журналистика. Ниже я привожу полный текст моего доклада.
Свое выступление я посвящу вопросу о месте лингвистики среди других наук. Традиционно всегда считалось, что лингвистика – это гуманитарная наука, однако, сейчас это не совсем так. Начиная со второй половины 20-го века она стремительно эволюционирует в направлении естественных и математических дисциплин. По моему мнению, можно выделить три этапа этой эволюции.
Первый этап. В конце 50-ых годов выдающийся лингвист Ноам Хомский предложил принципиально новую теорию языка – трансформационную грамматику. Он показал, что несмотря на все разнообразие языков, в их основе лежат некие фундаментальные законы, строго выполняющиеся во всех без исключения языках. Эти законы в той же мере универсальны, как и законы естественных наук – законы механики, гравитации в физике или дарвиновские законы эволюции в биологии. Это сблизило лингвистику с естественные науками. Более того, теория Хомского строго формализована, так что может изучаться математическими методами. Она применима не только к человеческим языкам, но и к языкам программирования и оказалась полезной при разработке программного обеспечения первых ЭВМ.
Второй этап. В доинтернетную эпоху лингвисты могли оперировать коллекциями текстов размером не более нескольких миллионов слов. Сейчас объемы доступных для анализа текстов драматическим образом выросли. В Интернете триллионы слов. Необходимый материал можно найти с помощью поисковиков и обработать с помощью мощных пакетов статистического анализа. Без такого рода числовой информации научные статьи фактически уже невозможно опубликовать в серьезном журнале. Известный американский лингвист Лора Янда некоторое время назад проанализировала с этой точки зрения статьи в журнале “Когнитивная лингвистика”. Оказалось, что еще четверть века назад только 20% статей опирались на статистический анализ больших массивов языковых данных, а 10 лет назад – уже около 80%. В настоящее время доля таких статей приближается к 100%. Эту ситуацию с гигантским объемом доступных для анализа данных также можно сравнить с положением дел в естественных науках. Например, в физике элементарных частиц Большой адронный коллайдер генерирует в ходе экспериментов такие объемы данных, которые исследователи не успевают проанализировать. Для лингвистики, как и для физики очень важным является научное направление “Big Data” (Большие данные), разрабатываемое в компьютерных науках.
Третий этап. В последнее время много говорится об искусственном интеллекте. Примерно 9 лет назад в этой области произошла революция под названием Deep Learning. В области обработки естественного языка технология Deep Learning начала применяться с конца 2018 г. Понятно, что за столь короткое время – всего 2,5 года – мы еще даже не начали осмысливать возможности и последствия применения этой технологии в лингвистике. Пока приведу несколько примеров. В прикладной лингвистике заметен существенный прогресс в таких практически важных задачах как машинный перевод или рекомендательные системы. Поразительно, но в некоторых случаях продемонстрировано, что ИИ сравнялся или даже превосходит человеческий в понимании языка. Так существует тест GLUE на понимание текстов. Это что-то вроде IQ в сфере языка. При прохождении теста можно получить оценку от 0 до 100 баллов. Средняя оценка для людей – 90,5 балла. ИИ уже достиг уровня 91 балл, т.е. превзошел человека. Последний пример из нашей практики. В нашей лаборатории в Казанском федеральном университете ИИ создал словарь некоторого специального типа, и оказалось, что качество этого словаря точно такое же, как и у словаря, созданного людьми. В итоге, я полагаю, что лингвистика прошла, по меньшей мере, половину пути в направлении математических и естественных наук.
Указанное сближение лингвистики с математическими, компьютерными и естественными науками должно найти отражение в университетских образовательных программах. Студенты-филологи должны хорошо ориентироваться в целом спектре математических и компьютерных дисциплин, чтобы быть востребованными и конкурентоспособными.