26 марта 2012
После Вавилона

Чем отличаются язык алеутов и хинди? Бирманский и финский? Чтобы узнать ответ, достаточно пару раз щёлкнуть мышью на сайте электронной базы данных «Языки мира», которую усовершенствовали в Приволжском федеральном университете под руководством Валерия Соловьёва.

Современная лингвистика установила дальнее родство языков множества народов, населяющих территорию Евразии: индоевропейских, уральских, алтайских, картвельских. Есть даже гипотеза о едином для этой макросемьи праязыке – ностратическом (от латинского nostras – «наш», «здешний»). Более удивительный пример – сходство языков индейцев племени На-Дене в Северной Америке, кетов, проживающих на Енисее, а также северокавказских и тибетских народов.

Подобные исследования всё больше опираются на методы математики и статистики, не просто придающие языковедению точность естественных наук, но и облегчающие лингвистический анализ.

Как много языков включено в вашу базу данных?

– В настоящий момент она включает подробное и точное описание грамматик 315 языков Евразии и Северной Америки, в том числе свыше 50 мёртвых языков (хотя, конечно, они описаны менее детально, чем языки живые).

Откуда лингвистическая информация?

– Источник – одноимённое энциклопедическое издание Института языкознания РАН, над выпуском которого много лет работал огромный коллектив ведущих лингвистов СССР и России. Сейчас этот проект возглавляет профессор А. А. Кибрик. В 80-е годы в Институте языкознания началось создание базы данных «Языки мира». Инициатива принадлежала члену-корреспонденту Академии наук В. Н. Ярцевой. Исследования велись в отделе прикладного языкознания под руководством А. И. Новикова.

По какому принципу сопоставляют языки?

– Сравнивая грамматические признаки (их в базе 3821), мы рассчитываем «расстояние» между языками. Оно равно числу несовпадающих признаков. Масштаб исследований позволяет говорить о надёжности выводов, хотя в научной среде продолжаются споры о том, что же в реальности отражает грамматическая (или типологическая) близость: реальное родство языков или заимствования в результате длительных контактов. Эта интрига волнует многие учёные умы. Похоже, что истина находится посередине. Это, кстати, повышает ценность базы данных, так как на её основе разными методами можно изучать и языковое родство, и ареальные контакты. На междисциплинарный уровень когнитивных наук уже выводит нас новое направление исследований – численная оценка сложности языка.

В чём ваша модернизация базы Института языкознания?

– Создан целый спектр инструментальных средств обработки данных, основанный на новых методиках квантитативных исследований: кластерный и интеллектуальный анализ данных, филогения, методы статистического анализа. Предложены оригинальные квантитативные методики. Также создана информационно-справочная версия базы данных, предназначенная для широкого использования в учебном процессе среди студентов и аспирантов. Открыт сайт, посвящённый проекту.

Кто использует базу данных?

– Мы проводим исследования и презентации на международных конференциях вместе с немецкими, болгарскими и швейцарскими учёными. По результатам этих исследований опубликованы десятки статей, сейчас готовится к изданию итоговая трёхтомная монография. Ежегодно проводится учебный семинар с участием ведущих отечественных и зарубежных специалистов в данной сфере.

Расскажите о результатах этих изысканий.

– Обнаружены интересные закономерности эволюции языков: эффект типологического сдвига евроазиатских языков за последние две тысячи лет, конкурентная модель возникновения и распространения грамматических признаков. Изучен ряд языковых семей (тюркские, кавказские, уральские языки).

Ведутся ли аналогичные исследования у нас в стране и на Западе?

– В мире существует лишь одна сравнимая по величине база данных по грамматике языков: World Atlas of Language Structures. Она создана большой группой исследователей под общим руководством Института эволюционной антропологии им. Макса Планка в Лейпциге. В ней значительно больше языков, но их описание не так подробно. Различаются и методологические подходы к описанию грамматики языков и составлению базы данных. Таким образом, две эти базы данных прекрасно дополняют друг друга. Мы провели совместное сопоставительное исследование наших баз, результаты опубликованы в Language Typology – одном из ведущих лингвистических журналов мира.

Каковы перспективы проекта?

– В настоящее время сотрудники Института языкознания совместно с другими исследовательскими коллективами описывают ещё около сотни языков. Их включение в базу увеличит её объём примерно на треть. После завершения текущего проекта мы планируем подать заявку на новый грант – сравнить эволюцию языков и генов народов мира.

Каким образом?

– Сопоставляя большие базы данных. Со стороны генетики это базы по Y-хромосоме, митохондриальной и аутосомной ДНК, созданные в Курчатовском институте, Медико-генетическом научном Центре РАМН и других организациях. Изучение коэволюции языков и генов находится в начальной стадии не только у нас, но и во всём мире. Но в последнее время появляется всё больше генетических данных, да и описание языков углубляется.

В чём вклад в исследования молодых участников?

– В реализации проекта принимают участие примерно 10 студентов и 10 аспирантов. Впрочем, по ходу выполнения проекта их статус менялся. Пять аспирантов защитили кандидатские диссертации, два студента остались в аспирантуре. Ю. Арсентьева в первый же год после окончания университета завершила работу над кандидатской диссертацией (защита запланирована этой весной). В прошлом году сразу пять студентов, участвующих в программе международного сотрудничества, были командированы в Италию. Я полагаю, что программа «Кадры» весьма полезна нашей научной молодёжи, способствует её карьерному росту.

Есть ли у программы недостатки? Многие жалуются на обильную отчётность…

– Как ни странно, но к трудоёмкости отчётности у меня особых претензий нет. В грантах Евросоюза она на порядок сложнее.

Легко ли было выиграть конкурс?

– Получилось лишь со второй попытки.

Вы не считаете, что нужно проводить два конкурса: для двух столиц и для других городов?

– Подобную идею слышу впервые и воспринимаю её отрицательно. Так называемая «периферия» России отнюдь не является периферией научной. Это показывает опыт таких центров, как Новосибирск, Томск, Нижний Новгород. Мы в Казани не чувствуем себя периферией и на равных сотрудничаем (и конкурируем!) с ведущими научными школами и России, и мира.

Как оцениваете объём финансирования по целевой программе?

– Понятно, что средств никогда и никому не хватает. Но всё же, учитывая общемировую тенденцию к приоритетному развитию медицины и естественных наук, выделение нам ежегодно трёх миллионов рублей на чисто гуманитарную проблематику считаю удовлетворительным. В общем, нужно меньше жаловаться и больше работать.

Источник информации: Огнёв Алексей, "Наука и технологии РФ", фото Алии Галимуллиной