Чем отличаются язык алеутов и хинди? Бирманский и финский? Чтобы узнать ответ, достаточно пару раз щёлкнуть мышью на сайте электронной базы данных «Языки мира», которую усовершенствовали в Приволжском федеральном университете под руководством Валерия Соловьёва.
Современная лингвистика установила дальнее родство языков множества народов, населяющих территорию Евразии: индоевропейских, уральских, алтайских, картвельских. Есть даже гипотеза о едином для этой макросемьи праязыке – ностратическом (от латинского nostras – «наш», «здешний»). Более удивительный пример – сходство языков индейцев племени На-Дене в Северной Америке, кетов, проживающих на Енисее, а также северокавказских и тибетских народов.
Подобные исследования всё больше опираются на методы математики и статистики, не просто придающие языковедению точность естественных наук, но и облегчающие лингвистический анализ.
Как много языков включено в вашу базу данных?
– В настоящий момент она включает подробное и точное описание грамматик 315 языков Евразии и Северной Америки, в том числе свыше 50 мёртвых языков (хотя, конечно, они описаны менее детально, чем языки живые).
Откуда лингвистическая информация?
– Источник – одноимённое энциклопедическое издание Института языкознания РАН, над выпуском которого много лет работал огромный коллектив ведущих лингвистов СССР и России. Сейчас этот проект возглавляет профессор А. А. Кибрик. В 80-е годы в Институте языкознания началось создание базы данных «Языки мира». Инициатива принадлежала члену-корреспонденту Академии наук В. Н. Ярцевой. Исследования велись в отделе прикладного языкознания под руководством А. И. Новикова.
По какому принципу сопоставляют языки?
– Сравнивая грамматические признаки (их в базе 3821), мы рассчитываем «расстояние» между языками. Оно равно числу несовпадающих признаков. Масштаб исследований позволяет говорить о надёжности выводов, хотя в научной среде продолжаются споры о том, что же в реальности отражает грамматическая (или типологическая) близость: реальное родство языков или заимствования в результате длительных контактов. Эта интрига волнует многие учёные умы. Похоже, что истина находится посередине. Это, кстати, повышает ценность базы данных, так как на её основе разными методами можно изучать и языковое родство, и ареальные контакты. На междисциплинарный уровень когнитивных наук уже выводит нас новое направление исследований – численная оценка сложности языка.
В чём ваша модернизация базы Института языкознания?
– Создан целый спектр инструментальных средств обработки данных, основанный на новых методиках квантитативных исследований: кластерный и интеллектуальный анализ данных, филогения, методы статистического анализа. Предложены оригинальные квантитативные методики. Также создана информационно-справочная версия базы данных, предназначенная для широкого использования в учебном процессе среди студентов и аспирантов. Открыт сайт, посвящённый проекту.
Кто использует базу данных?
– Мы проводим исследования и презентации на международных конференциях вместе с немецкими, болгарскими и швейцарскими учёными. По результатам этих исследований опубликованы десятки статей, сейчас готовится к изданию итоговая трёхтомная монография. Ежегодно проводится учебный семинар с участием ведущих отечественных и зарубежных специалистов в данной сфере.
Расскажите о результатах этих изысканий.
– Обнаружены интересные закономерности эволюции языков: эффект типологического сдвига евроазиатских языков за последние две тысячи лет, конкурентная модель возникновения и распространения грамматических признаков. Изучен ряд языковых семей (тюркские, кавказские, уральские языки).
Ведутся ли аналогичные исследования у нас в стране и на Западе?
– В мире существует лишь одна сравнимая по величине база данных по грамматике языков: World Atlas of Language Structures. Она создана большой группой исследователей под общим руководством Института эволюционной антропологии им. Макса Планка в Лейпциге. В ней значительно больше языков, но их описание не так подробно. Различаются и методологические подходы к описанию грамматики языков и составлению базы данных. Таким образом, две эти базы данных прекрасно дополняют друг друга. Мы провели совместное сопоставительное исследование наших баз, результаты опубликованы в Language Typology – одном из ведущих лингвистических журналов мира.
Каковы перспективы проекта?
– В настоящее время сотрудники Института языкознания совместно с другими исследовательскими коллективами описывают ещё около сотни языков. Их включение в базу увеличит её объём примерно на треть. После завершения текущего проекта мы планируем подать заявку на новый грант – сравнить эволюцию языков и генов народов мира.
Каким образом?
– Сопоставляя большие базы данных. Со стороны генетики это базы по Y-хромосоме, митохондриальной и аутосомной ДНК, созданные в Курчатовском институте, Медико-генетическом научном Центре РАМН и других организациях. Изучение коэволюции языков и генов находится в начальной стадии не только у нас, но и во всём мире. Но в последнее время появляется всё больше генетических данных, да и описание языков углубляется.
В чём вклад в исследования молодых участников?
– В реализации проекта принимают участие примерно 10 студентов и 10 аспирантов. Впрочем, по ходу выполнения проекта их статус менялся. Пять аспирантов защитили кандидатские диссертации, два студента остались в аспирантуре. Ю. Арсентьева в первый же год после окончания университета завершила работу над кандидатской диссертацией (защита запланирована этой весной). В прошлом году сразу пять студентов, участвующих в программе международного сотрудничества, были командированы в Италию. Я полагаю, что программа «Кадры» весьма полезна нашей научной молодёжи, способствует её карьерному росту.
Есть ли у программы недостатки? Многие жалуются на обильную отчётность…
– Как ни странно, но к трудоёмкости отчётности у меня особых претензий нет. В грантах Евросоюза она на порядок сложнее.
Легко ли было выиграть конкурс?
– Получилось лишь со второй попытки.
Вы не считаете, что нужно проводить два конкурса: для двух столиц и для других городов?
– Подобную идею слышу впервые и воспринимаю её отрицательно. Так называемая «периферия» России отнюдь не является периферией научной. Это показывает опыт таких центров, как Новосибирск, Томск, Нижний Новгород. Мы в Казани не чувствуем себя периферией и на равных сотрудничаем (и конкурируем!) с ведущими научными школами и России, и мира.
Как оцениваете объём финансирования по целевой программе?
– Понятно, что средств никогда и никому не хватает. Но всё же, учитывая общемировую тенденцию к приоритетному развитию медицины и естественных наук, выделение нам ежегодно трёх миллионов рублей на чисто гуманитарную проблематику считаю удовлетворительным. В общем, нужно меньше жаловаться и больше работать.