Исполнители

Солнышкина М.И.

Соловьев В.Д.

Иванов В.В.

Кисельников А.

Аннотация

Проект нацелен на создание автоматического анализатора сложности текстов на русском языке и будет продвигать идеологию «Простой язык».

В рамках междисциплинарного подхода оценка сложности текста будет осуществляться на основе более 70 объективных количественных параметров текста.


Публикации:

V. Solovyev, V. Ivanov, and M. Solnyshkina. Assessment of reading difficulty levels in Russian academic texts: Approaches and metrics. Journal of Intelligent & Fuzzy Systems, 34(5):3049–3058, 2018.

V.V. Ivanov, M.I. Solnyshkina, and V.D. Solovyev. Efficiency of text readability features in Russian academic texts. In Komp'juternaja Lingvistika i Intellektual'nye Tehnologii, volume 17, pages 277–287, 2018.


Базы данных

База данных содержит школьные учебники для 5-11 классов по Обществознанию А.Ф. Никитина и Л.Н. Боголюбова. Имена файлов в текстовом формате содержат номер класса и первые буквы фамилии автора. Для того, чтобы избежать нарушения авторских прав, предложения учебника перемешаны и расположены в случайном порядке.

При использовании базы данных просьба ссылаться на статью, в которой она была впервые описана: V. Solovyev, V. Ivanov, and M. Solnyshkina. Assessment of reading difficulty levels in Russian academic texts: Approaches and metrics. Journal of Intelligent & Fuzzy Systems, 34(5):3049–3058, 2018.

1. Частотные словари учебников 1-4 классов.xlsx

2. Учебники по обществознанию.zip

3. "Производственные" тексты.rar

4. Тесты на пассивный словарный запас.rar​

5. Пересказы школьников -1.zip

6. Материалы по эксперименту связность.rar

7. Списки слов лексических минимумов А1-С1..zip

8. Словарь академической лексики.txt

9. Словари устаревших слов.rar


Финансовая поддержка: 

РНФ, грант № 18-18-00436