Исполнители
Солнышкина М.И.
Соловьев В.Д.
Иванов В.В.
Кисельников А.
Аннотация
Проект нацелен на создание автоматического анализатора сложности текстов на русском языке и будет продвигать идеологию «Простой язык».
В рамках междисциплинарного подхода оценка сложности текста будет осуществляться на основе более 70 объективных количественных параметров текста.
Публикации:
V. Solovyev, V. Ivanov, and M. Solnyshkina. Assessment of reading difficulty levels in Russian academic texts: Approaches and metrics. Journal of Intelligent & Fuzzy Systems, 34(5):3049–3058, 2018.
V.V. Ivanov, M.I. Solnyshkina, and V.D. Solovyev. Efficiency of text readability features in Russian academic texts. In Komp'juternaja Lingvistika i Intellektual'nye Tehnologii, volume 17, pages 277–287, 2018.
Базы данных
База данных содержит школьные учебники для 5-11 классов по Обществознанию А.Ф. Никитина и Л.Н. Боголюбова. Имена файлов в текстовом формате содержат номер класса и первые буквы фамилии автора. Для того, чтобы избежать нарушения авторских прав, предложения учебника перемешаны и расположены в случайном порядке.
При использовании базы данных просьба ссылаться на статью, в которой она была впервые описана: V. Solovyev, V. Ivanov, and M. Solnyshkina. Assessment of reading difficulty levels in Russian academic texts: Approaches and metrics. Journal of Intelligent & Fuzzy Systems, 34(5):3049–3058, 2018.
1. Частотные словари учебников 1-4 классов.xlsx
2. Учебники по обществознанию.zip
3. "Производственные" тексты.rar
4. Тесты на пассивный словарный запас.rar
5. Пересказы школьников -1.zip
6. Материалы по эксперименту связность.rar
7. Списки слов лексических минимумов А1-С1..zip
8. Словарь академической лексики.txt
9. Словари устаревших слов.rar
Финансовая поддержка:
РНФ, грант № 18-18-00436