Ученые из Высшей школы экономики создали компьютерную модель, которая отличает отличников и двоечников по их записям в соцсетях. Прогноз успеваемости строится на основе характерных слов и особенностей речи. Точность прогноза составила 94%.
Следующим шагом станет перенос модели на определение депрессивных состояний и оценку психологического благополучия у школьников и студентов. Исследование опубликовано в EPJ Data Science.
«Мы разрабатываем систему, которая смогла бы по активности человека в социальной сети выявить у него психологические трудности, в частности, такое состояние, как депрессия. Нельзя быть уверенным в том, как эта модель будет работать, если вначале не валидировать ее на характеристике, информация о которой широко доступна, например, на академической успеваемости», – отмечает автор статьи и руководитель проекта по гранту РНФ Иван Смирнов.
Исследователи изучили посты с открытых страниц «ВКонтакте» (всего более 130 тыс. сообщений) от 2468 испытуемых, сдававших тест PISA – он позволяет оценить грамотность подростка, а также его умение применять знания на практике. Также систему испытали на постах студентов из сотни крупнейших вузов страны. Всего в выборку попали более миллиона постов от 38 833 пользователей.
В ходе эксперимента модель выявила несколько признаков, отличающих посты учащихся с хорошей и плохой успеваемостью.
Тексты «отличников», как правило, объемные, с длинными словами, заимствованиями и богатой лексикой.
Такие ученики чаще обсуждают физику, литературу (в текстах встречаются фамилии и имена писателей, персонажей) и используют выражения, описывающие мыслительный процесс («думаю», «считаю» и так далее).
«Двоечникам» свойственны ошибки, восклицания и слова, написанные заглавными буквами. Также они часто употребляют смайлы. Эти ученики чаще обсуждают гороскопы, военную службу и ДТП.