16 сентября 2013
Лекция Олеси Кольцовой и Сергея Кольцова "Картирование тематической структуры интернета и СМИ с помощью автоматического анализа текстов"

13 сентября в Казанском университете состоялась лекция Олеси Кольцовой и Сергея Кольцова из НИУ «Высшая школа экономики» (Санкт-Петербург) на тему «Картирование тематической структуры интернета и СМИ с помощью автоматического анализа текстов».
 
Организовал лекцию Центр культурных исследований постсоциализма Института сравнительных исследований модернизации обществ КФУ.
 
В начале своего выступления лекторы из Санкт-Петербурга рассказали о Лаборатории Интернет-исследований «Высшей школы экономики», которую они возглавляют. Данная лаборатория объединяет представителей разных научных дисциплин: социологии, математики, лингвистики и политологии. «Когда мы только собрались, то многие не понимали, как ученым из таких разных областей удастся сработаться. Но у нас все получилось», — рассказала Олеся Кольцова.
 
Лекция петербургских ученых была посвящена тому, как с помощью разработанной ими программы математического моделирования можно изучать тематический состав текстов в Интернете, на примере блогового ресурса «Живой Журнал» (livejournal.com). В частности, они изучали посты двух тысяч самых популярных российских блоггеров ЖЖ. С помощью разработанной Лабораторией программы сотрудники еженедельно закачивали тысячи постов ведущих блоггеров и анализировали их через ключевые слова.
 
В частности, сотрудники Лаборатории изучали политическую активность блоггеров в период выборов 2011-2012 годов. По словам Олеси Кольцовой, среди политически окрашенных постов в российской блогосфере доминируют посты с оппозиционным характером. Однако непосредственно накануне выборов активизируется и провластный сегмент Интернета.
 
Как отмечают исследователи, для российской блогосферы характерно доминирование перепостов газетных статей, и только на втором месте идут оригинальные тексты блоггеров. Очень часто первичная публикация выходит на сомнительных по своему происхождению и малоизвестных сайтах и только потом распространяется блоггерами.
 
О том, что перепосты являются самой распространенной формой публикаций в ЖЖ говорят цифры. Как рассказал Сергей Кольцов, только 7 процентов публикаций в «Живом Журнале» это оригинальные тексты, а 93 процента — перепосты.
 
Благодаря разработанной в Лаборатории программе тематический состав текстов топовых блоггеров определяется автоматически, что избавляет исследователя от необходимости строить догадки о том, какие темы доминировали в тот или иной временной отрезок. Данный метод применялся как к изучению выборов, так и для изучения тем связанных с этническим, религиозными вопросами и т.д.
 
В заключении своего выступления лекторы предложили казанским социологами, политологам, лингвистам и другим заинтересованным лицам сотрудничество в использовании разработанной ими методики. 

Источник информации: Гараев Данис