В научной сфере исследования ведутся по трем научным направлениям:

1)  Обработка текстов на естественном языке (рук. Иванов В.В.)

Проект создания открытой системы обработки текстов на русском языке: от токенизации до семантического анализа. Цель проекта состоит в создании открытого инструментария обработки русскоязычных текстов на базе Apache UIMA. Проект поддерживает масштабирование на основе технологий Apache Hadoop и Amazon Elastic Map Reduce.

2) Извлечение информации из текста (рук. Соловьев В.Д.)

Проект создания системы извлечения событий из текстов, реализуемый совместно с Hewlett-Packard.  Система излечения бизнес-событий из новостных потоков (Business Event Extraction) направлена на разработку коммерческой системы для поиска в новостных сообщениях и семантического анализа событий в мире бизнеса.

Проект разработки и реализации оригинальной эффективной технологии извлечения знаний из эксперта в предметной области. При реализации проекта будут использованы методы машинного обучения на больших корпусах текстов.

3) Семантический поиск (рук. Жильцов Н.Г.)

Программный фреймворк для поддержания и анализа Q&A сайтов, предоставляющий средства анализа коллективных вопросно-ответных систем.

Презентация Лаборатории. Загрузить