Лаборатория "Интеллектуальные поисковые системы и семантические технологии"
В научной сфере исследования ведутся по трем научным направлениям:
1) Обработка текстов на естественном языке (рук. Иванов В.В.)
Проект создания открытой системы обработки текстов на русском языке: от токенизации до семантического анализа. Цель проекта состоит в создании открытого инструментария обработки русскоязычных текстов на базе Apache UIMA. Проект поддерживает масштабирование на основе технологий Apache Hadoop и Amazon Elastic Map Reduce.
2) Извлечение информации из текста (рук. Соловьев В.Д.)
Проект создания системы извлечения событий из текстов, реализуемый совместно с Hewlett-Packard. Система излечения бизнес-событий из новостных потоков (Business Event Extraction) направлена на разработку коммерческой системы для поиска в новостных сообщениях и семантического анализа событий в мире бизнеса.
Проект разработки и реализации оригинальной эффективной технологии извлечения знаний из эксперта в предметной области. При реализации проекта будут использованы методы машинного обучения на больших корпусах текстов.
3) Семантический поиск (рук. Жильцов Н.Г.)
Программный фреймворк для поддержания и анализа Q&A сайтов, предоставляющий средства анализа коллективных вопросно-ответных систем.
Презентация Лаборатории. Загрузить