Методы бикластеризации для анализа интернет-данных



Введение - часть 5


В соответствии с целью исследования были поставлены следующие задачи:

  • Выявить и описать методы бикластеризации, использующиеся в различных областях анализа данных, но не вошедшие в современные научные обзоры других исследователей;
  • Построить таксономию алгоритмов и моделей бикластеризации на основе хорошо структурированных критериев;
  • Привести обзор областей применения методов бикластеризации;
  • Составить перечень программных средств бикластеризации по областям применения;
  • Выбрать и реализовать некоторые из алгоритмов для проведения экспериментов на массивах Интернет-данных;
  • Показать пригодность методов бикластеризации для анализа Интернет-данных на экспериментальном материале;
  • В ряде случаев провести сравнительный анализ особенностей методов и установить связь между используемыми вычислительными моделями.
  • В рамках работы не оставлены без внимания системы поиска бикластеров, приводится их обзор. В частности, это системы

  • BicAT — область применения биоинформатика,
  • Concept Explorer, ToscanaJ, Galicia — сообщество ФАП,
  • Coron — Data Mining (ассоциативные правила и частые множества признаков),
  • Cluto, Metis — графовая кластеризация,
  • и Chaco — спектральная кластеризация.
  • Обзор состоит из введения, пяти разделов, заключения и списка литературы.

    В разделе  — "Бикластеризация" описана одноименная задача, указано на ее ключевую роль в анализе данных генетической экспрессии. Приводятся основания для классификации методов и моделей бикластеризации. Определяются типы бикластеров, их структура, стратегии поиска алгоритмов и области значений исходных данных. Построена решеточная таксономия методов бикластеризации.

    В разделе  — "Методы и модели бикластеризации" приводится обзор различных подходов анализа данных, учитывающих их объектно-признаковый характер. Даны основные определения теории решеток и ФАП. Показана связь ассоциативных правил с бикластерами определенного типа.

    Раздел  — "Программные средства бикластеризации" содержит краткий обзор программного обеспечения, которое призвано решать задачи бикластеризации в различных предметных областях.

    Раздел  — "Прикладные задачи" представляет собой краткий обзор основных областей применения алгоритмов бикластеризации с указанием библиографии и пригодных для решения соответсвующих задач методов.

    Раздел  — "Эксперименты на массивах Интернет-данных" описывает результаты применения изучаемых подходов к решению задач поиска документов-дубликатов в Интернете, выявления Интернет-сообществ пользователей на основе статистики посещаемости сайтов и рекомендаций в системах контекстной рекламы.




    Содержание  Назад  Вперед