Методы бикластеризации для анализа интернет-данных


Описание модели


Вычислительная модель предполагает, что существует только два возможных уровня генной экспрессии: изменение и отсутствие изменения для данного эксперимента. Множество из m экспериментов для n генов может быть представлено бинарной матрицей

, где ячейка

равна

, если ген

проявился для условия

, иначе 0. Бикластер

соответствует подмножеству генов

, которые проявились для всего подмножества условий
. Другими словами, пара

определяет подматрицу E для которой все элементы равны 1. Отметим, что согласно такому определению каждая ячейка

, имеющая значение 1, является бикластером. Однако такие кластеры тривиальны и не представляют особого интереса, поэтому мы рассматриваем только максимальные по вложению бикластеры, т.е. не содержащиеся ни в одном другом.

Определение 2.19  

Пара

называется максимальным по вложению бикластером тогда и только тогда, когда (1)

и (2)

такой, что (a)

и (b)

.

Отметим, что такие максимальные по вложению бикластеры довольно давно и хорошо исследованы с точки зрения алгебраической структуры в рамках ФАП. Это подтверждает следующее утверждение.

Предложение 2.1  

Определение максимального по вложению бикластера  2.19 и определение формального понятия  2.12 эквивалентны.

Благодаря утверждению 2.1, для бикластеров, предложенных в этой вычислительной модели, можно построить иерархию по отношению покрытия, графически представляющую собой диаграмму решетки формальных понятий.




- Начало -  - Назад -  - Вперед -