Описание модели

Вычислительная модель предполагает, что существует только два возможных уровня генной экспрессии: изменение и отсутствие изменения для данного эксперимента. Множество из m экспериментов для n генов может быть представлено бинарной матрицей

, где ячейка

равна

, если ген

проявился для условия

, иначе 0. Бикластер

соответствует подмножеству генов

, которые проявились для всего подмножества условий

. Другими словами, пара

определяет подматрицу E для которой все элементы равны 1. Отметим, что согласно такому определению каждая ячейка

, имеющая значение 1, является бикластером. Однако такие кластеры тривиальны и не представляют особого интереса, поэтому мы рассматриваем только максимальные по вложению бикластеры, т.е. не содержащиеся ни в одном другом.

Определение 2.19

Пара

называется максимальным по вложению бикластером тогда и только тогда, когда (1)

и (2)

такой, что (a)

и (b)

Отметим, что такие максимальные по вложению бикластеры довольно давно и хорошо исследованы с точки зрения алгебраической структуры в рамках ФАП. Это подтверждает следующее утверждение.

Предложение 2.1

Определение максимального по вложению бикластера 2.19 и определение формального понятия 2.12 эквивалентны.

Благодаря утверждению 2.1, для бикластеров, предложенных в этой вычислительной модели, можно построить иерархию по отношению покрытия, графически представляющую собой диаграмму решетки формальных понятий.

возрастет. Знак

не зависит от действий на предыдущих шагах, что влечет естественное условие прекращения добавления элементов — изменение

становится положительным для любой внешней строки

(или столбца

).
Рассмотрим критерий аддитивной кластеризации (2.4) более подробно. Очевидно, что (2.5) можно переписать следующим образом.
В последнем выражении первое слагаемое — постоянная величена; раскрывая скобки под знаком суммирования во втором слагаемом приходим к новой записи критерия (2.5). Критерий (2.5) представляет собой разность постоянного члена

, где

(2.7)

Теперь для минимизации критерия (2.5) необходимо максимизировать (2.7). Критерий (2.7) позволяет лучше интерпретировать условие оптимальности, основанное на изменении знака (2.6) с отрицательного на положительный, когда