Методы бикластеризации для анализа интернет-данных



Бюро переводов технических текстов смотрите на www.monograd.com. | КОРОБКА ОТБОРА МОЩНОСТИ МП... |

Постановка задачи и основные определения - часть 2


В отличие от методов кластеризации, алгоритмы бикластеризации находят группы генов, проявляющих сходную активность для некоторого подмножества экспериментальных условий. Поэтому подход бикластеризации позволяет успешно решать задачи, в которых возникает одна или сразу несколько таких ситуаций, как:

  • только небольшое множество генов, участвующих в клеточном процессе, представляют интерес;
  • интересующий исследователя клеточный процесс происходит только при некотором подмножестве условий;
  • один ген может участвовать во многих взаимодействиях, которые как могут быть совместно активными, так и не могут для всех условий.
  • Поэтому предлагаемые методы бикластеризации должны следовать требованиям, перечисленным ниже.

  • Кластер генов необходимо определять в соответствии только подмножеству условий.

  • Кластер условий необходимо определять в соответствии только подмножеству генов.

  • Кластеры не должны быть исключающими и/или полными (гены или условия могут принадлежать ко многим кластерам или вообще ни к одному, а также могуть быть сгруппированы по подмножеству условий или генов соответственно).
  • В качестве дополнительного требования можно отметить робастность, понимаемую как наличие мощного (с точки зрения сложности процесса генетической регуляции) инструмента анализа и устойчивость к шуму в исходных данных.

    Фактически, мы будем работать с матрицей размера n на m, элементы которой в общем случае представляют собой действительные числа. Абстрагируясь от задач анализа генетических данных мы будем считать, что строкам матрицы соответствуют некоторые объекты, а столбцам — признаки. Пусть дана матрица

    ,

    — строк,

    — число столбцов,

    — множество строк,

    — множество столбцов. Будем использовать

    для обозначения матрицы

    . Если

    и

    подмножества строк и столбцов соответственно, то

    определяет подматрицу

    матрицы

    .

    Кластер строк есть подматрица матрицы

    вида

    , для которой подмножество строк проявляет "сходное поведение" вдоль всего множества столбцов.




    Содержание  Назад  Вперед