Методы бикластеризации для анализа интернет-данных


Поиск сходства Интернет-документов с помощью частых замкнутых множеств признаков. - часть 6


/p>

(2) Результаты работы метода “минимальные элементы в n перестановках”.


FPmax

All Pairs of Duplicates Unique pairs of duplicates Common pairs

Input

Threshold ROMIP Test ROMIP Test

m_1_20_s_100_n1-3.txt

100 16666 4409 14616 2359 2050
m_1_20_s_100_n1-3.txt 95 16666 5764 13887 2985 2779
m_1_20_s_100_n1-3.txt 90 16666 7601 12790 3725 3876
m_1_20_s_100_n1-3.txt 85 16666 9802 11763 4899 4903
m_1_20_s_100_n1-6.txt 100 33267 13266 28089 8088 5178
m_1_20_s_100_n1-6.txt 95 33267 15439 26802 8974 6465
m_1_20_s_100_n1-6.txt 90 33267 19393 24216 10342 9051
m_1_20_s_100_n1-12.txt 100 105570 21866 95223 11519 10347
m_1_20_s_100_n1-12.txt 95 105570 25457 93000 12887 12570

(3) Вычисление образов документов для методов "

минимальных элементов в перестановке" и метода "минимальные элементы в

перестановках".

Subcollection

Number of documents Method Time elapsed, sec Shingling parameter

length of shingle image size

narod.1-3.xml

26077 n-min 312 20 100
narod.1-6.xml 53539 n-min 622 20 100
narod.1-12.xml 110997 n-min 1360 20 100
narod.1-24.xml 223804 n-min 2435 20 100

narod.1-3.xml

26077 min in n 924 20 100
narod.1-6.xml 53539 min in n 1905 20 100
narod.1-12.xml 110997 min in n 3617 20 100
narod.1-24.xml 223804 min in n 7501 20 100

narod.1-3.xml

26077 n-min 277 10 100
narod.1-6.xml 53539 n-min 563 10 100
narod.1-12.xml 110997 n-min 1118 10 100
narod.1-24.xml 223804 n-min 2348 10 100

narod.1-3.xml

110997 n-min 315 10 120
narod.1-6.xml 223804 n-min 622 10 120

narod.1-3.xml

110997 n-min 388 10 150
narod.1-6.xml 223804 n-min 745 10 150

narod.1-6.xml

223804 n-min 1312 10 180

narod.1-6.xml

223804 n-min 2585 10 200

narod.1-6.xml

223804 n-min 541 5 100
narod.1-6.xml 223804 n-min 611 15 100

narod.1-6.xml

223804 min in n 2101 10 200
<


- Начало -  - Назад -  - Вперед -



Книжный магазин