Classification double

De testwiki
Version datée du 10 novembre 2024 à 13:36 par imported>DreZhsh (Balises HTML obsolètes)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

La Classification double ou Modèle:Citation étrangère est une technique d'exploration de données non-supervisée permettant de segmenter simultanément les lignes et les colonnes d'une matrice. Plus formellement[1], la définition de la classification double peut s'exprimer de la manière suivante (pour le type de classification par colonne) : Modèle:Centrer

Application

Le Modèle:Citation étrangère a été utilisé massivement en biologie[2] - par exemple dans l'analyse de l'expression génétique par Yizong Cheng et George M. Church[3] Modèle:, [4] -, mais aussi dans d'autres domaines tels que la compression d'image de synthèse[5], l'analyse médicale - par exemple pour l'étude des traitements de l'épilepsie[6] par stimulation vagale, la caractérisation d'émetteurs de pourriels (Modèle:Citation étrangère)[7], l'analyse du mouvement[8], l'analyse des termes publicitaires sur internet[9], ...

Types

Dans les différents algorithmes qui utilisent la classification double, on trouve différents types de bicluster :

a) Modèle:Citation étrangère à valeurs constantes
7,6 7,6 7,6 7,6 7,6
7,6 7,6 7,6 7,6 7,6
7,6 7,6 7,6 7,6 7,6
7,6 7,6 7,6 7,6 7,6
7,6 7,6 7,6 7,6 7,6
b)Modèle:Citation étrangère à valeurs constantes en lignes
1,2 1,2 1,2 1,2 1,2
2,1 2,1 2,1 2,1 2,1
3,2 3,2 3,2 3,2 3,2
4,1 4,1 4,1 4,1 4,1
4,2 4,2 4,2 4,2 4,2
c)Modèle:Citation étrangère à valeurs constantes en colonnes
1,0 2,0 3,0 4,0 5,0
1,0 2,0 3,0 4,0 5,0
1,0 2,0 3,0 4,0 5,0
1,0 2,0 3,0 4,0 5,0
1,0 2,0 3,0 4,0 5,0
d) Modèle:Citation étrangère à valeurs cohérentes (additives)
1.0 4.0 5.0 0.0 1.5
4.0 7.0 8.0 3.0 4.5
3.0 6.0 7.0 2.0 3.5
5.0 8.0 9.0 4.0 5.5
2.0 5.0 6.0 1.0 2.5
e)Modèle:Citation étrangère à valeurs cohérentes (multiplicative)
1.0 0.5 2.0 0.2 0.8
2.0 1.0 4.0 0.4 1.6
3.0 1.5 6.0 0.6 2.4
4.0 2.0 8.0 0.8 3.2
5.0 2.5 10.0 1.0 4.0

En d) la notion d'additivité se comprend comme ceci : +3,1,+2,3 en colonnes, +3,+1,5,+1,5 en lignes; en e) le motif est 12,*4,110,*4 en colonnes et *2,*1.5,43,54.

Algorithmes

Le but des algorithmes de classification double est de trouver, s'il existe, le plus grand Modèle:Citation étrangère contenu dans une matrice, en maximisant une fonction objectif. On peut prendre comme fonction, avec les notations adoptées ci-dessus : Modèle:Centrer

De nombreux algorithmes ont été développés notamment par la bio-informatique, dont : Modèle:Citation étrangère, CTWC (Modèle:Citation étrangère) , ITWC (Modèle:Citation étrangère), δ-bicluster, δ-pCluster, δ-pattern, FLOC, OPC, Modèle:Citation étrangère, OPSMs (Modèle:Citation étrangère), Gibbs, SAMBA (Modèle:Citation étrangère)[10], RoBA (Modèle:Citation étrangère), Modèle:Citation étrangère[11] , cMonkey[12], PRMs, DCC, LEB (Modèle:Citation étrangère), QUBIC (Modèle:Citation étrangère), BCCA (Modèle:Citation étrangère), FABIA (Modèle:Citation étrangère)[13]. Certains de ces algorithmes ont été comparés par Doruk Bozda, Ashwin S. Kumar et Umit V. Catalyurek[14] en termes de type de motifs recherchés.
Le package Modèle:Citation étrangère[15] propose un ensemble d'outils pour la classification double dans le logiciel R.

Articles connexes

Notes et références

Modèle:Traduction/Référence Modèle:Références

Modèle:Portail

  1. Tran Trang, Nguyen Cam Chi, Hoang Ngoc Minh,Bi-clustering des données de biopuces par les arbres pondérés de plus long préfixe - Chapitre 1 Introduction
  2. Sara C. Madeira, Arlindo L. Oliveira,Biclustering Biological Data Analysis
  3. Modèle:Article
  4. Yizong Cheng, George M. Church Biclustering of Expression Data
  5. Xin Sun, Qiming Hou,Zhong Ren, Kun Zhou, Baining Guo,Radiance Transfer Biclustering for Real-time All-frequency Bi-scale Rendering
  6. Stanislav Busygin,Nikita Boyko, Panos M. Pardalos,Michael Bewernitz, Georges Ghacibeh,Biclustering EEG data from epileptic patients treated with vagus nerve stimulation
  7. Kevin S. Xu, Mark Kliger, Alfred O. Hero III, Identifying Spammers by Their Resource Usage Patterns
  8. Keren Erez, Jacob Goldberger, Ronen Sosnik, Moshe Shemesh, Susan Rothstein,Moshe Abeles, Analyzing Movement Trajectories Using a Markov Bi-Clustering Method
  9. Dmitry I. Ignatov, Concept-based Biclustering for Internet Advertisement
  10. Modèle:Article
  11. Ahsan Abdullah, Data Mining Using the Crossing Minimization Paradigm
  12. Modèle:Article
  13. Modèle:Article
  14. Doruk Bozda, Ashwin S. Kumar et Umit V. Catalyurek, Comparative Analysis of Biclustering Algorithms
  15. Sebastian Kaiser, Friedrich Leisch, A Toolbox for Bicluster Analysis in R