Classification double
La Classification double ou Modèle:Citation étrangère est une technique d'exploration de données non-supervisée permettant de segmenter simultanément les lignes et les colonnes d'une matrice. Plus formellement[1], la définition de la classification double peut s'exprimer de la manière suivante (pour le type de classification par colonne) : Modèle:Centrer
Application
Le Modèle:Citation étrangère a été utilisé massivement en biologie[2] - par exemple dans l'analyse de l'expression génétique par Yizong Cheng et George M. Church[3] Modèle:, [4] -, mais aussi dans d'autres domaines tels que la compression d'image de synthèse[5], l'analyse médicale - par exemple pour l'étude des traitements de l'épilepsie[6] par stimulation vagale, la caractérisation d'émetteurs de pourriels (Modèle:Citation étrangère)[7], l'analyse du mouvement[8], l'analyse des termes publicitaires sur internet[9], ...
Types
Dans les différents algorithmes qui utilisent la classification double, on trouve différents types de bicluster :
- Modèle:Citation étrangère à valeurs constantes (a),
- Modèle:Citation étrangère à valeurs constantes en lignes (b) ou en colonnes (c),
- Modèle:Citation étrangère à valeurs cohérentes (d, e).
|
|
|
|
|
En d) la notion d'additivité se comprend comme ceci : en colonnes, en lignes; en e) le motif est en colonnes et .
Algorithmes
Le but des algorithmes de classification double est de trouver, s'il existe, le plus grand Modèle:Citation étrangère contenu dans une matrice, en maximisant une fonction objectif. On peut prendre comme fonction, avec les notations adoptées ci-dessus : Modèle:Centrer
De nombreux algorithmes ont été développés notamment par la bio-informatique, dont :
Modèle:Citation étrangère, CTWC (Modèle:Citation étrangère) , ITWC (Modèle:Citation étrangère), δ-bicluster, δ-pCluster, δ-pattern, FLOC, OPC, Modèle:Citation étrangère, OPSMs (Modèle:Citation étrangère), Gibbs, SAMBA (Modèle:Citation étrangère)[10], RoBA (Modèle:Citation étrangère), Modèle:Citation étrangère[11]
, cMonkey[12], PRMs, DCC, LEB (Modèle:Citation étrangère), QUBIC (Modèle:Citation étrangère), BCCA (Modèle:Citation étrangère), FABIA (Modèle:Citation étrangère)[13]. Certains de ces algorithmes ont été comparés par Doruk Bozda, Ashwin S. Kumar et Umit V. Catalyurek[14] en termes de type de motifs recherchés.
Le package Modèle:Citation étrangère[15] propose un ensemble d'outils pour la classification double dans le logiciel R.
Articles connexes
Notes et références
Modèle:Traduction/Référence Modèle:Références
- ↑ Tran Trang, Nguyen Cam Chi, Hoang Ngoc Minh,Bi-clustering des données de biopuces par les arbres pondérés de plus long préfixe - Chapitre 1 Introduction
- ↑ Sara C. Madeira, Arlindo L. Oliveira,Biclustering Biological Data Analysis
- ↑ Modèle:Article
- ↑ Yizong Cheng, George M. Church Biclustering of Expression Data
- ↑ Xin Sun, Qiming Hou,Zhong Ren, Kun Zhou, Baining Guo,Radiance Transfer Biclustering for Real-time All-frequency Bi-scale Rendering
- ↑ Stanislav Busygin,Nikita Boyko, Panos M. Pardalos,Michael Bewernitz, Georges Ghacibeh,Biclustering EEG data from epileptic patients treated with vagus nerve stimulation
- ↑ Kevin S. Xu, Mark Kliger, Alfred O. Hero III, Identifying Spammers by Their Resource Usage Patterns
- ↑ Keren Erez, Jacob Goldberger, Ronen Sosnik, Moshe Shemesh, Susan Rothstein,Moshe Abeles, Analyzing Movement Trajectories Using a Markov Bi-Clustering Method
- ↑ Dmitry I. Ignatov, Concept-based Biclustering for Internet Advertisement
- ↑ Modèle:Article
- ↑ Ahsan Abdullah, Data Mining Using the Crossing Minimization Paradigm
- ↑ Modèle:Article
- ↑ Modèle:Article
- ↑ Doruk Bozda, Ashwin S. Kumar et Umit V. Catalyurek, Comparative Analysis of Biclustering Algorithms
- ↑ Sebastian Kaiser, Friedrich Leisch, A Toolbox for Bicluster Analysis in R