Learnr, pour apprendre autrement

Table des matières

1. Régression linéaire
1.1. Principes et mathématiques de base
1.2. Implémentation et exemples d'usage
1.3. Interprétation des résultats
2. Régression logistique
2.1. Principes et mathématiques de base
2.2. Implémentation et exemples d'usage
2.3. Interprétation des résultats
3. Arbres de décision
3.1. Principes et construction d'un arbre
3.2. Implémentation et exemples d'usage
3.3. Avantages et limites
4. Forêts aléatoires
4.1. Principes et fonctionnement
4.2. Implémentation et exemples d'usage
4.3. Avantages et limites
5. Machines à vecteurs de support (SVM)
5.1. Principes et mathématiques de base
5.2. Implémentation et exemples d'usage
5.3. Avantages et limites
6. k-plus proches voisins (k-NN)
6.1. Principes et fonctionnement
6.2. Implémentation et exemples d'usage
6.3. Avantages et limites

Avantages et limites

5.3. Avantages et limites des Machines à Vecteurs de Support (SVM)

Avantages des Machines à Vecteurs de Support

Efficacité en haute dimensionnalité : Les SVM sont particulièrement efficaces dans les espaces de haute dimension. De plus, ils restent efficaces même dans des situations où le nombre de dimensions est supérieur au nombre d'échantillons.
Bonne performance avec un nombre limité d'échantillons : En raison de leur capacité à maximiser les marges entre les classes, les SVM peuvent obtenir d'excellents résultats même avec des jeux de données limités.
Flexibilité grâce aux noyaux : Les SVM peuvent utiliser différentes fonctions noyaux (linéaires, polynomiaux, radiaux, etc.) pour créer des frontières de décision non linéaires. Cela leur permet de s'adapter à des problèmes complexes sans nécessiter une transformation explicite des données.
Gestion efficace des cas complexes : Les SVM sont robustes face aux problèmes de classification complexes où les classes ne sont pas facilement séparables.

Limites des Machines à Vecteurs de Support

Complexité de l'optimisation : La formation d'un SVM implique la résolution d'un problème d'optimisation quadratique complexe, qui peut être computationalement intense pour des jeux de données très volumineux.
Sensibilité aux données bruitées : Les SVM peuvent être sensibles aux bruits et aux données aberrantes (outliers). Des points incorrectement étiquetés peuvent fortement influer sur le modèle final.
Choix des paramètres et du noyau : La performance des SVM dépend beaucoup du choix des paramètres (comme le paramètre de régularisation C) et du noyau. Trouver les bons paramètres peut nécessiter des efforts considérables en termes de validation croisée et d'essaiserreurs.
Interprétabilité limitée : Contrairement à des modèles comme les arbres de décision, les SVM sont souvent considérés comme des "boîtes noires", car il est difficile d'interpréter le modèle final et de comprendre comment les décisions sont prises.

Ces avantages et limites doivent être pris en compte lors du choix d’utiliser un SVM pour un problème de classification. Ils offrent une grande flexibilité et des performances robustes dans de nombreux cas, mais requièrent également un soin particulier dans le prétraitement des données et le choix des hyperparamètres.

Algorithmes de Machine Learning courants

Table des matières

Avantages et limites

5.3. Avantages et limites des Machines à Vecteurs de Support (SVM)

Avantages des Machines à Vecteurs de Support

Limites des Machines à Vecteurs de Support