Durée: 12 mois
Rubrique: Ingénieur IA
Les forêts aléatoires sont une méthode flexible et intuitive pour les tâches de classification et de régression. Implémenter une forêt aléatoire et comprendre ses exemples d'usage peut offrir un atout puissant pour l'analyse de données.
Pour implémenter une forêt aléatoire en Python, on utilise généralement la bibliothèque scikitlearn
. Voici un exemple de base pour un problème de classification :
```python from sklearn.ensemble import RandomForestClassifier from sklearn.datasets import loadiris from sklearn.modelselection import traintestsplit from sklearn.metrics import accuracyscore
data = loadiris() X = data.data y = data.target
Xtrain, Xtest, ytrain, ytest = traintestsplit(X, y, testsize=0.3, randomstate=42)
clf = RandomForestClassifier(nestimators=100, randomstate=42)
clf.fit(Xtrain, ytrain)
ypred = clf.predict(Xtest)
accuracy = accuracyscore(ytest, ypred) print(f"Accuracy: {accuracy:.2f}") ```
iris
pour cet exemple.traintestsplit
.RandomForestClassifier
avec un certain nombre d’arbres (nestimators
).fit
pour entraîner le modèle sur les données d'entraînement.predict
pour faire des prédictions et accuracyscore
pour évaluer la performance.Les forêts aléatoires excellent dans les situations où il y a de nombreuses caractéristiques et des interactions complexes entre elles. Elles sont robustes aux valeurs aberrantes et aux données manquantes, et offrent une bonne performance générale sans nécessiter beaucoup de réglage de paramètres.