Techniques de Prétraitement du Texte

Durée: 0 h 36 min

Nombre de leçons: 21

Rubrique: Ingénieur IA

1. Introduction aux techniques de prétraitement

1.1. Importance du prétraitement dans le NLP

1.2. Objectifs du prétraitement du texte

2. Nettoyage du texte

2.1. Suppression des balises HTML et du bruit

2.2. Normalisation des textes (minuscules, suppression de la ponctuation)

3. Gestion des mots fréquents et rares

3.1. Stop words : définition et suppression

3.2. Traitement des mots rares et de leur impact

4. Tokenisation

4.1. Découpage en phrases et en mots

4.2. Méthodes et outils de tokenisation

5. Stemming et Lemmatisation

5.1. Différences et utilisations

5.2. Outils et techniques de lemmatisation

6. Extraction des caractéristiques

6.1. Techniques de vectorisation : Bag of Words, TF-IDF

6.2. Utilisation de vecteurs de mots pré-entraînés

7. Cas pratiques de prétraitement

7.1. Exemples d'application du prétraitement dans des projets de NLP

7.2. Astuces pour optimiser le prétraitement pour différents types de textes

Le coût de ce programme dépend de la formule d'abonnement choisie. Toutes les formules ont une durée de 12 mois calendaires.
Tous les programmes de formations sont validés par une ou plusieurs séries de QCM et/ou de Vrai Faux. En fonction du programme et du niveau choisi vous obtiendrez des évaluations différentes, de la plus facile à la plus difficile.
S'INSCRIRE / SE CONNECTER