> Formations > Technologies numériques > Développement logiciel > Python > Formation Python pour le traitement du langage naturel (NLP) > Formations > Technologies numériques > Formation Python pour le traitement du langage naturel (NLP)
Nouvelle formation

Formation : Python pour le traitement du langage naturel (NLP)

Natural Language Processing avec les outils et bibliothèques Python

Python pour le traitement du langage naturel (NLP)

Natural Language Processing avec les outils et bibliothèques Python
Télécharger le programme Partager cette formation


Ce cours enseigne l'utilisation de Python pour le traitement du langage naturel : la préparation des données, la représentation de textes et leur modélisation. Le participant utilise des outils et bibliothèques Python pour effectuer des tâches courantes de NLP, met en œuvre et applique des modèles de NLP.


Inter
Intra
Sur mesure

Cours pratique

Réf. PTS
Prix : 1900 € H.T.
  3j - 21h00
Pauses-café et
déjeuners offerts




Ce cours enseigne l'utilisation de Python pour le traitement du langage naturel : la préparation des données, la représentation de textes et leur modélisation. Le participant utilise des outils et bibliothèques Python pour effectuer des tâches courantes de NLP, met en œuvre et applique des modèles de NLP.

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Utiliser python pour traiter des données textuelles
  • Choisir les outils et bibliothèques Python nécessaires au traitement
  • Mettre en place les différentes étapes de préprocessing et de vectorisation
  • Utiliser les techniques appropriées en fonction des objectifs : classification / topic modelling / analyse de sentiment
  • Appliquer et évaluer des modèles sur des données réelles

Prérequis
Connaissances de programmation en Python.

Programme de la formation

Environnement Python pour le NLP

  • L'environnement de développement Python / Anaconda / Jupyter Notebook.
  • Les principaux types de données : chaînes, booléennes, nombres, listes, tuples et dictionnaires.
  • Les structures de contrôles : les boucles for et while, le test if/elif/else.
  • Les fonctions : création, passage de paramètres, valeurs par défaut, arguments variables.
  • Numpy : vecteurs, matrices, slicing, concaténation.
  • Pandas : l’analyse de données tabulaires (CSV, Excel...), statistiques, pivots, jointures, filtres.
Travaux pratiques
Manipulation de Python dans un notebook Jupyter. Exercice de mise en pratique avec pandas et numpy.

Prétraitement des données textuelles

  • Identifier ce que sont des données textuelles et présentation des librairies spaCy et nltk.
  • Tokenisation des mots.
  • Suppression des stop-words, de la ponctuation et des éléments non essentiels à l’analyse.
  • Lemmatisation vs racinisation (stemming).
Travaux pratiques
Preprocessing sur des corpus de textes avec les 2 librairies, comparaison des résultats et des façons d’implémenter. Création de listes de stop-words, comparaison lemmatisation et de racinisation.

Extraction d'informations

  • Identification de la nature grammatical des mots à l’aide du Part Of Speech Tagging.
  • Identifier des personnes, lieux etc avec le Named Entity Recognition.
Travaux pratiques
Mettre en place le Part Of Speech Tagging et le Named Entity Recognition. Analyse des résultats, filtres sur certaines catégories grammaticales, sur les noms propres.

Représentation vectorielle des données textuelles

  • Bag of words.
  • Pondération tf-idf.
  • Approche avec des n-grams.
  • Les embeddings : word2vec, gloVe, fastTesxt..
Travaux pratiques
Transformation d’un corpus de texte en utilisant différentes approches : bag of words, tf-idf, word2vec, gloVe. Comparaison des vecteurs.

Machine learning sur des données textuelles

  • Rappels sur les étapes de construction d'un modèle prédictif.
  • Classification.
  • Analyse de sentiment.
  • Topic modelling.
Travaux pratiques
Modélisation en utilisant différents types de vecteurs (bag of words vs embeddings). Analyse de sentiment sur des tweets.

Procédures d'évaluation de modèles

  • Les techniques de rééchantillonnage en jeu d'apprentissage, de validation et de test.
  • Test de représentativité des données d'apprentissage.
  • Mesures de performance des modèles prédictifs.
  • Matrice de confusion.
Travaux pratiques
Construire et évaluer un modèle NLP de façon appliquée..


Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Parcours certifiants associés
Pour aller plus loin et renforcer votre employabilité, découvrez les parcours certifiants qui contiennent cette formation :

Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • France Travail sous réserve de l’acceptation de votre dossier par votre conseiller France Travail.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • France Travail sous réserve de l’acceptation de votre dossier par votre conseiller France Travail.

Avis clients
4,4 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
ELIANA W.
01/07/24
5 / 5

Par rapport à la documentation, il pourrait être intéressant d’avoir une bibliographie introductive avant le cours. Ainsi, nous pourrions mieux comprendre les sujets et avoir plus de pratique.
JEAN-CHRISTOPHE R.
01/07/24
4 / 5

Beaucoup trop de théorie, de concepts abstraits, de formules mathématiques pour expliquer comment fonctionnent tous les composants de de l’IA et du NLP. Un peu plus d’exercices et de mises en pratique en python auraient été les bienvenues. Peut-être n’avais-je pas les connaissances théoriques minimales nécessaires pour suivre cette formation. Peut-être la formation en elle-même est-elle trop dense et que 4 jours auraient été plus confortables que 3.
VICTOR H.
01/07/24
4 / 5

Enseignant dynamique qui sait bien vulgariserUn peu plus d’exercices pratiques serait souhaitable




Horaires
En présentiel, les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance