“Représentation du réel : Data, embedding et espace latent” (épisode 9)
“Les données sont au centre du machine learning, pour le meilleur et parfois pour le pire ! À travers cette nouvelle séquence, nous allons explorer la complexité des données et leur capacité (ou non) à décrire le monde réel. Les données brutes sont souvent décrites dans des espaces qui sont peu pratiques pour l’apprentissage. Il est souvent nécessaire que nos modèles transforment les données pour pouvoir apprendre les motifs qui vont les aider à réaliser leur tâche. Cette transformation va être faite avec des technique de plongement ou embedding qui vont permettre de définir des espaces où les paramètres importants pour la tâches sont mieux décrits. C’est la notion d’espace latent.”
NoteToDo this week
Watch the video “Représentation du réel : Data, embedding et espace latent” (épisode 9) before 2025-12-12.
Course
Course webpage: https://fidle.cnrs.fr/w3/archives/2024-2025/09-Data-LatentSpaces.html
Video course: “Représentation du réel : Data, embedding et espace latent” (épisode 9) (2h course)
Outline
- Pourquoi ces données sont-elles aussi importantes ?
- Biaisées, erronées, manquantes ou trop nombreuses, les données sont facilement infernales…
- Comment peuvent-elles représenter et décrire la réalité du monde physique ?
- Comment les espaces latents et les techniques d’embedding aident les modèles à mieux apprendre ?
Tutorial/practical
Sentiment analysis with word embedding, using Keras3/PyTorch
- K3IMDB1 - Sentiment analysis with hot-one encoding: A basic example of sentiment analysis with sparse encoding, using a dataset from Internet Movie Database (IMDB), using Keras 3 on PyTorch
- K3IMDB2 - Sentiment analysis with text embedding: A very classical example of word embedding with a dataset from Internet Movie Database (IMDB), using Keras 3 on PyTorch
- K3IMDB3 - Reload and reuse a saved model: Retrieving a saved model to perform a sentiment analysis (movie review), using Keras 3 and PyTorch
- K3IMDB4 - Reload embedded vectors: Retrieving embedded vectors from our trained model, using Keras 3 and PyTorch
- K3IMDB5 - Sentiment analysis with a RNN network: Still the same problem, but with a network combining embedding and RNN, using Keras 3 and PyTorch
Time series with Recurrent Neural Network (RNN), using Keras3/PyTorch
- K3LADYB1 - Prediction of a 2D trajectory via RNN: Artificial dataset generation and prediction attempt via a recurrent network, using Keras 3 and PyTorch