Capitole du Libre 2022

De l'Intelligence Artificielle au service de la transparence alimentaire chez OpenFoodFacts
20/11/2022 , A203

Open Food Facts est la plus grande base de données alimentaires libre au monde, une sorte de Wikipedia de l’alimentation. Chaque jour, des milliers de fiches produits et de photos nous sont envoyées par des consommateurs, des producteurs et d'autres organisations afin d'alimenter la base. Dans le but de traiter toutes ces informations et d'en retirer le maximum d'informations possibles sur le produit, Open Food Facts a créé un outil de machine learning, Robotoff.


Robotoff est un service qui gère les mises à jour de la base de données d'Open Food Facts et génère des prédictions sur la base de photos et de fiches de produits reçues de l'extérieur.

Lorsqu’un contributeur ajoute une information à propos d’un produit à la base de données, via une photo, un texte ou autre, Robotoff exécute différentes tâches pour déterminer si possible la catégorie du produit, son poids, sa marque, sa date d'expiration, les labels dont il est pourvu mais aussi la suppression d'images inappropriées détectées sur la photo, la rotation de photos mal cadrées ou la correction de fautes d'orthographe dans les ingrédients.

Des modèles de Computer Vision sont utilisés pour extraire les chaînes de caractères des images. Celles-ci sont injectées dans des algorithmes pour détecter des patterns et catégoriser le produit en question. En plus de cela, on utilise des modèles de Machine Learning pour extraire des objets des images en question.Un modèle s’attache par exemple à détecter les logos. Ces logos détectés sont plongés dans un espace vectoriel en utilisant un modèle pré-entraîné. On utilise alors une méthode approchée des plus proches voisins pour les classifier.

Durant la conférence nous approfondirons tous ces points afin que vous compreniez le fonctionnement de cet outil clé d’Open Food Facts.

Après une classe préparatoire au lycée Pierre de Fermat de Toulouse et deux années d'école d'ingénieur à CentraleSupélec, je réalise une césure durant l'année 2022-2023. J'ai choisi de consacrer les six premiers mois de cette année à un stage de développement informatique axé sur du Machine Learning chez Open Food Facts.