Projet de Fin d'Étude

Au programme…

Introduction

Objectifs

Recherches & Réalisations

Ouverture

Introduction

Mise en contexte

Démocratisation vulgarisation

Recherche de nouveaux contenus

Système de recommandations

Problématique

Conception d'une plateforme

Partage de contenus culturels de qualité

Open-Source

Collaborative

Plateforme cible

Plateforme cible

Points clefs

Graph de connaissance

Recommandations

Classification

Fonctionnalités

Recherche

Profil utilisateur

Soumission

Modération communautaire

Les composantes

La plateforme web

Les algorithmes de gestion des contenus

Plateformes Existantes

Plateforme Existantes - Reddit

Reddit

Points Communs

  • Publication par tous les utilisateurs
  • Approbation de la communauté downvotes / upvotes
  • Interaction communautaire commentaires

Limites

  • Peu de vision sur les anciens contenus
  • Peu de catégories
  • Aucun moyen de limiter le temps de visionnage

Plateforme Existantes - Arte.tv

Arte.tv

Points Communs

  • Contenu de qualité
  • Limite sur la durée des vidéos

Limites

  • Pas d'interaction communautaire
  • Très peu de catégorisation
  • Limite de filtrages

Recherches & réalisations

Plateforme Web

Choix technologiques

Ruby On Rails

  • Facilité d'utilisation
  • Performance
  • Apprécié par la communauté

Contributions

Intégration d'étudiants en Classe Préparatoire

Challenges

  • Amélioration de la méthode AGILE
  • Véritable projet communautaire
  • Avis extérieur

Conséquences

  • Temps perdu

Graphe de connaissance

Réseaux de neurones

Multinoulli

SQL

  • Construction d'un graph à partir de Wikipédia
    • Scrapping
    • SQL dump
  • Limites :
    • Mise à jour de graph
    • Temps de traitement
    • Lien contenu/données

Triplet RDF

(sujet, prédicat, objet)
Internationalized Resource Identifier (IRIs)
Des ontologies
Exemple de Graph RDF

MediaOnt

Ontologie pour la description des médias

SPARQL

NLP & Classification

Préparation de la donnée

TF/IDF

Named Entity Recognition

Préparation de la donnée

TF/IDF

Term Frequency / Inverse Document Frequency

Résultats peu concluants

Named Entity Recognition

Unitex

robuste

généralisable

Stanford NER

Conditional Random Field

Texte

Pierre de Coubertin est connu pour avoir fondé les jeux olympiques modernes, basés sur des valeurs qu'il défendait par dessus tout

Reconnaissance

Pierre de Coubertin

Recherche

Limitation à des classes de notre graphe

Et ensuite

Endpoint SPARQL

Stabilité

Ressource

Recommandation

Les entités ayant le plus de liens avec les articles précédents

Conclusion

Conclusion

Base du projet

  • Récupération de données (YouTube, Arte, Reddit,…)
  • Base de la plateforme (base de donnée et points d'API)
  • Équipe de développement et processus

Recherche technologiques abouties

Ouverture