Explore projects
-
Updated
-
Updated
-
Updated
-
Projet de clustering non supervisé réalisé dans le cadre de l’UE3. L’objectif est de comparer plusieurs méthodes de segmentation (KMeans, CAH, DBSCAN, OPTICS) sur différents jeux de données, en étudiant leur comportement selon la forme des clusters, la présence de bruit et les hypothèses sous-jacentes.
Updated -
Updated
-
Updated
-
Updated
-
Updated
-
Mini-projet de gestion des risques : calcul de VaR (99%) et Expected Shortfall (97.5%) + backtesting sur 1 an (méthodes paramétrique normale & empirique).
Updated -
Ce projet s’inscrit dans la matière Big Data et met en pratique les principes fondamentaux du traitement distribué avec Apache Spark. Il repose sur l’étude de l’architecture de Spark, du modèle RDD, des transformations et des actions permettant de traiter efficacement des volumes de données importants. Le dépôt regroupe les exercices et implémentations réalisés pour illustrer ces concepts et comprendre le fonctionnement d’un moteur de calcul distribué.
Updated -
Mini-projet SEP092 : développement d’une application statistique (Lotka–Volterra) modélisant l’évolution d’une population, exposée via une API REST, avec stockage des données et déploiement conteneurisé.
Updated -
Projet SAS d’analyse de films en croisant MovieLens (ratings, movies, tags, links) et IMDb (title.ratings). Après nettoyage et jointure via movieId puis imdbId/tconst, on construit une table finale pour comparer popularité (volume de notes) et qualité (note moyenne). Livrables : KPI par genre/film et visuels (top, distributions, magic quadrant).
Updated -
Ce projet à pour objectif de répertorier un ensemble de modèles de régression et de classification pour simplifier les analyses faites dans le futur. L'objet final sera un package python qui décide quel modèle sera le plus pertinent face à des données et d'autres caractéristiques
Updated -
Updated
-
Updated
-
Updated
-
Updated
-
Updated
-
Updated