Projet de Visualisation de Données

Description

Ce projet a pour objectif de visualiser des données en 2D. Il offre la possibilité d'afficher des points sur un plan 2D, de sélectionner les axes de projection, de distinguer les catégories à l'aide de couleurs, de différencier les points ajoutés par leur forme, et de classifier les points selon leurs caractéristiques.

Fonctionnalités

Visualisation des points en 2D
Choix des axes de projection
Différenciation des points selon leurs catégories par la couleur et la forme
Ajout de nouveaux points
Classification des points
Modèle MVC avec affichage en multiples fenêtres (Menu >- Affichage > Nouvelle fenêtre)
Chargement de données depuis un fichier CSV
Sauvegarde du graphique en image
Visualisation avec une carte de chaleur
Validation croisée pour évaluer la robustesse de l'algorithme de classification
Test simple de robustesse à partir d'un fichier de test
à venir :
pondération des attributs

Installation

Pour installer le projet, vous pouvez cloner le dépôt ou télécharger la dernière version disponible.

Prérequis

Assurez-vous que Maven est installé sur votre machine pour exécuter le projet. Il est recommandé d'utiliser openjdk 21 pour une meilleure compatibilité.

Utilisation

Pour exécuter le projet :

Depuis un terminal :

Lancez le fichier run.sh situé dans le répertoire Application.

Depuis IntelliJ :

Créez une nouvelle configuration de lancement en sélectionnant Maven.

Utilisez la commande suivante dans les options de lancement : clean javafx:run

Exécution du fichier JAR :

Les .jar des différentes versions sont disponibles dans la section Deploy > Releases. https://gitlab.univ-lille.fr/sae302/2024/H2_SAE3.3/-/releases Il vous suffit de cliquer pour la release souhaitée sur le lien app.jar en dessous de Assets. Vous trouverez le fichier artifacts.zip contenant le .jar dans le dossier Application/target.

Utilisez la commande suivante dans un terminal en remplaçant /chemin/ par le chemin vers votre fichier dossier decompressé artifacts.zip :

java -jar /chemin/artifacts/Application/target/VisualisationDonnees-1.0-SNAPSHOT.jar

Comment utiliser un nouveau type de données ?

Pour utiliser un nouveau type de données, il suffit de créer une nouvelle classe étendant la classe Data. Il faut aussi que la classe soit dans le package fr.univlille.s3.S302.model.data. Ensuite, dans un bloc static, il convient d'appeler la fonction registerHeader de DataLoader, en y mettant le header de votre fichier CSV (sans le retour à la ligne).

Il ne vous reste plus qu'à déclarer les attributs de votre classe en suivant les conventions d'OpenCSV. Si, pour un attribut, les valeurs entre elles n'ont pas d'ordre spécifique, il suffit d'ajouter l'annotation @HasNoOrder devant la déclaration de l'attribut. Ainsi, la distance entre deux points sera calculée en fonction de l'égalité des attributs.

Votre classe est maintenant prête à être utilisée dans le projet.

Il n'y a pas besoin d'indiquer quels champs sont susceptibles d'être des champs de classification, notre implémentation permet que tous les champs puissent être utilisés pour la classification.

Fonctionnement

Data

La classe Data est une classe abstraite qui permet à toute classe en héritant d'être traitée par le modèle. Le cœur de cette classe réside dans la fonction makeData, qui parcourt les attributs de la classe implémentant Data. Cette fonction attribue une valeur numérique à chaque valeur d'attribut en utilisant la fonction getIntValue. Grâce à cela, chaque attribut de la classe peut être représenté sous forme numérique.

La fonction getIntValue complète la map attributMap, où chaque attribut est associé à une liste de valeurs (les valeurs originales). Les indices de cette liste jouent le rôle de valeurs numériques pour représenter la valeur originale de l'attribut.

Autres Maps

La classe contient également plusieurs autres maps dont le principal objectif est de réduire le nombre de calculs nécessaires pour déterminer les distances entre les points :

attributesNumericalValueToAttributesOriginalMap : Permet de retrouver l'attribut original à partir de la valeur numérique.
dataTypesMap : Permet de retrouver le type de donnée de l'attribut.
fieldsMap : Permet de retrouver l'objet de classe Field associé au nom de l'attribut.

L'application intègre tous les attributs implémentant l'interface Comparable, ce qui permet de les ranger selon un ordre dans attributMap. Pour les attributs n'ayant pas d'ordre spécifique, un traitement supplémentaire est effectué pour les transformer en valeurs numériques.

Gestion des Attributs Sans Ordre Spécifique

Lors de la création d'une classe implémentant Data, il est nécessaire de définir les attributs qui sont sans ordre spécifique. Pour ce faire, il suffit d'ajouter l'annotation @HasNoOrder. Ces attributs sont d'abord traités comme les autres, et la fonction leur attribue une valeur numérique différente.

Lors du calcul de la distance entre deux points, un traitement supplémentaire est appliqué pour transformer ces attributs en valeurs numériques. La valeur numérique sera ajustée en fonction de l'égalité des attributs : si les attributs sont égaux, la valeur numérique sera 0 ; sinon, l'un des attributs sera noté 1 et l'autre 0. Ainsi, la distance ne dépendra que de leur égalité.

DataManager

design pattern : Singleton

La classe DataManager permet de gérer les données. Cette classe a comme attribut, principalement, une liste de Data dataList provenant d'une source de données (ici un csv). Et une autre liste de Data qui sont elles des données ajoutées au model ultérieurement UserData.

Cette classe est munie de tout un set de fonctions permettant de manipuler les données, les ajouter, les supprimer, les classifier, les charger, etc.

Pour permettre à toutes les classes de partager le meme DataManager, on a utilisé le design pattern Singleton.

La classe delegue le chargement et la création des objets Data a la classe DataLoader.

DataLoader

La classe DataLoader permet de charger les données depuis un fichier CSV.

Elle utilise la librairie OpenCSV pour lire les données du fichier CSV et les convertir en objets Data.

Avant de charger les données avec OpenCSV, DataLoader doit être configuré pour reconnaître les classes Data qui seront utilisées pour représenter les données.

Pour cela, DataLoader utilise la méthode statique registerHeader pour enregistrer les entêtes des colonnes des fichiers CSV.

La fonction getClassFromHeader permet de récupérer la classe Data correspondant à un entête CSV. Il ne reste plus qu'à appeler la fonction csvToList pour charger les données.

Repartition des Taches

La répartition des tâches s'est faite avec l'issue board de Gitlab ici, nous avons d'abord décidé quelles issues créer, puis chacun a placé les issues qu'il voulait faire dans la colonne "À faire".

Thomas :

Tests

Vincent :

Implémentation K-NN
Classification des données
Forme et couleurs des points

Mathys :

Robustesse
Ajout Points

Adrien :

UI (fxml)
Distance & normalisation
Choix dans l'UI des distances
Choix de l'algo de classification
Sauvegarde du graphique
Chargment CSV
Optimisation

Benjamin :

Choix de l'attribut de classification
Choix du nombre de voisins
Validation croisée
Généricité de l'application*
HeatView
MultiThreading
Implémentation Observer/Observable
Choix des axes de projection
Visualisation des points
Rapport de Dev Efficace

Name		Name	Last commit message	Last commit date
Latest commit History 60 Commits
Application		Application
.gitlab-ci.yml		.gitlab-ci.yml
Dossier d'analyse.html		Dossier d'analyse.html
Dossier d'analyse.md		Dossier d'analyse.md
Dossier d'analyse.pdf		Dossier d'analyse.pdf
README.md		README.md
Rapport dev efficace.pdf		Rapport dev efficace.pdf
Tableaux Robustesse Iris meme fichier.txt		Tableaux Robustesse Iris meme fichier.txt
Tableaux Robustesse Pokemon meme fichier.txt		Tableaux Robustesse Pokemon meme fichier.txt
Tableaux Validation Croisée Iris Variété.txt		Tableaux Validation Croisée Iris Variété.txt
Tableaux Validation Croisée Pokemon IsLegendary.txt		Tableaux Validation Croisée Pokemon IsLegendary.txt
Tableaux Validation Croisée Pokemon Type1.txt		Tableaux Validation Croisée Pokemon Type1.txt
devEff.md		devEff.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projet de Visualisation de Données

Description

Fonctionnalités

Installation

Prérequis

Utilisation

Pour exécuter le projet :

Depuis un terminal :

Depuis IntelliJ :

Exécution du fichier JAR :

Comment utiliser un nouveau type de données ?

Fonctionnement

Data

Autres Maps

Gestion des Attributs Sans Ordre Spécifique

DataManager

DataLoader

Repartition des Taches

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Projet de Visualisation de Données

Description

Fonctionnalités

Installation

Prérequis

Utilisation

Pour exécuter le projet :

Depuis un terminal :

Depuis IntelliJ :

Exécution du fichier JAR :

Comment utiliser un nouveau type de données ?

Fonctionnement

Data

Autres Maps

Gestion des Attributs Sans Ordre Spécifique

DataManager

DataLoader

Repartition des Taches

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages