Démarrage Rapide

Le jeu de données MAPLES-DR est disponible en téléchargement sur Figshare. Cependant, pour les applications de l’entraînement d’algorithmes d’apprentissage automatique, nous recommandons fortement d’utiliser directement le paquet python maples_dr pour télécharger, formater et manipuler facilement ce jeu de données.

Cette page vous guidera à travers le processus d’installation et les cas d’utilisation courants du paquet: charger le jeu de données en mémoire ou le sauvegarder localement.

Installation

Le paquet maples-dr est disponible sur PyPI et s’installe avec la commande:

$ pip install maples-dr

Utilisation Simple

Une fois importé, les ensembles d’entraînement ou de test de MAPLES-DR peuvent être chargés en mémoire avec une seule ligne de code Python.

import maples_dr
train_set = maples_dr.load_train_set()
test_set = maples_dr.load_test_set()

Si nécessaire, l’archive du jeu de données est automatiquement téléchargée depuis Figshare, extraite et mise en cache localement. Les données sont ensuite retournées sous forme d’un maples_dr.Dataset (assimilable à une liste de dictionnaires contenant toutes les étiquettes de MAPLES-DR, voir Datasets pour plus de détails).

Par exemple, la carte des vaisseaux de la première image de l’ensemble d’entraînement est accessible avec le code:

vessel_map = train_set[0]['vessels']

Sinon, si vous préférez utiliser votre propre code pour le chargement des données, les images de MAPLES-DR peuvent être sauvegardées dans des dossiers locaux:

maples_dr.export_train_set('MAPLES-DR/train/')
maples_dr.export_test_set('MAPLES-DR/test/')

Suite à ces commandes, toutes les cartes de segmentations de MAPLES-DR seront sauvegardées sous forme d’image png, chaque structure rétinienne ayant son dossier dédié:

MAPLES-DR/train/
├── bright_uncertains/
│    ├── 20051019_38557_0100_PP.png
│    ├── 20051020_55346_0100_PP.png
│    └── ... (138 image files)
├── cotton_wool_spots/
│    └── ... (138 image files)
├── drusens/
├── exudates/
├── hemorrhages/
├── macula/
├── microaneurysms/
├── neovascularization/
├── optic_cup/
├── optic_disc/
├── red_uncertains/
└── vessels/
MAPLES-DR/test/
├── bright_uncertains/
│    ├── 20051019_38557_0100_PP.png
│    └── ... (60 image files)
├── cotton_wool_spots/
└── ...

Configurer le comportement de la bibliothèque python

Le comportement de maples_dr est ajustable pour s’adapter aux besoins de votre code. Par exemple, vous pourriez avoir besoin que les images et les cartes de biomarqueurs aient une résolution spécifique, un format spécifique (image PIL ou tableau numpy), un ordre spécifique des canaux de couleurs (rgb ou bgr)… Le comportement par défaut de la bibliothèque est configuré avec la méthode maples_dr.configure(), et les options de configuration sont documentées en détail dans la documentation de maples_dr.config.DatasetConfig.

L’exemple suivant montre comment configurer le jeu de données pour retourner les images sous forme de tableaux numpy (au lieu d’images PIL) et avec une résolution de 512x512 pixels:

maples_dr.configure(resize=512, image_format="rgb")

La même méthode permet de spécifier un chemin local où seront lues les données de MAPLES-DR, au lieu de les télécharger depuis Figshare.

maples_dr.configure(
    maples_dr_path="path/to/MAPLES-DR/AdditionalData.zip",
    maples_dr_diagnosis_path="path/to/MAPLES-DR/diagnosis.xls"
)

Enfin, un chemin local vers le jeu de données MESSIDOR peut également être spécifié avec cette fonction pour inclure les images de fond d’œil de MESSIDOR. (Voir Utiliser les images de MESSIDOR pour plus de détails.)

maples_dr.configure(messidor_path="path/to/Messidor/directory/")

Pour plus d’informations sur toutes les méthodes présentées dans ce guide de démarrage, veuillez vous référer à la documentation de MAPLES-DR Quick API.