Les différentes étapes du projet, réalisé en 30 jours, ont été les suivantes:
Exploration de la donnée: (1 semaine) cette première étape avait pour but de découvrir puis de se familiariser avec les données disponibles dans les différents jeux de données proposés par les organisateurs. Nous avons utilisé les interfaces fournies par les organisateurs.
Brainstorming: (1 semaine) lors de cette étape nous avons échangé dans l'équipe sur différentes idées et directions que nous voulions prendre. Une fois que nous avons convergé et validé notre fil directeur, nous avons réalisé une maquette du site sur Canva.
Codage: (2 semaines) cette étape a pu permettre de passer de la maquette au site. Au cours de cette étape nous avons également approfondi l'exploration de la donnée pour réaliser le filtrage nécessaire .
L'équipe est composée de deux membres.
Le premier s'est consacré au codage du site et le second au traitement de la donnée.
Les tâches du projet ont été réalisées pour moitié pendant le temps de travail et pour moitié pendant notre temps libre.
La charte graphique du site utilise des couleurs chaleureuses, douces et pastel qui rappellent le sable, la terre et la végétation. Le choix de la police de caractères s'est porté sur une police cursive et ronde plus chaleureuse comme la douceur du climat et de l'art de vivre Calédonien. Le motif sur le bandeau latéral gauche du site fait référence aux motifs de remplissage utilisés dans les pyrogravures de l'art mélanésien.
Les inspirations utilisées sont minimalistes et rétros, du même style que celui qu'on pouvait trouver dans le web des années 2000 avec lequel nous avons grandi. On pourrait citer des sites comme Kadokado ou Prizee qui offraient déjà une interactivité incroyable pour l'époque.
L'idée centrale de cette dataviz était de rendre l'utilisateur actif lors de son parcours sur le site. Après une courte présentation des groupes alimentaires, de leurs particularités locales et de leurs bienfaits diététiques, l'utilisateur est invité à composer son assiette. Il devient ainsi responsable de son contenu et peut voir l'impact de ses choix sur ses apports caloriques et sur son porte monnaie.
La dataviz exploite les jeux de données suivants:
"Food security" du Pacific Data Hub,
"Prix des produits alimentaires en Nouvelle-Calédonie" de la plateforme de données publiques data.gouv.nc.
Ce jeu de données a été utilisé pour déterminer un nombre de calories moyen par gramme pour chacun des 5 groupes alimentaires mentionnés (Poisson, Viandes, Féculents, Légumes et Fruits).
Manipulation de la donnée:Un premier filtrage est réalisé pour constituer les groupes alimentaires à partir des familles de produit du jeu de données:
Groupes alimentaires | Familles de produits |
---|---|
Poissons |
"13: Fish and fish products" |
Viandes |
"11: Meats and meat products" |
Féculents |
"1: Cereals and cereal products", |
Légumes |
"8: Vegetables and vegetables products" |
Fruits |
"7: Fruits and fruit products" |
On raffine le filtrage en sélectionnant les données au niveau national, tout âge , sexe et niveau social confondu.
On effectue ensuite un dernier filtrage pour constituer deux champs indiquant pour chaque groupe alimentaire:
Un champ
Un champ
Enfin on constitue un champ unique intitulé
COEFFICIENT = CALORIES / QUANTITES
Les calories contenues dans l'assiette sont ensuite calculées simplement en multipliant la quantité renseignée par l'utilisateur par le coefficient du groupe alimentaire concerné.
Ce jeu de données a été utilisé pour déterminer le prix médian par kilogramme pour chacun des 5 groupes alimentaires mentionnés (Poisson, Viandes, Féculents, Légumes et Fruits).
Manipulations de la donnée:Un premier filtrage est réalisé pour constituer les groupes alimentaires à partir des familles de produit du jeu de données:
Groupes alimentaires | Familles de produits |
---|---|
Poissons |
"poisson" |
Viandes |
"viande" et "volaille" |
Féculents |
"blé, semoule, céréale", "pâte sèche", "purée et polenta" et "riz" |
Légumes |
"légume frais" |
Fruits |
"fruit "frais" |
Ensuite, pour chaque article, le prix au kilogramme est calculé à partir du prix relevé et du conditionnement indiqué dans le jeu de donnée:
PRIX = PRIX_RELEVE / CONDITIONNEMENT
Puis, pour chaque année et pour chaque groupe alimentaire on calcule la médiane du prix. On choisit la médiane pour réduire les biais induis par d'éventuelles données erronnées qui si elles présentaient un écart trop important pourrait impacter la moyenne. En utilisant la médiane on fait l'hypothèse que si des données erronnées existes, elles sont en infériorité numérique par rapport aux bonnes données.
Enfin; après analyse des données, on remarque que les premières années du jeu de données (jusqu'à 2016) ne comportent que peu d'échantillons et présentent une rupture nette de tendance avec le reste du jeu de données. Comme nous n'avons pas trouvé d'explication pour ce phénomène et que nous pensons qu'il peut s'agir d'erreur, nous avons décidé de l'exclure de notre dataviz.
Le prix de chaque groupe alimentaire dans l'assiette est ensuite calculé en multipliant la quantité renseignée par l'utilisateur par le prix déterminé ci-dessus, pour chaque année.
On donne ci-après un aperçu du résultat du filtrage dans l'outil Elastic: