Big Data : corriger le passé, modeler le présent, préparer l’avenir

  • Publié le : 31 mars 2015
  • Ecrit par : Aurélie Chandèze
  • Revue / Numéro : Best Practices SI n°169
8,17 € HT
soit 9,80 € TTC

Les projets Big Data répondent à plusieurs motivations et plusieurs classifications sont possibles. On peut, par exemple, privilégier une vision temporelle : globalement, les projets Big Data peuvent être regroupés, selon qu’ils permettent de corriger les tendances du passé, qu’ils modèlent le présent ou qu’ils préparent le futur (innovation).

Évidemment, ces trois dimensions sont présentes dans la plupart des projets Big Data. Plusieurs exemples illustrent cette classification.

1. La Poste Courrier : trouver un nouveau modèle de croissance

La branche Services-Courrier-Colis du groupe La Poste emploie 200 000 collaborateurs et représente un chiffre d’affaire annuel de 11 milliards d’euros. En raison de la diminution du volume du courrier classique, l’entreprise cherche de nouveaux modèles de croissance. Elle doit également prendre en compte l’évolution des attentes des clients, qui souhaitent aujourd’hui être livrés à tout moment et en tous lieux, et faire face à de nouveaux entrants, notamment sur le marché des colis.

Pour cela, l’entreprise peut s’appuyer sur ses données. La Poste n’en manque pas : données de production liées au pistage du courrier et au suivi des colis, données clients, ainsi que différentes données d’origine externe... Les événements collectés liés au courrier s’élèvent à 60 milliards, les événements liés aux colis à 5 milliards et les données clients concernent 15 millions de foyers. Pour les exploiter, La Poste Courrier a décidé d’adopter une approche globale du Big Data. L’entreprise a ainsi créé un département Données et Pilotage, dirigé par Jamila Bendjilali. « Le Big Data et l’analytique peuvent être des leviers de transformation », estime cette dernière. « Le Big Data, c’est à la fois un état d’esprit, des technologies et des méthodes », ajoute Kais Soltane, directeur de projet Data/BI à La Poste.

Le projet suscitait une attente forte tant en termes de délais que côté métier. Afin d’aller plus vite, le département Données et Pilotage a donc opté pour l’achat d’une solution packagée plutôt que pour le développement de sa propre plateforme. Son choix s’est tourné vers une appliance d’Oracle, X5-2, intégrant une distribution Hadoop Open Source, en l’occurrence celle de Cloudera. « L’administration et l’évolution d’un cluster Hadoop sont beaucoup plus complexes que la mise en œuvre initiale : tous les deux mois environ, il y a une évolution majeure de ces technologies, comme le passage de MapReduce à Spark », illustre Kais Soltane. « Le choix de Cloudera nous offrait des garanties sur l’évolution du produit, la gestion des patches et la rapidité de mise en œuvre. »

L’objectif en termes de délais a été tenu : le 22 juillet 2015, la Big Data Appliance d’Oracle a été livrée. Le 28 août, la plateforme était opérationnelle, et début septembre, les premiers cas d’usage métier ont pu démarrer. « Environ 120 millions d’événements sont produits chaque jour par les machines de tri, soit un volume de 60 Go. Ceux-ci rentrent directement dans le cluster. Pour le suivi du courrier, ce sont 20 millions d’événements par jour qui sont collectés, et 15 millions pour les colis », ajoute Kais Soltane.

Le département a décidé de centrer ses efforts sur les axes de travail qui représentent une valeur rapide pour le métier : excellence opérationnelle, prévention de la fraude, développement commercial, amélioration de l’expérience client et développement de nouveaux services. « Dans ce type de projet, il ne faut pas négliger ce que voit l’utilisateur, autrement dit tout ce qui concerne la visualisation des données », avertit Kais Soltane. Parmi les autres enjeux à ne pas oublier figurent également la sécurisation de la donnée et la résilience de l’architecture.

« Les premiers prototypes sur la plateforme ont montré qu’il était possible de travailler avec des historiques plus longs », note Jamila Bendjilali. « Auparavant, les analyses ne pouvaient se faire que sur vingt-et-un jours. » Pour 2016, l’objectif du département est de mettre en œuvre une logique de « Fast Data » : « Nous sommes victimes de notre succès, les utilisateurs veulent avoir les données rapidement, quasiment en temps réel », constate Kais Soltane.

8,17 € HT
soit 9,80 € TTC

Best Practices propose des publications payantes.
Comparez nos différentes offres d'abonnement.

Aurélie Chandèze

Aurélie Chandèze

Titulaire de deux masters en informatique et en sciences de l’information, Aurélie Chandèze a débuté en tant que journaliste IT. Après avoir été analyste chez Yphise puis consultante chez Acadys, elle a rejoint Best Practices fin 2009.

REMARQUE ! Ce site utilise des cookies et autres technologies similaires.

Si vous ne changez pas les paramètres de votre navigateur, vous êtes d'accord. En savoir plus

J'ai compris