Le Big Data est un vaste sujet, qui a été traité dans de bien nombreuses conférences, tables rondes ou encore articles.
Le 8 octobre dernier, une nouvelle « journée de rencontre Big Data et décisionnel » s’est déroulée à l’université Paul Sabatier de Toulouse, haut lieu des nouvelles technologies et de l’ingénierie de données.
L’objectif était de rapprocher les problématiques des industriels avec les compétences des laboratoires afin de voir les perspectives d’avenir que nous ouvre le Big Data.
Mais avant de rentrer dans le vif du sujet, il serait bon de rappeler ce qu’est le Big Data.
Selon les Laboratoires IRIT et IMT la notion de Big Data est liée au dépassement du peta-octet (10 puissance 15 octets). Le Big Data est une expression qui désigne un ensemble de données très volumineuse, très rapide avec des actifs d'information de haute variété qui exigent des formes rentables et innovantes de traitement de l'information pour améliorer la compréhension et la prise de décision.
Retour sur la table ronde « Big Data : Projets en cours et perspectives de recherche » ou Netwave et son Directeur Scientifique Jean-Pierre sont intervenus devant un panel d’industriels, laboratoires, chercheurs et étudiants.
De nombreux sujets Big Data ont été évoqués, à titre d’exemples :
- Airbus a exposé une problématique concernant l'exploitation des données très volumiques recueillies auprès des compagnies aériennes relatives à certains calculateurs de vol. L’objectif étant de détecter les signaux faibles et les situations de configurations inhabituelles de vol.
Cette exploitation aurait comme intérêt d'enrichir les bases de connaissances de test afin de réagir en conséquences si une de ces situations apparaissaient. De l’analyse inductive en quelque sorte.
- Une autre problématique exposée cette fois-ci par Michelin concernant l'exploitations de données d'usages des pneumatiques intégrant une grande variété de données contextuelles (GPS, conditions météo, état de la route) et de mesure de performance (échauffement, etc...) en vue d'améliorer les produits finaux.
- Plusieurs problématiques liées aux e-services
- Des problématiques liées à l'élaboration d'un business model d'exploitation de données Big Data réussi après deux échecs
En parallèle des opérations particulières ont été annoncées :
- La création d’une prime aux idées permettant d'appliquer des technologies issues des programmes Spatiaux au grand public.
- L’évocation d’un financement possible de certains sujets en collaboration entre un industriel et un laboratoire via une société intermédiaire d'économie mixte. Même si un problème épineux demanderait à être réglé : la question de la propriété intellectuelle.
- La création d’un atelier ouvert de présentation des avancées technologiques d'une start-up.
Sans surprise, cette Table ronde ne fut pas pleines de grandes révélations mais plutôt d’annonces. Oui, bien sûr qui se risquerait à communiquer ses idées et ses recherches effectuées sans garantie de conservation de la propriété industrielle ?
Cependant cet évènement au travers des problématiques abordées a permis de conforter que le Big Data n’a de cesse d’emmener les industriels toujours plus loin. Il a encore beaucoup d’opportunités à offrir tant à ces derniers qu’aux consommateurs finaux qui se verront directement ou indirectement impliqués par ces nouvelles technologies.
Cette table ronde a été l’occasion à Netwave, représentée par son Directeur Scientifique, Jean Pierre Malle, de présenter l'état de ses avancées technologiques et savoirs faire en matière de traitement de données volumiques. La liste des ruptures technologiques de la startup toulousaine est parlante :
- Construire des trackers et thresholds pour observer un internaute et identifier des signaux faibles (plusieurs centaines à chaque clic) en temps réel et en se concentrant sur l’essentiel
- Identifier une ou plusieurs situations plausibles par un mécanisme bayesien d’analyse de signature situationnelle en temps réel,
- Travailler en multiconnexité (internautes, produits, contextes, etc.) selon une géométrie Riemannienne appliquées à des sphères affinitaires,
- Gérer un graphe contextuel dynamique polymorphe représentant les différentes visions du site par les internautes,
- Construire des abducteurs automatiques consignant les croyances et pré-conditionnements des internautes (publicités, modes, habitudes etc.),
- Construire des moteurs inductifs généralisant les stratégies gagnantes de recommandations,
- Travailler sur la gestalt des messages adaptés à l’internaute,
- Faire émerger de nouvelles situations par un mécanisme d’apprentissage semi supervisé via de l’agrégation statistique et des cartes de Kohonen,
- Etc….
Il est donc important et nécessaire pour Netwave et sa technologie de poursuivre son plan de recherche expérimentale :
- Toujours améliorer la performance temporelle (traitements des visites en mémoire vive exclusivement),
- Bibliothèques temps réel pour manipulation de graphes,
- Transposition des équations différentielles de René Thom aux espaces non euclidiens de Riemann pour anticiper les ruptures dans les visites,
- Mieux comprendre les motivations des internautes,
- Modèles de téléonomie,
Autant de sujets à approfondir en relation avec certains laboratoires toulousains.
Le Big Data nous offre de nombreuses opportunités pour transformer notre société et notre quotidien. Afin d’accompagner ces évolutions il faut non seulement miser sur la technologie mais également sur les compétences humaines qui donneront lieu aux innovations de demain.