Blog

Kaggle, la plateforme de crowd-sourcing pour le Big Data

Posted by admin on 22/10/12 17:30

En 2006, Netflix (plateforme de VOD n°1 aux US) avait souhaité se doter d’un meilleur algorithme de recommandation pour les films : faire en sorte que les suggestions de films « que vous devriez aimer », basées sur l’historique de visionnage et les notes attribuées aux films vus par les clients, soient plus pertinentes.

Plutôt que de réaliser ce travail en interne, Netflix avait choisi de créer un concours, le Netflix Prize, qui offrirait 1,000,000 $ à l’équipe qui produirait le modèle prédictif le plus efficace.

 

Les compétences en Big-Data sont rares

Nombre parmi les meilleurs statisticiens, mathématiciens et autres analystes de données du monde entier s’attelèrent à la tâche, et malgré un arrêt prématuré dû à des craintes juridiques relatives à la confidentialité des données fournies pour le concours, Netflix dispose désormais d’outils pour prévoir avec une redoutable précision les envies de ses clients.

Ce modèle d’innovation ouverte, Kaggle a souhaité le rendre possible pour le plus grand nombre. Kaggle est une plateforme de mise en relation avec une communauté d’analystes aujourd’hui grande de près de 30,000 individus. Une entreprise peut venir y exposer un problème lié au Data Mining, et va y associer un prix (aucune obligation de faire comme Netflix et d’offrir 1,000,000 $ ).

 

Testez les modèles et données en direct

Sur la plateforme, les données sont postées et les modèles peuvent être testés en direct : chaque équipe participant à un concours peut ainsi voir comment son modèle d’analyse se comporte vis-à-vis des autres participants.

En ce moment par exemple, une compagnie d’assurance a lancé un concours pour trouver un modèle visant à identifier quels clients ont le plus de chances de résilier leur contrat avant la fin du terme. Un autre concours, testé par un grand site de e-commerce, cherche à améliorer son modèle de prédiction des ventes pour tout son catalogue.

Un excellent moyen pour les e-commerçants d’exploiter les grandes quantités de données qu’ils ont à leur disposition, d’autant plus que dernièrement, il devient difficile pour les entreprises de trouver les compétences nécessaires sur le marché de l’emploi.

Topics: Big Data, E-commerce

Restez informé avec le récap hebdo

Articles récents