Glossaire Science des données / Terme
C’est une procédure de développement informatique, inventée par Google, dans laquelle sont effectués des calculs parallèles de données très volumineuses, distribués sur différentes machines dans des lieux différents (Clusters ou Cloud computing). Trois étapes:
- Map: Diviser les données à traiter en partitions indépendantes (envoi les données et la fonction à un endroit donné),
- Exécuter les fonctions en parallèle
- Reduce: Combiner les résultats (opération inverse du Map)
En synthèse, le stockage et l’exécution coexistent au même endroit.
Lien permanent MapReduce - Date de création 2021-11-22