Glossaria.net

Glossaire Science des données / Terme

MapReduce

C’est une procédure de développement informatique, inventée par Google, dans laquelle sont effectués des calculs parallèles de données très volumineuses, distribués sur différentes machines dans des lieux différents (Clusters ou Cloud computing). Trois étapes:

- Map: Diviser les données à traiter en partitions indépendantes (envoi les données et la fonction à un endroit donné),
- Exécuter les fonctions en parallèle
- Reduce: Combiner les résultats (opération inverse du Map)

En synthèse, le stockage et l’exécution coexistent au même endroit.

Lien permanent MapReduce - Date de création 2021-11-22


< Machine learning Glossaire / Science des données NLP – Natural Language Processing >