MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。MapReduce主要对数据进行两项操作:Map和Reduce。
Map是把一组数据一对一地映射为另外一组数据,其映射的规则由一个函数来指定。
Reduce是对一组数据进行归约,归约的规则由一个函数来指定。