大数据是指无法在一定时间内用常规软件进行捕捉、管理和处理的数据集合,是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化的海量、高增长率和多样化的信息化资产。
Hadoop是一个分布式处理架构,是大数据的一个解决方案,主要用来解决海量数据的存储(HDFS)和海量数据的计算(Mapreduce)。