Hadoop 的三大組件是指 Hadoop 分布式文件系統(tǒng)(HDFS)、MapReduce 和 Yet Another Resource Negotiator(YARN)。
HDFS:Hadoop 分布式文件系統(tǒng)是 Hadoop 的分布式文件系統(tǒng),它是將大規(guī)模數(shù)據(jù)分散存儲在多個節(jié)點上的基礎。HDFS 主要負責數(shù)據(jù)的存儲和管理,可以將大數(shù)據(jù)集分成多個數(shù)據(jù)塊,并將這些數(shù)據(jù)塊分配到不同的計算節(jié)點上存儲,提高數(shù)據(jù)的可靠性和處理效率。
MapReduce:MapReduce 是 Hadoop 的分布式計算框架,它提供了一種簡單的編程模型,通過將大規(guī)模數(shù)據(jù)分解成多個小任務并行處理,可以大大提高數(shù)據(jù)處理的效率。MapReduce 模型包括 Map 和 Reduce 兩個階段,其中 Map 階段將數(shù)據(jù)分解成多個小塊進行處理,Reduce 階段將處理結果合并。
YARN:Yet Another Resource Negotiator(YARN)是 Hadoop 的資源管理器,它負責為多個應用程序分配和管理計算資源,可以有效地提高計算資源的利用率。YARN 可以將集群中的計算資源劃分為多個容器,為不同的應用程序提供適當?shù)馁Y源,并監(jiān)控和管理各個應用程序的運行狀態(tài)。
綜上所述,HDFS、MapReduce 和 YARN 是 Hadoop 的三大組件,它們共同構成了 Hadoop 分布式計算框架的核心。