大数据

Hadoop学习笔记

配置环境:Vmware + CentOS 1、HDFS: Hadoop Distributed File System 分布式文件系统 2、YARN: Yet Another Resource Negotiator 资源管理调度系统 3、Mapreduce:分布式运算框架 4、hdfs通过分布式集群来存储文件; 5、文件在存储时,被切分成Blocks; 6、文件的Blocks存放于datanode节点; 7、hdfs文件系统中的文件与blocks的映射关系由namenode节点管理。 8、每个b… 阅读更多 »Hadoop学习笔记