HDFS,其实是Hadoop Distributed File System的简称,我们从命名就可以看出来,这真的是文件系统,而非数据库。
HDFS对需要存储的数据,进行写入和读出,通过统一的命名空间——“目录树”来定位文件。当收到数据存储请求时,HDFS将文件进行分块(Block),一批数据会被分成若干个Block,然后分配到集群当中的计算机进行存储;当需要提取这些数据时,再通过 定位文件 所在位置,找到需要的数据。
HDFS,其实是Hadoop Distributed File System的简称,我们从命名就可以看出来,这真的是文件系统,而非数据库。
HDFS对需要存储的数据,进行写入和读出,通过统一的命名空间——“目录树”来定位文件。当收到数据存储请求时,HDFS将文件进行分块(Block),一批数据会被分成若干个Block,然后分配到集群当中的计算机进行存储;当需要提取这些数据时,再通过 定位文件 所在位置,找到需要的数据。