psStyle / repos

0 stars 0 forks source link

hadoop 学习第四天 分布式文件管理系统(HDFS) #9

Open psStyle opened 9 years ago

psStyle commented 9 years ago

数据量越来越多,在一个操作系统管辖范围存不下了,那么久分配到更多的

操作系统管理的磁盘中,但是这样不方便管理和维护,因此迫切需要一种系统来

管理多太机器上的文件,这就是分布式文件管理系统. 分布式文件管理系统是一种允许文件通过网络在多台主机上分享的文件系

统,可让多机器上的用户分享文件盒存储空间.让实际上是通过网络来房访问文

件的动作,由程序和用户看来,就像访问本地磁盘一样.即使系统中有某些节点

脱机,整体来说系统任然可以持续运作而不会有数据丢失. 分布式文件管理系统有很多,HDFS之是其中一种.使用于一次写入多次查询

的情况,不支持并发写情况,小文件不合适 hdfs在对数据存储进行分块划分时,如果文件大小超过块大小,那么按照块进行划分;小于块大小的划分为一个块,是实际数据大小