目录 1.5HDFS分布式文件系统 1.5.1HDFS简介 1.5.2HDFS的重要概念 1.5.3HDFS架构 1.5HDFS分布式文件系统 1.5.1HDFS简介 HDFS(全称:HadoopDistributeFileSystem,Hadoop分布式文件系统)是Hadoop核心组成,是分布式存储服务。 分布式文件系统横跨多台计算机,在大数据时代有着广泛的应用前景,它们为存储和处理超大规模数据提供所需的扩展能力。 HDFS是分布式文件系统中的一种。 1.5.2HDFS的重要概念 HDFS通过统一的命名空间目录树来定位文件;另外,它是分布式的,由很多服务器联合起来实现其功...

  lrMpPrWfWNuV   2023年11月01日   79   0   0 大数据

目录 1.5.4HDFS客户端操作 1.5.4.1Shell命令行操作HDFS 1.5.4.2JAVA客户端 1.5.4.2.1客户端环境准备 1.5.4.2.2HDFS的API操作 1.5.4.2.2.1上传文件 1.5.4.2.2.2下载文件 1.5.4.2.2.3删除文件/文件夹 1.5.4.2.2.4查看文件名称、权限、长度、块信息 1.5.4.2.2.5文件夹判断 1.5.4.2.2.6I/O流操作HDFS 1.5.4HDFS客户端操作 1.5.4.1Shell命令行操作HDFS 基本语法 ​bin/hadoopfs具体命令ORbin/hdfsdfs具...

  lrMpPrWfWNuV   2023年11月01日   75   0   0 大数据

目录 1.5.5HDFS读写解析 1.5.5.1HDFS读数据流程 1.5.5.2HDFS写数据流程 1.5.5HDFS读写解析 1.5.5.1HDFS读数据流程 客户端通过DistributedFileSystem向NameNode请求下载文件,NameNode通过查询元数据,找到文件块所在的DataNode地址。 挑选一台DataNode(就近原则,然后随机)服务器,请求读取数据。 DataNode开始传输数据给客户端(从磁盘里面读取数据输入流,以Packet为单位来做校验)。 客户端以Packet为单位接收,先在本地缓存,然后写入目标文件。 1.5.5.2HDF...

  lrMpPrWfWNuV   2023年11月01日   323   0   0 大数据

目录 1.5.6NN与2NN 1.5.6.1HDFS元数据管理机制 1.5.6.2Fsimage与Edits文件解析 1.5.6.2.1Fsimage文件内容 1.5.6.2.2Edits文件内容 1.5.6.3checkpoint周期 1.5.6NN与2NN 1.5.6.1HDFS元数据管理机制 问题1:NameNode如何管理和存储元数据? 计算机中存储数据两种:内存或者是磁盘 元数据存储磁盘:存储磁盘无法面对客户端对元数据信息的任意的快速低延迟的响应,但是安全性高 元数据存储内存:元数据存放内存,可以高效的查询以及快速响应客户端的查询请求,数据保存在内存,如果断点...

  lrMpPrWfWNuV   2023年11月01日   169   0   0 大数据

目录 全网最全的linux上docker安装oracle的详细文档,遇到了n个问题,查了几十篇文章,最终汇总版,再有解决不了的,私聊我,我帮你解决 1.拉取阿里镜像oracle 2.创建初始化数据 3.创建启动容器数据持久化 4.进入oracle容器 5.切换到root用户下进行配置 6.编辑profile文件配置ORACLE环境变量 7.创建软连接 8.切换到oracle用户 9.登录sqlplus并修改sys、system用户密码 10.修改sys、system用户密码并刷新权限 10.1当执行修改密码的时候出现:databasenotopen 10.2又提示另一个错误:OR...

  lrMpPrWfWNuV   2023年11月01日   109   0   0 Oracle
关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~