适合人群:

有 Linux 基础和 Java SE 基础的同学

你将会学到:

掌握大数据核心技术中的分布式存储和分布式计算

课程简介:

课程从下面的四个方向讲解大数据技术 Hadoop :

  1. 大数据技术思想入门
  2. 分布式存储之 HDFS
  3. 分布式计算之 MapReduce 和 Yarn
  4. Hadoop 2

课程目录:

├─第10章分布式计算 - DistributedCount程序
│      1.DistributedCount 流程.mp4
│      2.Map 任务实现.mp4
│      3.Reduce 任务实现.mp4
│      4.Driver 实现.mp4
│      5.Map 端合并.mp4
│      6.代码优化.mp4
│      7.在集群上运行程序.mp4
│      8.集群状态的变化.mp4
│      9.Map Task 的数量和文件大小的关系.mp4
│
├─第11章分布式计算 - 移动计算而非移动数据
│      1.Yarn Web UI 查看日志.mp4
│      10.Container 分配规则二:整数倍规则.mp4
│      11.Container 分配规则总结.mp4
│      12.数据块移动的原因.mp4
│      13.移动计算而尽可能少的移动数据.mp4
│      14.设置 reduce task 的数量.mp4
│      15.代码优化-1678427776.mp4
│      2.问题:为什么移动了数据块?.mp4
│      3.打开History Server 服务.mp4
│      4.MRAppMaster 计算资源的配置.mp4
│      5.YarnChild 计算资源的配置.mp4
│      6.代码中设置 MR 进程需要的资源.mp4
│      7.Yarn 中的 Container 概念.mp4
│      8.Yarn 应用启动流程.mp4
│      9.Container 分配规则一:最小最大规则.mp4
│
├─第12章分布式计算 - WordCount
│      1.WordCount 计算流程.mp4
│      10.Shuffle 和 Sort.mp4
│      11.MapReduce On Yarn 运行原理.mp4
│      2.WordCount Map Task 实现.mp4
│      3.Reduce Task 实现.mp4
│      4.WordCount Driver 实现.mp4
│      5.集群运行 WordCount.mp4
│      6.MapReduce 默认的分区规则.mp4
│      7.Input 和 Output Format.mp4
│      8.MapReduce 执行流程.mp4
│      9.WordCount 执行流程.mp4
│
├─第13章Hadoop 2 之 HDFS 安装
│      1.Hadoop 2 学习前说明.mp4
│      2.HDFS的安装(一).mp4
│      3.WebUI看不了怎么办.mp4
│      4.HDFS的安装(二).mp4
│
├─第14章Hadoop 2 之 HDFS 运维相关
│      1.Federation配置.mp4
│      2.ViewFS的配置.mp4
│      3.回退到一个NameNode的状态.mp4
│      4.告诉你怎么使用Snapshots.mp4
│      5.平衡数据.mp4
│      6.SafeMode.mp4
│
├─第15章Hadoop 2 之 MapReduce 和 Yarn
│      1.Yarn的安装.mp4
│      2.MapReduce安装.mp4
│      3.MapReduce应用(了解即可).mp4
│      4.Hadoop压缩机制(了解即可).mp4
│
├─第16章Hadoop 2 之文件格式(这章能理解代码即可)
│      1.text文件格式的读写.mp4
│      2.avro文件和parquet文件的讲解.mp4
│      3.avro文件的读写(能看懂代码即可).mp4
│      4.parquet文件的读写(必须掌握).mp4
│      5.sequenceFile文件(看懂代码即可).mp4
│      6.sequenceFile合并小文件.mp4
│      7.CombineTextInputFormat.mp4
│
├─第17章Hadoop 2 之 Yarn 资源调度机制
│      1.Yarn的三种资源调度机制.mp4
│      2.Capacity Scheduler.mp4
│      3.Yarn Fair Scheduler配置.mp4
│
├─第18章阶段项目实战 - NCDC 气候数据分析实战(跟着操作一遍)
│      1.NCDC数据源的获取.mp4
│      2.NCDC数据字段的详解.mp4
│      3.NCDC数据的预处理.mp4
│      4.数据处理逻辑以及实现方案讲解.mp4
│      5.MapReduce代码实现讲解.mp4
│      6.Hadoop的本地安装.mp4
│      7.单元测试、集成测试以及验证.mp4
│      8.求每一年highest的温度.mp4
│
├─第1章课程答疑
│      老汤大数据课程体系介绍.mp4
│
├─第2章大数据技术思想入门
│      1.分布式存储的特点.mp4
│      2.分布式存储集群特点.mp4
│      3.分布式文件存储的流程.mp4
│      4.主节点中的元数据是怎么存储的.mp4
│      5.分布式计算的特点.mp4
│
├─第3章分布式存储 - HDFS 集群配置安装
│      1.HDFS 课程内容介绍.mp4
│      10.HDFS 相关配置值的设置.mp4
│      11.配置 Java Home以及从节点.mp4
│      12.配置 HADOOP_HOME.mp4
│      13.HDFS 集群启动.mp4
│      14.验证 HDFS 集群是否正常.mp4
│      15.怎么样查看 HDFS 的日志信息.mp4
│      16.HDFS 集群正确停止的方式.mp4
│      2.HDFS 集群介绍.mp4
│      3.安装前准备:准备 3 台虚拟机.mp4
│      4.安装前准备:配置无密钥登录.mp4
│      5.安装前准备:配置 JAVA_HOME.mp4
│      6.安装前准备:关闭防火墙.mp4
│      7.安装包的下载和解压.mp4
│      8.配置 HDFS 的基本路径.mp4
│      9.创建名字节点和数据节点存储数据的文件目录.mp4
│
├─第4章分布式存储 - HDFS 集群的使用
│      1.HDFS Web UI 的讲解.mp4
│      10.HDFS 分布式文件读的过程.mp4
│      2.HDFS shell 命令介绍.mp4
│      3.本地文件上传到 HDFS 集群.mp4
│      4.文件操作命令.mp4
│      5.修改文件的权限.mp4
│      6.df 和 du.mp4
│      7.文件恢复机制.mp4
│      8.准备一个大文件.mp4
│      9.HDFS 分布式文件写的过程.mp4
│
├─第5章分布式存储 - 数据块
│      1.数据块元数据.mp4
│      2.设置数据块的备份数.mp4
│      3.设置数据块的大小.mp4
│      4.数据块真正存储的地方.mp4
│      5.DataNode 和 NameNode 交互.mp4
│      6.HDFS 分布式文件删除的流程.mp4
│
├─第6章分布式存储 - EditsLog 和 FsImage
│      1.回顾 NameNode 元数据是怎么存储的.mp4
│      2.EditsLog 存储目录和内容.mp4
│      3.EditsLog 记录每次元数据操作信息.mp4
│      4.EditsLog恢复NameNode元数据.mp4
│      5.EditsLog 合并的条件.mp4
│      6.FsImage 文件内容.mp4
│      7.为什么还要 EditsLog 呢?.mp4
│      8.EditsLog 合并的流程.mp4
│
├─第7章分布式存储 - Java 操作 HDFS
│      1.Java 操作 HDFS 准备.mp4
│      2.Java 写 HDFS 文件.mp4
│      3.Java 读 HDFS 文件.mp4
│      4.Java 查询 HDFS 文件元数据.mp4
│      5.Java 删除 HDFS 文件.mp4
│      6.在 Java 代码中设置参数.mp4
│      7.在 classpath 中设置参数.mp4
│      8.两种设置参数的优先级.mp4
│      9.HDFS 文件系统的两个特点.mp4
│
├─第8章分布式计算 - 内容介绍
│      1.分布式计算内容介绍.mp4
│
└─第9章分布式计算 - 基础
        1.数据准备.mp4
        10.Hadoop 序列化机制.mp4
        2.回顾分布式计算的特点.mp4
        3.Yarn 的作用.mp4
        4.Yarn 的安装配置.mp4
        5.Yarn 的 Web UI 简介.mp4
        6.有了 Yarn 后的分布式计算.mp4
        7.MapReduce 配置.mp4
        8.创建项目.mp4
        9.序列化的作用.mp4
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。