课程介绍(A000826):
黑马程序员 大数据 零基础学习Hadoop3.0从入门到源码s
文件目录:
黑马程序员 大数据 零基础学习Hadoop3.0从入门到源码 |
├─1.HDFS |
│ ├─视频-零基础学习Hadoop3.0-HDFS从入门到源码 |
│ │ ├─day1视频 |
│ │ │ ├─00–课程内容大纲和学习目标.mp4 7.22MB |
│ │ │ ├─01–大数据课程导论–大数据概念.mp4 25.22MB |
│ │ │ ├─02–大数据课程导论–大数据特点(5V特征).mp4 13.32MB |
│ │ │ ├─03–大数据课程导论–大数据应用场景.mp4 23.44MB |
│ │ │ ├─04–大数据课程导论–大数据业务分析基本步骤(重要).mp4 52.15MB |
│ │ │ ├─05–大数据课程导论–大数据部门组织架构.mp4 8.73MB |
│ │ │ ├─06–分布式技术–分布式概念&分布式、集群区别.mp4 38.85MB |
│ │ │ ├─07–分布式技术–负载均衡、故障转移、伸缩性.mp4 24.7MB |
│ │ │ ├─08–Hadoop概述–Hadoop介绍、发展简史.mp4 34.79MB |
│ │ │ ├─09–Hadoop概述–Hadoop特性优点、国内外应用.mp4 23.45MB |
│ │ │ ├─10–Hadoop概述–Hadoop发行版本、架构变迁.mp4 45.75MB |
│ │ │ ├─11–Hadoop概述–集群搭建–Hadoop集群角色介绍、部署模式.mp4 22.73MB |
│ │ │ ├─12–Hadoop概述–集群搭建–源码编译.mp4 55.67MB |
│ │ │ ├─13–Hadoop概述–集群搭建–集群角色规划、服务器基础环境准备.mp4 36.37MB |
│ │ │ ├─14–Hadoop概述–集群搭建–安装包目录结构.mp4 31.29MB |
│ │ │ ├─15–Hadoop概述–集群搭建–配置文件详解~2.mp4 119.95MB |
│ │ │ ├─16–Hadoop概述–集群搭建–namenode format操作及注意事项.mp4 48.19MB |
│ │ │ ├─17–Hadoop概述–集群搭建–集群启动方式和Web UI页面~2.mp4 86.92MB |
│ │ │ ├─18–Hadoop概述–Hadoop初体验~2.mp4 69.36MB |
│ │ │ ├─19–Hadoop概述–HDFS基准测试~2.mp4 52.4MB |
│ │ │ └─20–课程总结和今日作业.mp4 14.18MB |
│ │ ├─day2视频 |
│ │ │ └─6.视频 |
│ │ │ ├─00–课程内容大纲和学习目标.mp4 9.66MB |
│ │ │ ├─01–企业存储系统–了解硬盘、RAID磁盘阵列.mp4 28.76MB |
│ │ │ ├─02–企业存储系统–了解存储架构类型(DAS、NAS、SAN).mp4 10.79MB |
│ │ │ ├─03–企业存储系统–文件系统概述、特点、分类.mp4 29.68MB |
│ │ │ ├─04–企业存储系统–海量数据场景下传统存储面临问题.mp4 7.67MB |
│ │ │ ├─05–场景分析–如何模拟实现分布式文件存储系统.mp4 25.58MB |
│ │ │ ├─06–HDFS分布式文件存储系统–简介.mp4 6.9MB |
│ │ │ ├─07–HDFS分布式文件存储系统–起源发展.mp4 9.9MB |
│ │ │ ├─08–HDFS分布式文件存储系统–设计目标、应用场景.mp4 15.21MB |
│ │ │ ├─09–HDFS分布式文件存储系统–重要特性:主从架构、分块存储、副本机制.mp4 13.55MB |
│ │ │ ├─10–HDFS分布式文件存储系统–重要特性:namespace、元数据管理、数据块存储.mp4 14.15MB |
│ │ │ ├─11–HDFS案例:微博数据操作–HDFS Shell CLI客户端用法说明.mp4 41.45MB |
│ │ │ ├─12–HDFS案例:微博数据操作–HDFS Shell CLI–mkdir、ls、put、copyFromLocal.mp4 38.08MB |
│ │ │ ├─13–HDFS案例:微博数据操作–HDFS Shell CLI–cat、head、tail、get、getmerge.mp4 30.46MB |
│ │ │ ├─14–HDFS案例:微博数据操作–HDFS Shell CLI–cp、appendToFile、df、du、mv.mp4 25.43MB |
│ │ │ ├─15–HDFS案例:微博数据操作–HDFS Shell CLI–setrep副本个数修改.mp4 8.17MB |
│ │ │ ├─16–HDFS案例:微博数据操作–HDFS Shell CLI–其他命令&Web UI操作.mp4 15.87MB |
│ │ │ ├─17–HDFS Java API客户端–开发环境构建&FileSystem对象.mp4 36.77MB |
│ │ │ ├─18–HDFS Java API客户端–创建文件夹与客户端用户身份设置.mp4 28.64MB |
│ │ │ ├─19–HDFS Java API客户端–上传文件、下载文件.mp4 27.1MB |
│ │ │ ├─20–HDFS Java API客户端–hadoop本地库环境-winutils.mp4 18.24MB |
│ │ │ ├─21–HDFS Java API客户端–Apache Log4j简单入门使用.mp4 34.7MB |
│ │ │ ├─22–HDFS Java API客户端–Google option简单入门使用.mp4 39.41MB |
│ │ │ ├─23–HDFS案例:舆情数据上报–需求解读与实现思路.mp4 18.12MB |
│ │ │ ├─24–HDFS案例:舆情数据上报–开发环境搭建与工具类准备.mp4 12.62MB |
│ │ │ ├─25–HDFS案例:舆情数据上报–数据采集任务实现.mp4 16.43MB |
│ │ │ ├─26–HDFS案例:舆情数据上报–数据上传任务实现.mp4 16.1MB |
│ │ │ ├─27–HDFS案例:舆情数据上报–程序执行功能演示.mp4 37.49MB |
│ │ │ └─28–扩展了解HDFS LibHDFS客户端(C API).mp4 4.81MB |
│ │ ├─day3视频 |
│ │ │ └─6.视频 |
│ │ │ ├─00–课程内容大纲和学习目标.mp4 8.19MB |
│ │ │ ├─01–HDFS客户端概述–shell command、java api、c api.mp4 11.08MB |
│ │ │ ├─02–HDFS REST客户端–WebHDFS介绍和使用.mp4 56.31MB |
│ │ │ ├─03–HDFS REST客户端–WebHDFS使用–基于http协议上传文件.mp4 15.67MB |
│ │ │ ├─04–HDFS网关代理服务–HttpFS–概述和工作原理.mp4 18.35MB |
│ │ │ ├─05–HDFS网关代理服务–HttpFS–配置、启动、使用.mp4 15.16MB |
│ │ │ ├─06–WebHDFS和HttpFS之间的区别.mp4 16.38MB |
│ │ │ ├─07–HDFS文件存储格式–传统常见的文件存储格式.mp4 18.27MB |
│ │ │ ├─08–HDFS文件存储格式–BigData File Viewer工具使用.mp4 41.21MB |
│ │ │ ├─09–HDFS文件存储格式–行式存储、列式存储.mp4 13.25MB |
│ │ │ ├─10–HDFS文件存储格式–丰富的文件存储格式(ORC、Parquet、Sequence、Avro).mp4 43.17MB |
│ │ │ ├─11–HDFS文件存储格式–了解Apache Arrow–列式内存数据结构.mp4 11.11MB |
│ │ │ ├─12–HDFS文件压缩格式–概述和对比.mp4 23.36MB |
│ │ │ ├─13–HDFS异构存储–4种异构存储介质.mp4 25.24MB |
│ │ │ ├─14–HDFS异构存储–块存储类型选择策略.mp4 19.65MB |
│ │ │ ├─15–HDFS异构存储–案例:冷热温分层存储–配置异构存储功能.mp4 24.81MB |
│ │ │ ├─16–HDFS异构存储–案例:冷热温分层存储–存储策略设置和效果检测.mp4 22.84MB |
│ │ │ ├─17–HDFS异构存储–内存存储策略–lazy persist懒持久流程.mp4 6.52MB |
│ │ │ ├─18–HDFS异构存储–内存存储策略–lazy persist设置使用.mp4 9.98MB |
│ │ │ ├─19–HDFS异构存储–案例:银行转账数据冷热分层.mp4 30.48MB |
│ │ │ └─20–今日课程总结和作业.mp4 12.41MB |
│ │ ├─day4视频 |
│ │ │ └─6.视频 |
│ │ │ ├─00–课程内容大纲和学习目标.mp4 13.39MB |
│ │ │ ├─01–HDFS数据迁移–使用场景、考量因素与DistCp工具的使用.mp4 30.81MB |
│ │ │ ├─02–HDFS NAMENODE–安全模式–现象探究.mp4 21.05MB |
│ │ │ ├─03–HDFS NAMENODE–安全模式–概述与控制进入离开时间和条件.mp4 24.35MB |
│ │ │ ├─04–HDFS高阶优化方案–短路本地读取–背景和两种设计实现方案.mp4 14.95MB |
│ │ │ ├─05–HDFS高阶优化方案–短路本地读取–配置和功能演示验证.mp4 40.21MB |
│ │ │ ├─06–HDFS高阶优化方案–节点block负载平衡器–Balancer.mp4 26.37MB |
│ │ │ ├─07–(hadoop3.0新功能)HDFS Disk balancer–介绍.mp4 23.81MB |
│ │ │ ├─08–(hadoop3.0新功能)HDFS Disk balancer–工作原理.mp4 23.81MB |
│ │ │ ├─09–(hadoop3.0新功能)HDFS Disk balancer–操作使用.mp4 13.76MB |
│ │ │ ├─10–(hadoop3.0新功能)HDFS Erasure Coding–纠删码介绍和原理.mp4 13.77MB |
│ │ │ ├─11–(hadoop3.0新功能)HDFS Erasure Coding–纠删码架构调整.mp4 11.08MB |
│ │ │ ├─12–(hadoop3.0新功能)HDFS Erasure Coding–纠删码操作.mp4 11.86MB |
│ │ │ ├─13–HDFS动态节点管理–节点上线、动态扩容实操.mp4 41.09MB |
│ │ │ ├─14–HDFS动态节点管理–节点下线、动态缩容实操.mp4 28.77MB |
│ │ │ ├─15–HDFS动态节点管理–黑、白名单机制.mp4 5.5MB |
│ │ │ ├─16–HDFS HA–高可用背景知识(SPOF、主备架构、X个9可靠性).mp4 30.26MB |
│ │ │ ├─17–HDFS HA–高可用系统设计核心问题–脑裂和主备数据同步.mp4 9.3MB |
│ │ │ ├─18–HDFS HA–NameNode单点故障问题.mp4 5.7MB |
│ │ │ ├─19–HDFS HA–QJM方案–整体架构和如何解决主备切换、脑裂问题.mp4 34.71MB |
│ │ │ ├─20–HDFS HA–QJM方案–如何解决数据同步问题.mp4 4.66MB |
│ │ │ ├─21–HDFS HA–QJM方案–集群搭建–配置文件详解.mp4 62.03MB |
│ │ │ ├─22–HDFS HA–QJM方案–集群搭建–初始化启动.mp4 29.11MB |
│ │ │ ├─23–HDFS HA–QJM方案–HA功能演示.mp4 15.99MB |
│ │ │ ├─24–HDFS–了解Federation联邦机制.mp4 18.7MB |
│ │ │ ├─25–HDFS集群滚动升级–非联邦HA集群滚动升级.mp4 8.37MB |
│ │ │ ├─26–HDFS集群滚动升级–联邦+HA集群滚动升级.mp4 9.16MB |
│ │ │ ├─27–HDFS集群滚动升级–非HA集群停机升级.mp4 2.35MB |
│ │ │ └─28–HDFS集群滚降级和回滚操作.mp4 22.3MB |
│ │ ├─day5视频 |
│ │ │ └─6.视频 |
│ │ │ ├─00–课程内容大纲和学习目标.mp4 9.17MB |
│ │ │ ├─01–HDFS架构剖析–架构整体概述.mp4 13.19MB |
│ │ │ ├─02–HDFS架构剖析–集群角色介绍概述(NN、DN、SNN).mp4 20.48MB |
│ │ │ ├─03–HDFS架构剖析–重要特性(主从、分块、副本、namespace).mp4 24.85MB |
│ │ │ ├─04–HDFS Web Interfaces–各模块功能解读梳理.mp4 31.42MB |
│ │ │ ├─05–(Hadoop3.0新功能)Web UI页面通过鼠标进行文件系统操作.mp4 24.3MB |
│ │ │ ├─06–HDFS读写流程–写数据流程核心概念–pipeline、ack、3副本策略.mp4 29.14MB |
│ │ │ ├─07–HDFS读写流程–写数据流程–分步讲解.mp4 20.19MB |
│ │ │ ├─08–HDFS读写流程–读数据流程–分步讲解.mp4 22.66MB |
│ │ │ ├─09–HDFS读写流程–NN、DN角色职责高度概括.mp4 15.43MB |
│ │ │ ├─10–HDFS–NAMENODE元数据管理–文件系统元数据存储类型与设计实现.mp4 31.57MB |
│ │ │ ├─11–HDFS–NAMENODE元数据管理–相关存储目录.mp4 9.44MB |
│ │ │ ├─12–HDFS–NAMENODE元数据管理–namespaceID、clusterID、blockpoolID概念.mp4 22.16MB |
│ │ │ ├─13–HDFS–NAMENODE元数据管理–相关的文件解读.mp4 23.4MB |
│ │ │ ├─14–HDFS–NAMENODE元数据管理–元数据文件查看(OIV、OEV).mp4 34.62MB |
│ │ │ ├─15–HDFS–NAMENODE元数据管理–SecondaryNameNode介绍.mp4 7.11MB |
│ │ │ ├─16–HDFS–NAMENODE元数据管理–SecondaryNameNode–checkpoint机制.mp4 11.04MB |
│ │ │ ├─17–HDFS–NAMENODE元数据管理–元数据文件恢复方式.mp4 11.99MB |
│ │ │ ├─18–HDFS小文件解决方案–Hadoop Archive–文件归档介绍.mp4 8.58MB |
│ │ │ ├─19–HDFS小文件解决方案–Hadoop Archive–归档使用和注意事项.mp4 37.49MB |
│ │ │ ├─20–Sequence File–序列化文件格式介绍.mp4 10.57MB |
│ │ │ ├─21–Sequence File–读写Sequence File模板代码.mp4 47.52MB |
│ │ │ ├─22–Sequence File–案例:使用Sequence File合并小文件.mp4 35.53MB |
│ │ │ └─23–课程总结和今日作业.mp4 15.04MB |
│ │ ├─day6视频 |
│ │ │ └─6.视频 |
│ │ │ ├─00–课程内容大纲和学习目标.mp4 8.65MB |
│ │ │ ├─01–HDFS Trash垃圾桶–文件系统垃圾桶、回收站背景知识.mp4 11MB |
│ │ │ ├─02–HDFS Trash垃圾桶–功能介绍与配置开启.mp4 14.39MB |
│ │ │ ├─03–HDFS Trash垃圾桶–操作使用.mp4 11.85MB |
│ │ │ ├─04–HDFS Snapshot快照–介绍和作用.mp4 12.25MB |
│ │ │ ├─05–HDFS Snapshot快照–功能的实现.mp4 5.16MB |
│ │ │ ├─06–HDFS Snapshot快照–操作命令与实操.mp4 34.01MB |
│ │ │ ├─07–HDFS权限管理–认证、授权、审计(AAA模型)与权限管理概述.mp4 21.12MB |
│ │ │ ├─08–HDFS权限管理–UGO权限管理与权限掩码(umask).mp4 17.92MB |
│ │ │ ├─09–HDFS权限管理–使用命令进行权限修改.mp4 12.13MB |
│ │ │ ├─10–HDFS权限管理–使用Web UI页面进行权限修改&粘滞位功能.mp4 17.6MB |
│ │ │ ├─11–HDFS权限管理–用户身份认证–Simple认证机制.mp4 15.07MB |
│ │ │ ├─12–HDFS权限管理–用户身份认证–了解Kerberos认证机制.mp4 25.52MB |
│ │ │ ├─13–HDFS权限管理–组映射服务(Group Mapping).mp4 11.56MB |
│ │ │ ├─14–HDFS权限管理–ACL权限管理–产生背景和功能.mp4 8.95MB |
│ │ │ ├─15–HDFS权限管理–ACL权限管理–命令与实操.mp4 26.82MB |
│ │ │ ├─16–HDFS Proxy User代理用户–概念与配置使用.mp4 11.08MB |
│ │ │ ├─17–HDFS透明加密–技术背景和常见的加密层级.mp4 25.73MB |
│ │ │ ├─18–HDFS透明加密–概述和角色、组件(EZ、DEK、EDEK).mp4 35.74MB |
│ │ │ ├─19–HDFS透明加密–加密、解密流程梳理.mp4 13.11MB |
│ │ │ ├─20–HDFS透明加密–KMS服务配置与启动.mp4 29.7MB |
│ │ │ ├─21–HDFS透明加密–操作与使用.mp4 18.87MB |
│ │ │ └─22–课程总结和今日作业.mp4 13.5MB |
│ │ └─day7视频 |
│ │ └─6.视频 |
│ │ ├─00–课程内容大纲和学习目标.mp4 7.08MB |
│ │ ├─01–Hadoop源码编译–编译源码的原因和本地库概念.mp4 13.71MB |
│ │ ├─02–Hadoop源码编译–如何进行源码编译.mp4 31.86MB |
│ │ ├─03–Hadoop源码编译–Linux平台编译–编译环境软件、依赖安装.mp4 30.65MB |
│ │ ├─04–Hadoop源码编译–Linux平台编译–maven执行编译.mp4 48.07MB |
│ │ ├─05–Hadoop源码编译–了解如何在windows平台编译.mp4 15.85MB |
│ │ ├─06–HDFS源码工程结构简介.mp4 28.97MB |
│ │ ├─07–HDFS核心源码解读–IDEA中Debug功能介绍与快捷键使用.mp4 36.47MB |
│ │ ├─08–HDFS核心源码解读–客户端核心类–Configuration.mp4 23.28MB |
│ │ ├─09–HDFS核心源码解读–客户端核心类–FileSystem.mp4 33.73MB |
│ │ ├─10–HDFS核心源码解读–RPC协议介绍与Hadoop RPC接口介绍.mp4 20.74MB |
│ │ ├─11–HDFS核心源码解读–Hadoop RPC接口之ClientProtocol.mp4 27.42MB |
│ │ ├─12–HDFS核心源码解读–Hadoop RPC接口之ClientDataNodeProtocol.mp4 10.96MB |
│ │ ├─13–HDFS核心源码解读–Hadoop RPC接口之DataNodeProtocol.mp4 20.47MB |
│ │ ├─14–HDFS核心源码解读–HDFS流式接口之DataTransferProtocol.mp4 8.6MB |
│ │ ├─15–HDFS核心源码解读–写数据流程源码分析(1)–客户端请求NameNode.mp4 20.83MB |
│ │ ├─16–HDFS核心源码解读–写数据流程源码分析(2)–NameNode执行请求操作检查.mp4 16.64MB |
│ │ ├─17–HDFS核心源码解读–写数据流程源码分析(3)–DataStreamer写数据.mp4 39.21MB |
│ │ ├─18–HDFS核心源码解读–读数据流程源码分析(1)–客户端请求NameNode.mp4 25.61MB |
│ │ ├─19–HDFS核心源码解读–读数据流程源码分析(2)–getBlockLocations.mp4 13.36MB |
│ │ ├─20–HDFS核心源码解读–读数据流程源码分析(3)–客户端读数据块.mp4 16.69MB |
│ │ └─21–课程总结和今日作业.mp4 11.07MB |
│ └─资料-零基础学习Hadoop3.0-HDFS从入门到源码 |
│ ├─1.大数据导论与Hadoop环境搭建 |
│ │ ├─1.讲义 |
│ │ │ ├─第一章 大数据开篇与Hadoop搭建.docx 5.13MB |
│ │ │ └─第一章 大数据开篇与Hadoop搭建.pptx 4.24MB |
│ │ ├─2.图片 |
│ │ │ └─Apache Hadoop ecosystem-2020.png 218.07KB |
│ │ ├─3.代码、配置 |
│ │ │ └─hadoop集群搭建配置参考.xml 2.54KB |
│ │ ├─4.资料、软件 |
│ │ │ ├─hadoop 3.1.4 |
│ │ │ │ ├─1.源码包、安装包 |
│ │ │ │ │ ├─hadoop-3.1.4-bin-snappy-CentOS7.tar.gz 289.09MB |
│ │ │ │ │ └─hadoop-3.1.4-src.tar.gz 29.1MB |
│ │ │ │ └─2.编译安装文档 |
│ │ │ │ ├─Linux编译 |
│ │ │ │ │ ├─apache-maven-3.5.4-bin.tar.gz 8.43MB |
│ │ │ │ │ ├─cmake-3.13.5.tar.gz 8.22MB |
│ │ │ │ │ ├─Hadoop3编译安装.md 10.32KB |
│ │ │ │ │ ├─Hadoop3编译安装.pdf 861.2KB |
│ │ │ │ │ ├─jdk-8u65-linux-x64.tar.gz 172.86MB |
│ │ │ │ │ ├─protobuf-2.5.0.tar.gz 2.29MB |
│ │ │ │ │ ├─snappy-1.1.3.tar.gz 1.44MB |
│ │ │ │ │ └─编译结果截图.png 77.42KB |
│ │ │ │ └─Windows编译 |
│ │ │ │ ├─cmake-3.18.4-win64-x64.msi 25.29MB |
│ │ │ │ ├─cnvisualstudio2010professionalx86dvd532145.iso 2.41GB |
│ │ │ │ ├─Git-2.28.0-64-bit.exe 48.74MB |
│ │ │ │ ├─msys2-x8664-20180531.exe 75.48MB |
│ │ │ │ ├─protobuf-2.5.0.zip 1.53MB |
│ │ │ │ ├─protoc-2.5.0-win32.zip 637.64KB |
│ │ │ │ ├─setup-x8664.exe 1.29MB |
│ │ │ │ ├─snappy-1.1.7.zip 123.65KB |
│ │ │ │ ├─windows8.1sdksetup.exe 974.66KB |
│ │ │ │ ├─zlib1211.zip 729.9KB |
│ │ │ │ └─编译Hadoopwindows版本.docx 812.6KB |
│ │ │ └─数据分析方法论.pdf 1.38MB |
│ │ └─5.扩展 |
│ │ ├─Google-Bigtable中文版1.0.pdf 1.27MB |
│ │ ├─Google-File-System中文版1.0.pdf 1.67MB |
│ │ ├─Google-MapReduce中文版1.0.pdf 1.09MB |
│ │ └─hadoop 3-0新特性简单介绍-一亩三分地-CSDN博客-hadoop3-0.mhtml 1.74MB |
│ ├─2.HDFS入门与应用开发 |
│ │ ├─1.讲义 |
│ │ │ ├─第二章 HDFS入门与应用开发.docx 3.73MB |
│ │ │ └─第二章 HDFS入门与应用开发.pptx 2.76MB |
│ │ ├─2.图片 |
│ │ │ └─舆情数据上报需求解读.png 32.86KB |
│ │ ├─3.代码、配置 |
│ │ │ ├─example-hdfs.rar 10.99KB |
│ │ │ ├─hdfs java api-3.1.4-pom – basic.xml 1.54KB |
│ │ │ ├─hdfs java api-3.1.4-pom.xml 3.76KB |
│ │ │ ├─log4j.properties 348B |
│ │ │ └─sentimentupload.rar 50.82MB |
│ │ ├─4.资料、软件 |
│ │ │ ├─1.数据集 |
│ │ │ │ ├─weibodata1.txt 298.97MB |
│ │ │ │ ├─weibodata2.txt 42.82MB |
│ │ │ │ └─蔡徐坤微博数据集 |
│ │ │ │ ├─caixukun.csv 2.4MB |
│ │ │ │ └─caixukunnew.csv 2.69MB |
│ │ │ ├─2.异常信息 |
│ │ │ │ ├─1.Namenodeisinsafemode..txt 10.28KB |
│ │ │ │ └─2.Connectionrefused.txt 12.44KB |
│ │ │ ├─3.打包脚本 |
│ │ │ │ └─sentimentupload.sh 549B |
│ │ │ └─hadoop-3.1.4winutils.zip 753.89KB |
│ │ └─5.扩展 |
│ │ ├─Google-File-System中文版1.0.pdf 1.67MB |
│ │ ├─log4j的ConversionPattern参数的意义-CSDN博客.mhtml 3.01MB |
│ │ ├─RAID有哪几种?有什么区别? – 知乎.mhtml 2.43MB |
│ │ └─《中国城市数字经济指数白皮书(2020)》.pdf 5.83MB |
│ ├─3.HDFS数据存储与数据管理 |
│ │ ├─1.讲义 |
│ │ │ ├─第三章 HDFS数据存储与数据管理.docx 3.35MB |
│ │ │ └─第三章 HDFS数据存储与数据管理.pptx 3.38MB |
│ │ ├─2.图片 |
│ │ │ ├─HDFS网关代理服务–HttpFS–概述和工作原理.png 294.82KB |
│ │ │ └─块存储类型选择策略.png 30.12KB |
│ │ ├─3.代码、配置 |
│ │ │ └─core-site.xml 1.55KB |
│ │ ├─4.资料、软件 |
│ │ │ ├─Postman-win64-7.36.1-Setup.exe 96.37MB |
│ │ │ ├─二进制文件查看工具 |
│ │ │ │ ├─bigdataviewer |
│ │ │ │ │ └─BigdataFileViewer-1.2.1-SNAPSHOT-jar-with-dependencies.jar 227.28MB |
│ │ │ │ └─TestStand Sequence File Viewer.zip 3.12MB |
│ │ │ └─数据集 |
│ │ │ ├─hbase-logs.zip 6.65MB |
│ │ │ ├─randomdata.zip 39.68MB |
│ │ │ ├─猎聘.rar 48.46MB |
│ │ │ └─银行 |
│ │ │ └─bankrecord.csv 97.58MB |
│ │ └─5.扩展 |
│ │ └─HTTP 协议中 URI 和 URL 有什么区别? – 知乎.mhtml 1.22MB |
│ ├─4.HDFS集群管理与运维 |
│ │ ├─1.讲义 |
│ │ │ ├─第四章 HDFS集群管理与运维.docx 3.39MB |
│ │ │ └─第四章 HDFS集群管理与运维.pptx 3.91MB |
│ │ ├─2.图片 |
│ │ │ ├─disk balancer工作原理.png 46.28KB |
│ │ │ ├─HDFS Disk Balancer磁盘均衡器的功能职责.png 44.56KB |
│ │ │ ├─HDFS HA–QJM.png 467.82KB |
│ │ │ ├─QJM–zkfc如何实现主备切换、脑裂隔离.png 238.55KB |
│ │ │ ├─单点故障和主备切换.png 40.23KB |
│ │ │ ├─联邦+HA滚动升级.png 32.11KB |
│ │ │ ├─联邦机制.png 242.8KB |
│ │ │ └─节点block负载平衡器–balancer.png 38.09KB |
│ │ ├─3.代码、配置 |
│ │ │ ├─federation-HA-Federation配置文件 |
│ │ │ │ ├─core-site.xml 574B |
│ │ │ │ ├─Federation初始化步骤.txt 462B |
│ │ │ │ ├─hdfs-site.xml 3.04KB |
│ │ │ │ ├─mapred-site.xml 151B |
│ │ │ │ └─yarn-site.xml 842B |
│ │ │ ├─hadoop-HA集群搭建.txt 7.89KB |
│ │ │ └─Hadoop纠删码算法启用ISA-L加速库.md 1.72KB |
│ │ ├─4.资料、软件 |
│ │ └─5.扩展 |
│ │ └─Reed-Solomon纠错码-RS码-(里德-所罗门码)-Claire-wulian的博客-CSDN博客.mhtml 2.86MB |
│ ├─5.HDFS架构原理 |
│ │ ├─1.讲义 |
│ │ │ ├─第五章 HDFS架构原理.docx 3.28MB |
│ │ │ └─第五章 HDFS架构原理.pptx 3.47MB |
│ │ ├─2.图片 |
│ │ │ ├─Data-Read-Mechanism-in-HDFS.gif 1.26MB |
│ │ │ ├─Data-Write-Mechanism-in-HDFS.gif 1.45MB |
│ │ │ ├─nameNode元数据文件.png 45.74KB |
│ │ │ ├─联邦+HA集群下系统的不同标识含义.png 47.72KB |
│ │ │ └─默认3副本策略.png 23.96KB |
│ │ ├─3.代码、配置 |
│ │ │ └─example-hdfs.rar 15.81KB |
│ │ ├─4.资料、软件 |
│ │ │ ├─edits.xml 48.57KB |
│ │ │ └─fsimage.xml 15.06KB |
│ │ └─5.扩展 |
│ ├─6.HDFS数据安全与隐私保护 |
│ │ ├─1.讲义 |
│ │ │ ├─第六章 HDFS数据安全与隐私保护.docx 1.69MB |
│ │ │ └─第六章 HDFS数据安全与隐私保护.pptx 3.21MB |
│ │ ├─2.图片 |
│ │ │ ├─Kerberos角色.png 30.26KB |
│ │ │ └─透明加密概念.png 102.89KB |
│ │ ├─3.代码、配置 |
│ │ │ └─KMS服务配置 |
│ │ │ ├─core-site.xml 1.83KB |
│ │ │ ├─hdfs-site.xml 1.6KB |
│ │ │ ├─kms-env.sh 1.45KB |
│ │ │ └─kms-site.xml 1.13KB |
│ │ ├─4.资料、软件 |
│ │ │ └─HDFSDataatRestEncryption.pdf 905.05KB |
│ │ └─5.扩展 |
│ │ ├─Virtual Machine- the difference between snapshot and backup – SharePointeur-com.mhtml 659.31KB |
│ │ └─域(计算机词汇)-百度百科.mhtml 2.07MB |
│ └─7.HDFS核心源码分析 |
│ ├─1.讲义 |
│ │ ├─第七章 HDFS核心源码分析.docx 4.35MB |
│ │ └─第七章 HDFS核心源码分析.pptx 5.46MB |
│ ├─2.图片 |
│ │ └─编译结果截图.png 77.42KB |
│ ├─3.代码、配置 |
│ │ └─example-hdfs.rar 21.29KB |
│ ├─4.资料、软件 |
│ │ ├─hadoop-3.1.4-bin-snappy-CentOS7.tar.gz 289.09MB |
│ │ ├─hadoop-3.1.4-src.tar.gz 29.1MB |
│ │ ├─hadoop-3.1.4winutils.zip 753.89KB |
│ │ ├─Linux编译 |
│ │ │ ├─apache-maven-3.5.4-bin.tar.gz 8.43MB |
│ │ │ ├─cmake-3.13.5.tar.gz 8.22MB |
│ │ │ ├─Hadoop3编译安装.md 10.34KB |
│ │ │ ├─Hadoop3编译安装.pdf 861.2KB |
│ │ │ ├─jdk-8u65-linux-x64.tar.gz 172.86MB |
│ │ │ ├─protobuf-2.5.0.tar.gz 2.29MB |
│ │ │ ├─snappy-1.1.3.tar.gz 1.44MB |
│ │ │ └─编译结果截图.png 77.42KB |
│ │ └─Windows编译 |
│ │ ├─cmake-3.18.4-win64-x64.msi 25.29MB |
│ │ ├─cnvisualstudio2010professionalx86dvd532145.iso 2.41GB |
│ │ ├─Git-2.28.0-64-bit.exe 48.74MB |
│ │ ├─msys2-x8664-20180531.exe 75.48MB |
│ │ ├─protobuf-2.5.0.zip 1.53MB |
│ │ ├─protoc-2.5.0-win32.zip 637.64KB |
│ │ ├─setup-x8664.exe 1.29MB |
│ │ ├─setup.log 613B |
│ │ ├─setup.log.full 613B |
│ │ ├─snappy-1.1.7.zip 123.65KB |
│ │ ├─windows8.1sdksetup.exe 974.66KB |
│ │ ├─zlib1211.zip 729.9KB |
│ │ └─编译Hadoopwindows版本.docx 812.6KB |
│ └─5.扩展 |
│ └─Intellij IDEA中使用Debug调试-菜鸟程序员成长路-CSDN博客.mhtml 6.41MB |
├─2.MapReduce |
│ ├─1.MapReduce入门与基础理论 |
│ │ ├─1.讲义 |
│ │ │ ├─第1章 MapReduce入门与基础理论.docx 1.73MB |
│ │ │ └─第1章 MapReduce入门与基础理论.pptx 2.54MB |
│ │ ├─2.图片 |
│ │ │ ├─MapReduce架构体系图v2.0.png 123.53KB |
│ │ │ ├─MapReduce流程图.png 301.8KB |
│ │ │ ├─以Wordcount为例梳理MapReduce执行流程–基础版.png 41.23KB |
│ │ │ └─如何模拟实现分布式计算.png 69.32KB |
│ │ ├─3.代码、配置 |
│ │ │ ├─example-mr.rar 14.72KB |
│ │ │ ├─log4j.properties 533B |
│ │ │ └─wordcount.rar 3.74KB |
│ │ ├─4.资料、软件 |
│ │ │ ├─hadoop-3.1.4winutils.zip 753.89KB |
│ │ │ └─执行winutils报错解决.rar 391.25KB |
│ │ ├─5.扩展 |
│ │ │ └─Google-MapReduce中文版1.0.pdf 1.09MB |
│ │ └─6.视频 |
│ │ ├─00–课程内容大纲和学习目标.mp4 11.94MB |
│ │ ├─01–初识MapReduce–理解MapReduce思想:先分再合,分而治之.mp4 22.89MB |
│ │ ├─02–初识MapReduce–场景:如何模拟实现分布式计算.mp4 22.23MB |
│ │ ├─03–初识MapReduce–Hadoop团队MapReduce设计构思.mp4 16.88MB |
│ │ ├─04–Hadoop MapReduce介绍、特性优点、局限性.mp4 18.49MB |
│ │ ├─05–Hadoop MapReduce编程–架构体系与实例进程.mp4 5.97MB |
│ │ ├─06–Hadoop MapReduce编程–用户编程规范.mp4 8.48MB |
│ │ ├─07–Hadoop MapReduce编程–MR内部执行流程–基础版.mp4 5.93MB |
│ │ ├─08–Hadoop序列化机制和数据类型–Writable.mp4 17.11MB |
│ │ ├─09–MapReduce入门案例:WordCount–业务需求与编程思路.mp4 7.66MB |
│ │ ├─10–MapReduce入门案例:WordCount–开发环境搭建.mp4 21.25MB |
│ │ ├─11–MapReduce入门案例:WordCount–Mapper类实现–输入输出类型确定.mp4 27.45MB |
│ │ ├─12–MapReduce入门案例:WordCount–Mapper类实现–重写map方法实现业务.mp4 35.61MB |
│ │ ├─13–MapReduce入门案例:WordCount–Reducer类实现–输入输出类型确定.mp4 9.75MB |
│ │ ├─14–MapReduce入门案例:WordCount–Reducer类实现–重写reduce方法实现业务.mp4 26.57MB |
│ │ ├─15–MapReduce入门案例:WordCount–客户端驱动程序类.mp4 48.53MB |
│ │ ├─16–MapReduce入门案例:WordCount–使用ToolRunner提交程序.mp4 38.24MB |
│ │ ├─17–MapReduce程序运行–运行模式与参数设置.mp4 20.45MB |
│ │ ├─18–MapReduce程序运行–YARN集群模式运行实操.mp4 52.39MB |
│ │ ├─19–MapReduce程序运行–Local本地模式运行实操.mp4 43.92MB |
│ │ ├─20–MapReduce程序运行–如何区分运行模式.mp4 44.44MB |
│ │ ├─21–MapReduce输入、输出梳理及注意事项.mp4 43.66MB |
│ │ ├─22–MapReduce流程简单梳理–WordCount是怎样计算的.mp4 19.16MB |
│ │ ├─23–MapReduce流程简单梳理–Map阶段执行过程.mp4 18.7MB |
│ │ └─24–MapReduce流程简单梳理–Reduce阶段执行过程.mp4 16.84MB |
│ ├─2.MapReduce基础编程 |
│ │ ├─1.讲义 |
│ │ │ ├─第2章 MapReduce基础编程.docx 1.49MB |
│ │ │ └─第2章 MapReduce基础编程.pptx 2.03MB |
│ │ ├─2.图片 |
│ │ │ ├─MapReduce流程图.png 301.8KB |
│ │ │ ├─maptask并行度机制–逻辑规划.png 78.7KB |
│ │ │ ├─reduce分组中,key和value迭代器之间的关系.png 121.73KB |
│ │ │ ├─案例1:统计各州累计疫情病例数.png 59.83KB |
│ │ │ ├─案例2:倒序统计各州累计疫情病例数.png 63.46KB |
│ │ │ └─案例3:topn案例需求.png 51.01KB |
│ │ ├─3.代码、配置 |
│ │ │ ├─covid19 |
│ │ │ │ ├─beans |
│ │ │ │ │ ├─CovidBean.java 2.3KB |
│ │ │ │ │ └─CovidCountBean.java 1.71KB |
│ │ │ │ ├─etl |
│ │ │ │ │ ├─ETLDriver.java 1.92KB |
│ │ │ │ │ └─ETLMapper.java 660B |
│ │ │ │ ├─partitionsum |
│ │ │ │ │ ├─CovidPartitionDriver.java 2.04KB |
│ │ │ │ │ ├─CovidPartitionMapper.java 705B |
│ │ │ │ │ ├─CovidPartitionReducer.java 575B |
│ │ │ │ │ └─StatePartitioner.java 994B |
│ │ │ │ ├─sortsum |
│ │ │ │ │ ├─CovidSortSumDriver.java 1.95KB |
│ │ │ │ │ ├─CovidSortSumMapper.java 827B |
│ │ │ │ │ └─CovidSortSumReducer.java 595B |
│ │ │ │ ├─sum |
│ │ │ │ │ ├─CovidSumDriver.java 1.99KB |
│ │ │ │ │ ├─CovidSumMapper.java 984B |
│ │ │ │ │ └─CovidSumReducer.java 928B |
│ │ │ │ └─top |
│ │ │ │ ├─n |
│ │ │ │ │ ├─CovidTopNDriver.java 2.36KB |
│ │ │ │ │ ├─CovidTopNMapper.java 998B |
│ │ │ │ │ └─CovidTopNReducer.java 782B |
│ │ │ │ └─one |
│ │ │ │ ├─CovidGroupingComparator.java 644B |
│ │ │ │ ├─CovidTop1Driver.java 2.33KB |
│ │ │ │ ├─CovidTop1Mapper.java 879B |
│ │ │ │ └─CovidTop1Reducer.java 697B |
│ │ │ ├─example-mr-02.rar 66.81KB |
│ │ │ ├─log4j.properties 533B |
│ │ │ ├─pom.xml 2.4KB |
│ │ │ └─数据集 |
│ │ │ ├─us-covid19-counties.dat 133.59KB |
│ │ │ └─uscovid198505.zip 12.89MB |
│ │ ├─4.资料、软件 |
│ │ │ ├─hadoop-3.1.4winutils.zip 753.89KB |
│ │ │ └─执行winutils报错解决.rar 391.25KB |
│ │ ├─5.扩展 |
│ │ │ └─MapReduce – Combiners – Tutorialspoint.mht 986.94KB |
│ │ └─6.视频 |
│ │ ├─00–课程内容大纲和学习目标.mp4 11.05MB |
│ │ ├─01–MapReduce Partition–数据分区机制.mp4 32.71MB |
│ │ ├─02–MapReduce Combiner–规约组件介绍、使用与注意事项.mp4 33.17MB |
│ │ ├─03–MapReduce编程指南与技巧(把握住key).mp4 14.14MB |
│ │ ├─04–MapReduce美国新冠疫情统计–案例需求、背景与意义.mp4 8.67MB |
│ │ ├─05–MapReduce美国新冠疫情案例–疫情汇总统计–业务需求与实现思路.mp4 17.06MB |
│ │ ├─06–MapReduce美国新冠疫情案例–疫情汇总统计–自定义对象及序列化实现.mp4 29.09MB |
│ │ ├─07–MapReduce美国新冠疫情案例–疫情汇总统计–Mapper、Reducer代码实现.mp4 33.58MB |
│ │ ├─08–MapReduce美国新冠疫情案例–疫情汇总统计–驱动类编写与程序执行.mp4 37.68MB |
│ │ ├─09–MapReduce美国新冠疫情案例–疫情汇总倒序统计–需求与实现思路.mp4 26.59MB |
│ │ ├─10–MapReduce美国新冠疫情案例–疫情汇总倒序统计–重写对象排序规则.mp4 14.44MB |
│ │ ├─11–MapReduce美国新冠疫情案例–疫情汇总倒序统计–代码开发实现.mp4 59.8MB |
│ │ ├─12–MapReduce美国新冠疫情案例–疫情按州分区统计–需求与实现思路.mp4 20.02MB |
│ │ ├─13–MapReduce美国新冠疫情案例–疫情按州分区统计–自定义分区器.mp4 35.96MB |
│ │ ├─14–MapReduce美国新冠疫情案例–疫情按州分区统计–代码开发与实现.mp4 53.18MB |
│ │ ├─15–MapReduce–探究分区个数和reducetask个数关系.mp4 17.49MB |
│ │ ├─16–MapReduce美国新冠疫情案例–各州Top1确诊县城–需求与实现思路.mp4 18.9MB |
│ │ ├─17–MapReduce美国新冠疫情案例–各州Top1确诊县城–重写排序规则.mp4 29.91MB |
│ │ ├─18–MapReduce美国新冠疫情案例–各州Top1确诊县城–自定义分组规则.mp4 33.05MB |
│ │ ├─19–MapReduce美国新冠疫情案例–各州Top1确诊县城–提交执行.mp4 18.25MB |
│ │ ├─20–MapReduce美国新冠疫情案例–(扩展)各州TopN确诊县城统计.mp4 32.61MB |
│ │ ├─21–MapReduce–reduce分组中key和values迭代器之间的关系(重点难点).mp4 65.32MB |
│ │ ├─22–MapReduce–并行度机制–maptask并行度机制(逻辑规划).mp4 28.1MB |
│ │ ├─23–MapReduce–并行度机制–reducetask并行度机制.mp4 9.72MB |
│ │ ├─24–MapReduce–工作机制详解–maptask工作机制详解.mp4 27.65MB |
│ │ ├─25–MapReduce–工作机制详解–reducetask工作机制详解.mp4 19.11MB |
│ │ └─26–MapReduce–shuffle机制.mp4 21.37MB |
│ ├─3.MapReduce高阶编程 |
│ │ ├─1.讲义 |
│ │ │ ├─第3章 MapReduce高阶编程.docx 1.25MB |
│ │ │ └─第3章 MapReduce高阶编程.pptx 1.81MB |
│ │ ├─2.图片 |
│ │ │ ├─MapReduce没有reducetask执行.png 33.27KB |
│ │ │ ├─案例:map join的实现思路.png 58.62KB |
│ │ │ └─案例:reduce join的实现思路.png 35.83KB |
│ │ ├─3.代码、配置 |
│ │ │ ├─example-mr-03.rar 95.01KB |
│ │ │ ├─join数据集 |
│ │ │ │ ├─itheimagoods.txt 1.85MB |
│ │ │ │ └─itheimaordergoods.txt 85.74KB |
│ │ │ ├─log4j.properties 533B |
│ │ │ └─sql数据 |
│ │ │ ├─itheimagoods.sql 62.61KB |
│ │ │ ├─itheimaordergoods.sql 566.21KB |
│ │ │ └─part-m-00000 35.04KB |
│ │ ├─4.资料、软件 |
│ │ │ ├─hadoop-3.1.4winutils.zip 753.89KB |
│ │ │ └─执行winutils报错解决.rar 391.25KB |
│ │ ├─5.扩展 |
│ │ │ ├─DBOutputFormat (Apache Hadoop Main 3.1.4 API).mht 343.72KB |
│ │ │ ├─DBWritable (Apache Hadoop Main 3.1.4 API).mht 323.42KB |
│ │ │ ├─SQL—Expression -1 of ORDER BY clause is not in GROUP BY clause and contains nonaggregated column – – 云-社区 – 腾讯云.mhtml 3.09MB |
│ │ │ └─解决-Err- 1055 – Expression -1 of ORDER BY clause is not in GROUP BY clause and contains—报错-一条吃软饭的软狗-CSDN博客.mhtml 1.26MB |
│ │ └─6.视频 |
│ │ ├─00–课程内容大纲和学习目标.mp4 9.36MB |
│ │ ├─01–MapReduce Counter–计数器概念和内置计数器介绍.mp4 27.82MB |
│ │ ├─02–MapReduce Counter–自定义计数器的使用.mp4 23.62MB |
│ │ ├─03–MapReduce DB操作–读写数据库背景知识.mp4 7.28MB |
│ │ ├─04–MapReduce DB操作–读数据库操作–需求与DBInputFormat类.mp4 18.99MB |
│ │ ├─05–MapReduce DB操作–读数据库操作–自定义对象实现DBWritable.mp4 58.98MB |
│ │ ├─06–MapReduce DB操作–读数据库操作–代码开发实现.mp4 78.25MB |
│ │ ├─07–MapReduce DB操作–写数据库操作–需求与DBOutputFormat类.mp4 24.63MB |
│ │ ├─08–MapReduce DB操作–写数据库操作–代码开发实现.mp4 102.07MB |
│ │ ├─09–MapReduce Join关联操作–join背景知识.mp4 4.79MB |
│ │ ├─10–MapReduce Join关联操作–reduce side join–实现原理和弊端.mp4 6.87MB |
│ │ ├─11–MapReduce Join关联操作–reduce side join–案例需求与实现思路.mp4 22.47MB |
│ │ ├─12–MapReduce Join关联操作–reduce side join–Mapper类代码实现.mp4 55.74MB |
│ │ ├─13–MapReduce Join关联操作–reduce side join–Reducer类与驱动程序代码实现.mp4 78.3MB |
│ │ ├─14–MapReduce Join关联操作–reduce side join–结果优化排序.mp4 69.69MB |
│ │ ├─15–MapReduce DistributedCache–分布式缓存.mp4 13.72MB |
│ │ ├─16–MapReduce Join关联操作–map side join–实现原理和优势.mp4 8.1MB |
│ │ ├─17–MapReduce Join关联操作–map side join–案例需求与实现思路.mp4 13.11MB |
│ │ ├─18–MapReduce Join关联操作–map side join–如何读取分布式缓存文件.mp4 29.4MB |
│ │ ├─19–MapReduce Join关联操作–map side join–程序执行.mp4 55.9MB |
│ │ ├─20–MapReduce 工作流–背景原理和需求.mp4 6.85MB |
│ │ └─21–MapReduce 工作流–代码开发实现.mp4 60.81MB |
│ ├─4.MapReduce整体流程核心源码解读 |
│ │ ├─1.讲义 |
│ │ │ ├─第4章 MapReduce整体流程核心源码解读.docx 9.62MB |
│ │ │ └─第4章 MapReduce整体流程核心源码解读.pptx 10.94MB |
│ │ ├─2.图片 |
│ │ │ ├─1、MapReduce job提交流程图.png 51.98KB |
│ │ │ ├─2、LineRecordReader读数据时的优化措施.png 25.46KB |
│ │ │ ├─MapReduce-v3.png 695.94KB |
│ │ │ └─MapReduce流程图.png 301.8KB |
│ │ ├─3.代码、配置 |
│ │ │ ├─hadoop-3.1.4-src-注释.rar 37.5MB |
│ │ │ ├─hadoop-3.1.4-src.tar.gz 29.1MB |
│ │ │ └─wordcount.rar 5.65KB |
│ │ ├─4.资料、软件 |
│ │ │ ├─MapTask类源码梳理.xmind 102.82KB |
│ │ │ └─ReduceTask类源码梳理.xmind 74.33KB |
│ │ ├─5.扩展 |
│ │ │ └─源码分析mapred.mapper.new-api-mapred.reducer.new-api设置与区别mryqu新浪博客.mht 2.28MB |
│ │ └─6.视频 |
│ │ ├─00–课程内容大纲和学习目标.mp4 8MB |
│ │ ├─01–Debug环境准备–IDEA工程和源码工程如何关联.mp4 45.18MB |
│ │ ├─02–Debug环境准备–IDEA模式介绍与调试相关按键.mp4 41.61MB |
│ │ ├─03–Debug环境准备–IDEA远程Debug的使用.mp4 40.38MB |
│ │ ├─04–MapReduce Job提交源码追踪–Job类和开启实时状态追踪.mp4 25.61MB |
│ │ ├─05–MapReduce Job提交源码追踪–submit–(1)跟运行环境建立连接.mp4 46.3MB |
│ │ ├─06–MapReduce Job提交源码追踪–submit–(2)提交全流程剖析.mp4 57.99MB |
│ │ ├─07–Map阶段执行流程源码解析–map整体流程概述.mp4 10.49MB |
│ │ ├─08–Map阶段执行流程源码解析–MapTask类–功能区划分.mp4 22.1MB |
│ │ ├─09–Map阶段执行流程源码解析–MapTask类–Map阶段准备部分.mp4 38.58MB |
│ │ ├─10–Map阶段执行流程源码解析–MapTask类–Map阶段工作部分.mp4 65.52MB |
│ │ ├─11–Map阶段执行流程源码解析–(1)数据输入–InputFormat–getSplits逻辑规划.mp4 33.83MB |
│ │ ├─12–Map阶段执行流程源码解析–(1)数据输入–InputFormat–LineRecordReader读数据.mp4 25.49MB |
│ │ ├─13–Map阶段执行流程源码解析–(2)数据处理–Mapper类map方法.mp4 17.17MB |
│ │ ├─14–Map阶段执行流程源码解析–(3)数据输出–OutputCollector不同实现.mp4 23.13MB |
│ │ ├─15–Map阶段执行流程源码解析–(3)数据输出–Partition分区计算.mp4 22.43MB |
│ │ ├─16–Map阶段执行流程源码解析–(3)数据输出–MapOutputBuffer–环形缓冲区介绍.mp4 18.23MB |
│ │ ├─17–Map阶段执行流程源码解析–(3)数据输出–环形缓冲区初始化和数据收集.mp4 24.39MB |
│ │ ├─18–Map阶段执行流程源码解析–(3)数据输出–spill、sort.mp4 63.91MB |
│ │ ├─19–Map阶段执行流程源码解析–(3)数据输出–merge.mp4 12.2MB |
│ │ ├─20–Map阶段执行流程源码解析–(3)数据输出–Combiner.mp4 5.08MB |
│ │ ├─21–Reduce阶段执行流程源码解析–reduce整体流程概述.mp4 7.05MB |
│ │ ├─22–Reduce阶段执行流程源码解析–ReduceTask类梳理解读.mp4 101.99MB |
│ │ ├─23–Reduce阶段执行流程源码解析–shuffle过程–init、run.mp4 189.61MB |
│ │ ├─24–Reduce阶段执行流程源码解析–shuffle过程–copy.mp4 51.35MB |
│ │ ├─25–Reduce阶段执行流程源码解析–shuffle过程–merge、sort.mp4 60.99MB |
│ │ ├─26–Reduce阶段执行流程源码解析–reduce数据处理过程.mp4 36.69MB |
│ │ ├─27–Reduce阶段执行流程源码解析–OutputFormat输出数据.mp4 3.65MB |
│ │ └─28–Reduce阶段执行流程源码解析–shuffle机制.mp4 20.8MB |
│ └─5.MapReduce性能调整与优化 |
│ ├─1.讲义 |
│ │ ├─第五章:MapReduce性能调优.docx 5.31MB |
│ │ └─第五章:MapReduce性能调优.pptx 5.23MB |
│ ├─2.图片 |
│ │ └─行式存储 列式存储.png 205.58KB |
│ ├─3.代码、配置 |
│ │ └─3.代码、配置.rar 1.36MB |
│ ├─4.资料、软件 |
│ │ ├─测试数据 |
│ │ │ ├─01-02.SequenceFile & MapFile |
│ │ │ │ └─secondhouse.csv 2.12MB |
│ │ │ ├─03.ORCFile |
│ │ │ │ └─pay.csv 93.11KB |
│ │ │ └─04.Compress |
│ │ │ ├─SogouQ.reduced 153.48MB |
│ │ │ └─搜狗数据字典.txt 480B |
│ │ └─编译资料 |
│ │ ├─Apache Hadoop3-1-3编译安装部署lzo压缩指南(照做就可以,别落一步)-后来X大数据-CSDN博客.mhtml 1.85MB |
│ │ ├─hadoop-lzo-0.4.21-SNAPSHOT.jar 184.59KB |
│ │ └─Hadoop3编译【Snappy】安装.md 10.28KB |
│ ├─5.扩展 |
│ │ └─Hadoop – Apache Hadoop 3.1.4.mht 394.93KB |
│ └─6.视频 |
│ ├─00–课程内容大纲和学习目标.mp4 7.99MB |
│ ├─01–MapReduce应用场景及优缺点.mp4 36.63MB |
│ ├─02–MapReduce IO性能优化–文件存储格式–行式存储、列式存储.mp4 15.49MB |
│ ├─03–MapReduce IO性能优化–文件存储格式–SequenceFile–介绍.mp4 10.45MB |
│ ├─04–MapReduce IO性能优化–文件存储格式–SequenceFile–使用mr生成Seq文件需求.mp4 19.21MB |
│ ├─05–MapReduce IO性能优化–文件存储格式–SequenceFile–使用mr生成Seq文件代码.mp4 56.82MB |
│ ├─06–MapReduce IO性能优化–文件存储格式–SequenceFile–使用mr读取Seq文件代码.mp4 35.31MB |
│ ├─07–MapReduce IO性能优化–文件存储格式–SequenceFile–案例:使用Sequence File合并小文件.mp4 29.36MB |
│ ├─08–MapReduce IO性能优化–文件存储格式–MapFile–介绍.mp4 6.46MB |
│ ├─09–MapReduce IO性能优化–文件存储格式–MapFile–使用mr生成MapFile.mp4 31.65MB |
│ ├─10–MapReduce IO性能优化–文件存储格式–MapFile–使用mr读取MapFile.mp4 20.85MB |
│ ├─11–MapReduce IO性能优化–文件存储格式–ORC File–介绍.mp4 7.57MB |
│ ├─12–MapReduce IO性能优化–文件存储格式–ORC File–使用mr生成ORC File.mp4 56.28MB |
│ ├─13–MapReduce IO性能优化–文件存储格式–ORC File–使用mr读取ORC File.mp4 34.54MB |
│ ├─14–MapReduce数据压缩优化–压缩概念和压缩的设置.mp4 20.44MB |
│ ├─15–MapReduce数据压缩优化–Gzip压缩–使用mr生成Gzip压缩.mp4 43.29MB |
│ ├─16–MapReduce数据压缩优化–Gzip压缩–使用mr解压Gzip压缩文件.mp4 22.72MB |
│ ├─17–MapReduce数据压缩优化–Snappy压缩–使用mr生成Snappy压缩文件.mp4 29.17MB |
│ ├─18–MapReduce数据压缩优化–Snappy压缩–shuffle过程使用snappy压缩.mp4 22.4MB |
│ ├─19–MapReduce数据压缩优化–Snappy压缩–使用mr解压snappy压缩文件.mp4 14.94MB |
│ ├─20–MapReduce数据压缩优化–Lzo压缩–介绍与安装配置.mp4 10.92MB |
│ ├─21–MapReduce数据压缩优化–Lzo压缩–使用mr生成lzo压缩文件.mp4 23.89MB |
│ ├─22–MapReduce数据压缩优化–Lzo压缩–使用mr解压lzo压缩文件.mp4 15.82MB |
│ ├─23–MapReduce数据压缩优化–Lzo压缩–split切分特性测试使用.mp4 33.61MB |
│ ├─24–MapReduce属性优化–mr的基准测试.mp4 20.96MB |
│ ├─25–MapReduce属性优化–Uber模式使用.mp4 19.52MB |
│ ├─26–MapReduce属性优化–JVM重用机制.mp4 3.11MB |
│ ├─27–MapReduce属性优化–task重试机制.mp4 3.32MB |
│ ├─28–MapReduce属性优化–推测执行机制.mp4 6.45MB |
│ ├─29–MapReduce属性优化–小文件合并优化–CombineTextInputFormat.mp4 29.54MB |
│ ├─30–MapReduce属性优化–shuffle优化–减少spill和merge次数.mp4 8.76MB |
│ ├─5-01–MapReduce应用场景及优缺点.mp4 29.87MB |
│ └─5-30–MapReduce属性优化–shuffle优化–减少spill和merge次数.mp4 4.67MB |
└─3.YARN |
├─1.YARN框架概述与集群部署 |
│ ├─1.讲义 |
│ │ ├─第1章 YARN框架概述与集群部署.docx 2.23MB |
│ │ └─第1章 YARN框架概述与集群部署.pptx 2.21MB |
│ ├─2.图片 |
│ │ └─YARN-MapReduce2-Architecture.png 108.8KB |
│ ├─3.代码、配置 |
│ │ ├─hadoop-3.1.4-bin-snappy-CentOS7.tar.gz 289.09MB |
│ │ ├─hadoop-3.1.4-src.tar.gz 29.1MB |
│ │ ├─hadoop3.1.4集群搭建配置参考.xml 3.73KB |
│ │ ├─yarn ha集群参考配置-3.1.4.xml 2.35KB |
│ │ ├─zookeeper-3.4.6.tar.gz 16.88MB |
│ │ └─zookeeper集群搭建.txt 3.14KB |
│ ├─4.资料、软件 |
│ │ ├─YARN Container虚拟内存不足的异常信息.txt 16.44KB |
│ │ └─ZooInspector.zip 1.51MB |
│ ├─5.扩展 |
│ │ ├─apache-hadoop-yarn-moving-beyond-mapreduce-and-batch-processing-with-apache-hadoop-2.mobi 10.66MB |
│ │ └─Linux资源管理之cgroups简介 – 美团技术团队.mht 2.9MB |
│ └─6.视频 |
│ ├─00–课程内容大纲和学习目标.mp4 4.88MB |
│ ├─01–Hadoop YARN概述–起源和发展简史–Hadoop演变阶段.mp4 33.28MB |
│ ├─02–Hadoop YARN概述–起源和发展简史–对yarn的需求.mp4 8.04MB |
│ ├─03–Hadoop YARN–简介.mp4 8.58MB |
│ ├─04–Hadoop YARN–yarn和MRv1区别.mp4 8.95MB |
│ ├─05–Hadoop YARN–集群安装部署–yarn集群角色介绍.mp4 6.3MB |
│ ├─06–Hadoop YARN–集群安装部署–角色部署规划.mp4 7.79MB |
│ ├─07–Hadoop YARN–集群安装部署–基础环境准备.mp4 11.58MB |
│ ├─08–Hadoop YARN–集群安装部署–配置文件修改详解.mp4 59.74MB |
│ ├─09–Hadoop YARN–集群安装部署–集群启动.mp4 16.5MB |
│ ├─10–Hadoop YARN–集群安装部署–yarn集群初体验.mp4 24.93MB |
│ ├─11–Hadoop YARN–RM重启机制、状态恢复.mp4 35.96MB |
│ ├─12–Hadoop YARN–HA集群–概念及架构实现原理.mp4 15.25MB |
│ ├─13–Hadoop YARN–HA集群–配置启动.mp4 46.53MB |
│ ├─14–Hadoop YARN–HA集群–HA模式体验及故障转移测试.mp4 19.14MB |
│ ├─15–Hadoop YARN–架构体系.mp4 9.19MB |
│ ├─16–Hadoop YARN–架构体系–3大组件功能职责及容器Container作用.mp4 15.08MB |
│ ├─17–Hadoop YARN–架构体系–通信协议.mp4 5.04MB |
│ └─18–Hadoop YARN–架构体系–程序提交执行交互流程.mp4 20.13MB |
├─2.YARN监控管理与资源管理 |
│ ├─1.讲义 |
│ │ ├─第2章 YARN监控管理与资源管理.docx 3.85MB |
│ │ └─第2章 YARN监控管理与资源管理.pptx 3.05MB |
│ ├─2.图片 |
│ │ ├─YARN WebUI V1页面详解.png 622.21KB |
│ │ ├─正在运行的MR应用程序.png 223.19KB |
│ │ └─运行完成的MR应用程序.png 195.36KB |
│ ├─3.代码、配置 |
│ │ ├─hadoop3.1.4集群搭建配置参考.xml 3.73KB |
│ │ ├─yarn Timeline相关设置.xml 3.62KB |
│ │ ├─案例1:Capacity调度配置参考.xml 1.11KB |
│ │ └─案例2:yarn多租户资源隔离配置(fair) |
│ │ ├─fair-scheduler.xml 1.99KB |
│ │ └─yarn-site.xml 2.19KB |
│ ├─4.资料、软件 |
│ │ ├─Apache Hadoop 3.1.4 – Hadoop- Fair Scheduler.mht 430.23KB |
│ │ ├─Apache Hadoop 3.1.4 – YARN Commands.mht 468.48KB |
│ │ ├─capacity-scheduler-官方自带默认配置.xml 9.79KB |
│ │ └─fair-scheduler官方示例说明.xml 2.5KB |
│ ├─5.扩展 |
│ │ └─关于YARN Node Labels的一点理解.mht 569.99KB |
│ └─6.视频 |
│ ├─01–课程内容大纲和学习目标.mp4 6.99MB |
│ ├─02–YARN WebUI服务–WebUI v1使用及页面功能讲解.mp4 59.04MB |
│ ├─03–YARN WebUI服务–JobHistory Server介绍与配置使用.mp4 41.63MB |
│ ├─04–YARN WebUI服务–Timeline Server介绍与配置使用.mp4 17.01MB |
│ ├─05–YARN操作维护命令–User用户命令讲解.mp4 48.92MB |
│ ├─06–YARN操作维护命令–Admin管理命令讲解.mp4 16.88MB |
│ ├─07–YARN资源管理与隔离.mp4 14.78MB |
│ ├─08–YARN资源调度器Scheduler–概述.mp4 23.75MB |
│ ├─09–YARN资源调度器Scheduler–FIFO Scheduler先进先出.mp4 5.38MB |
│ ├─10–YARN资源调度器Scheduler–Capacity Scheduler容量–概念及核心配置参数.mp4 32.03MB |
│ ├─11–YARN资源调度器Scheduler–Capacity Scheduler容量–动态加载更新配置.mp4 3.83MB |
│ ├─12–YARN资源调度器Scheduler–案例:Capacity调度配置–需求和配置参数分析.mp4 8.84MB |
│ ├─13–YARN资源调度器Scheduler–案例:Capacity调度配置–功能实现.mp4 33.41MB |
│ ├─14–YARN资源调度器Scheduler–Fair Scheduler公平–概念及和配置参数.mp4 30.74MB |
│ ├─15–YARN资源调度器Scheduler–案例–Fari公平调度实现多租户资源隔离.mp4 69.16MB |
│ ├─16–YARN资源调度器Scheduler–恢复默认设置.mp4 15.64MB |
│ ├─17–YARN核心参数梳理.mp4 20.9MB |
│ └─18–YARN Resource资源配置.mp4 22.44MB |
└─3.YARN应用开发与核心源码剖析 |
├─1.讲义 |
│ ├─第3章 YARN应用开发与核心源码剖析.docx 3.47MB |
│ └─第3章 YARN应用开发与核心源码剖析.pptx 3.2MB |
├─2.图片 |
│ └─YARN应用开发流程.png 78.01KB |
├─3.代码、配置 |
│ ├─example-mr.rar 11.59KB |
│ ├─hadoop-3.1.4-src-注释版.rar 37.51MB |
│ └─hadoop-3.1.4-src.tar.gz 29.1MB |
├─4.资料、软件 |
│ └─IDEA中源码不可编辑解决.txt 277B |
├─5.扩展 |
└─6.视频 |
├─00–课程内容大纲和学习目标.mp4 3.92MB |
├─01–YARN应用开发–概述.mp4 16.74MB |
├─02–YARN应用开发–客户端Client开发.mp4 14.71MB |
├─03–YARN应用开发–ApplicationMaster开发.mp4 18.62MB |
├─04–YARN应用开发–编程开发库应用.mp4 31.61MB |
├─05–YARN源码剖析–MapReduce程序提交YARN流程–整体概述.mp4 13.79MB |
├─06–YARN源码剖析–MapReduce程序提交YARN流程–源码阅读环境.mp4 23.48MB |
├─07–YARN源码剖析–MapReduce程序提交YARN流程–客户端提交程序到RM.mp4 118.48MB |
├─08–YARN源码剖析–MapReduce程序提交YARN流程–YARN启动AM.mp4 44.64MB |
└─09–YARN源码剖析–MapReduce程序提交YARN流程–调度执行应用进程.mp4 50.15MB |
本站所有资源均来自网络,版权归原作者所有,本站仅提供收集与推荐,若侵犯到您的权益,请【给我们反馈】,我们将在24小时内处理!
聚资料(juziliao.com)免责声明:
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!(gm@juziliao.com)
2. 分享目的仅供大家学习和交流,请不要用于商业用途!如需商用请联系原作者购买正版! 3.如有链接无法下载、失效或洽谈广告,请联系网站客服(微信:shangen0228)处理!