课程介绍(A000830):
黑马程序员 大数据 全网第一套PySpark-大数据开发
文件目录:
黑马程序员 大数据 全网第一套PySpark-大数据开发 |
│ ├─PySpark-视频 |
│ │ ├─0-导学视频 |
│ │ │ └─PySpark导学.mp4 368.43MB |
│ │ ├─1-第一部分-Spark基础入门 |
│ │ │ ├─1-第一章 |
│ │ │ │ ├─01-课程导入.mp4 5.67MB |
│ │ │ │ ├─Spark基础入门-第一章-1.1-Spark简单介绍.mp4 46.18MB |
│ │ │ │ ├─Spark基础入门-第一章-1.2-Spark风雨十年.mp4 61.13MB |
│ │ │ │ ├─Spark基础入门-第一章-1.3-Spark和Hadoop的对比.mp4 75.02MB |
│ │ │ │ ├─Spark基础入门-第一章-1.4-Spark四大特点.mp4 64.85MB |
│ │ │ │ ├─Spark基础入门-第一章-1.5-Spark框架模块.mp4 57.79MB |
│ │ │ │ ├─Spark基础入门-第一章-1.6-Spark运行模式.mp4 59.03MB |
│ │ │ │ ├─Spark基础入门-第一章-1.7-Spark的架构角色.mp4 88.17MB |
│ │ │ │ └─Spark基础入门-第一章-总结.mp4 11.04MB |
│ │ │ ├─2-第二章 |
│ │ │ │ ├─Spark基础入门-第二章-2.1-课程服务器环境.mp4 43.6MB |
│ │ │ │ ├─Spark基础入门-第二章-2.2-Local模式基本原理.mp4 88.65MB |
│ │ │ │ ├─Spark基础入门-第二章-2.3-在Linux上服务器上安装Anaconda.mp4 268.55MB |
│ │ │ │ └─Spark基础入门-第二章-2.4-Spark Local模式部署.mp4 514.95MB |
│ │ │ ├─3-第三章 |
│ │ │ │ ├─Spark基础入门-第三章-3.1-StandAlone的运行原理.mp4 23.39MB |
│ │ │ │ ├─Spark基础入门-第三章-3.2-StandAlone部署.mp4 624.2MB |
│ │ │ │ ├─Spark基础入门-第三章-3.3-StandAlone程序测试.mp4 271.91MB |
│ │ │ │ ├─Spark基础入门-第三章-3.4-Spark程序运行层次划分.mp4 255.49MB |
│ │ │ │ └─Spark基础入门-第三章-3.5-总结.mp4 34.76MB |
│ │ │ ├─4-第四章 |
│ │ │ │ ├─Spark基础入门-第四章-4.1-StandAlone HA模式的运行原理.mp4 63.25MB |
│ │ │ │ ├─Spark基础入门-第四章-4.2-StandAlone 部署和测试.mp4 251.35MB |
│ │ │ │ └─Spark基础入门-第四章-4.3-总结.mp4 29.79MB |
│ │ │ ├─5-第五章 |
│ │ │ │ ├─Spark基础入门-第五章-5.1-Spark On YARN的运行原理.mp4 90.03MB |
│ │ │ │ ├─Spark基础入门-第五章-5.2-Spark On YARN 部署和测试.mp4 214.69MB |
│ │ │ │ ├─Spark基础入门-第五章-5.3-两种部署模式的区别.mp4 100.92MB |
│ │ │ │ ├─Spark基础入门-第五章-5.4-两种部署模式的演示和总结.mp4 157.93MB |
│ │ │ │ ├─Spark基础入门-第五章-5.5-两种模式任务提交流程.mp4 125.57MB |
│ │ │ │ └─Spark基础入门-第五章-5.6-总结.mp4 38.74MB |
│ │ │ ├─6-第六章 |
│ │ │ │ ├─Spark基础入门-第六章-6.1-框架和类库.mp4 42.43MB |
│ │ │ │ ├─Spark基础入门-第六章-6.2-PySpark类库介绍.mp4 56MB |
│ │ │ │ ├─Spark基础入门-第六章-6.3-PySpark安装.mp4 156.69MB |
│ │ │ │ └─Spark基础入门-第六章-6.4-总结.mp4 9.07MB |
│ │ │ ├─7-第七章 |
│ │ │ │ ├─Spark基础入门-第七章-7.1-本机配置Python环境.mp4 189.34MB |
│ │ │ │ ├─Spark基础入门-第七章-7.2-PyCharm本地和远程解释器配置.mp4 106.98MB |
│ │ │ │ ├─Spark基础入门-第七章-7.3-编程入口SparkContext对象以及WordCount演示.mp4 248.97MB |
│ │ │ │ ├─Spark基础入门-第七章-7.4-WordCount代码流程解析.mp4 134.6MB |
│ │ │ │ ├─Spark基础入门-第七章-7.5-提交WordCount到Linux集群运行.mp4 144.23MB |
│ │ │ │ └─Spark基础入门-第七章-7.6-总结.mp4 23.75MB |
│ │ │ └─8-第八章 |
│ │ │ ├─Spark基础入门-第八章-8.1-Spark运行角色回顾.mp4 72.42MB |
│ │ │ ├─Spark基础入门-第八章-8.2-分布式代码执行分析.mp4 156.84MB |
│ │ │ ├─Spark基础入门-第八章-8.3-Python On Spark执行原理.mp4 135.93MB |
│ │ │ └─Spark基础入门-第八章-总结.mp4 11.95MB |
│ │ ├─2-第二部分-SparkCore |
│ │ │ ├─1-第一章 |
│ │ │ │ ├─SparkCore-第一章-1.1-什么是RDD.mp4 22.11MB |
│ │ │ │ ├─SparkCore-第一章-1.2-RDD五大特性-特性1.mp4 15.74MB |
│ │ │ │ ├─SparkCore-第一章-1.3-RDD五大特性-特性2.mp4 61.14MB |
│ │ │ │ ├─SparkCore-第一章-1.4-RDD的五大特性-特性3.mp4 26.84MB |
│ │ │ │ ├─SparkCore-第一章-1.5-RDD的五大特性-特性4.mp4 42.87MB |
│ │ │ │ ├─SparkCore-第一章-1.6-RDD的五大特性-特性5.mp4.mp4 53.15MB |
│ │ │ │ ├─SparkCore-第一章-1.7-WordCount结合RDD特性进行执行分析.mp4 205.3MB |
│ │ │ │ └─SparkCore-第一章-1.8-总结.mp4 21.49MB |
│ │ │ ├─2-第二章 |
│ │ │ │ ├─SparkCore-第二章-1-RDD的创建-1.mp4 31.39MB |
│ │ │ │ ├─SparkCore-第二章-10-RDD算子-filter.mp4 37.06MB |
│ │ │ │ ├─SparkCore-第二章-11-RDD算子-distinct.mp4 53.73MB |
│ │ │ │ ├─SparkCore-第二章-12-RDD算子-union.mp4 31.62MB |
│ │ │ │ ├─SparkCore-第二章-13-RDD算子-join.mp4 86.96MB |
│ │ │ │ ├─SparkCore-第二章-14-RDD算子-intersection.mp4 29.46MB |
│ │ │ │ ├─SparkCore-第二章-15-RDD算子-glom.mp4 9.26MB |
│ │ │ │ ├─SparkCore-第二章-16-RDD算子-groupByKey.mp4 55.64MB |
│ │ │ │ ├─SparkCore-第二章-17-RDD算子-sortBy.mp4 100.83MB |
│ │ │ │ ├─SparkCore-第二章-18-RDD算子-sortByKey.mp4 78.44MB |
│ │ │ │ ├─SparkCore-第二章-19-RDD算子-案例.mp4 146.47MB |
│ │ │ │ ├─SparkCore-第二章-2-RDD的创建-2.mp4 210.02MB |
│ │ │ │ ├─SparkCore-第二章-20-RDD算子-案例-提交到YARN执行.mp4 340.44MB |
│ │ │ │ ├─SparkCore-第二章-21-RDD算子-countByKey.mp4 58.4MB |
│ │ │ │ ├─SparkCore-第二章-22-RDD算子-reduce.mp4 53.11MB |
│ │ │ │ ├─SparkCore-第二章-23-RDD算子-fold.mp4 57.46MB |
│ │ │ │ ├─SparkCore-第二章-24-RDD算子-take-first-count-top.mp4 41.78MB |
│ │ │ │ ├─SparkCore-第二章-25-RDD算子-takeSample.mp4 73.94MB |
│ │ │ │ ├─SparkCore-第二章-26-RDD算子-takeOrdered.mp4 40.16MB |
│ │ │ │ ├─SparkCore-第二章-27-RDD算子-foreach.mp4 72.47MB |
│ │ │ │ ├─SparkCore-第二章-28-RDD算子-saveAsTextFile.mp4 118.39MB |
│ │ │ │ ├─SparkCore-第二章-29-RDD算子-mapPartitions.mp4 86.75MB |
│ │ │ │ ├─SparkCore-第二章-3-RDD算子概念和分类.mp4 67.11MB |
│ │ │ │ ├─SparkCore-第二章-30-RDD算子-foreachPartition.mp4 37.86MB |
│ │ │ │ ├─SparkCore-第二章-31-RDD算子-partitionBy.mp4 74.59MB |
│ │ │ │ ├─SparkCore-第二章-32-RDD算子-repartition-coalesce.mp4 95.14MB |
│ │ │ │ ├─SparkCore-第二章-33-RDD算子-面试题-groupByKey和reduceByKey的区别.mp4 56.5MB |
│ │ │ │ ├─SparkCore-第二章-34-总结.mp4 10.35MB |
│ │ │ │ ├─SparkCore-第二章-4-转换算子-map.mp4 104.95MB |
│ │ │ │ ├─SparkCore-第二章-5-转换算子-flatMap.mp4 56.42MB |
│ │ │ │ ├─SparkCore-第二章-6-转换算子-reduceByKey.mp4 21.36MB |
│ │ │ │ ├─SparkCore-第二章-7-RDD算子-mapValues.mp4 40.74MB |
│ │ │ │ ├─SparkCore-第二章-8-WordCount案例回顾.mp4 53.72MB |
│ │ │ │ └─SparkCore-第二章-9-RDD算子-groupBy.mp4 81.39MB |
│ │ │ ├─3-第三章 |
│ │ │ │ ├─SparkCore-第三章-1-RDD的数据是过程数据概念.mp4 52.26MB |
│ │ │ │ ├─SparkCore-第三章-2-RDD的缓存.mp4 323.24MB |
│ │ │ │ ├─SparkCore-第三章-3-RDD的CheckPoint.mp4 138.09MB |
│ │ │ │ └─SparkCore-第三章-4-总结.mp4 20.77MB |
│ │ │ ├─4-第四章 |
│ │ │ │ ├─SparkCore-第四章-1-jieba库入门使用.mp4 146.29MB |
│ │ │ │ ├─SparkCore-第四章-2-案例需求1开发.mp4 373.43MB |
│ │ │ │ ├─SparkCore-第四章-3-案例需求2开发.mp4 227.51MB |
│ │ │ │ ├─SparkCore-第四章-4-案例需求3开发.mp4 140.39MB |
│ │ │ │ ├─SparkCore-第四章-5-提交代码到YARN集群运行.mp4 153.12MB |
│ │ │ │ └─SparkCore-第四章-6-作业和总结.mp4 8.88MB |
│ │ │ ├─5-第五章 |
│ │ │ │ ├─SparkCore-第五章-1-广播变量.mp4 354.61MB |
│ │ │ │ ├─SparkCore-第五章-2-累加器.mp4 213.12MB |
│ │ │ │ ├─SparkCore-第五章-3-广播变量累加器综合案例.mp4 287.43MB |
│ │ │ │ └─SparkCore-第五章-4-总结.mp4 3.17MB |
│ │ │ └─6-第六章 |
│ │ │ ├─SparkCore-第六章-1-DAG.mp4 86.26MB |
│ │ │ ├─SparkCore-第六章-2-宽窄依赖和阶段划分.mp4 73.07MB |
│ │ │ ├─SparkCore-第六章-3-内存迭代计算.mp4 217.51MB |
│ │ │ ├─SparkCore-第六章-4-Spark并行度.mp4 86.48MB |
│ │ │ ├─SparkCore-第六章-5-Spark任务调度.mp4 168.34MB |
│ │ │ ├─SparkCore-第六章-6-Spark运行概念名词解释和层级梳理.mp4 90.16MB |
│ │ │ └─SparkCore-第六章-7-总结.mp4 14.97MB |
│ │ ├─3-第三部分-SparkSQL |
│ │ │ ├─1-第一章 |
│ │ │ │ └─SparkSQL-第一章-SparkSQL基础入门.mp4 32.28MB |
│ │ │ ├─2-第二章 |
│ │ │ │ ├─SparkSQL-第二章-1-SparkSQL和Hive的异同以及SparkSQL的数据抽象.mp4 141.3MB |
│ │ │ │ ├─SparkSQL-第二章-2-SparkSession执行环境入口构建和SparkSQL HelloWorld.mp4 142.14MB |
│ │ │ │ └─SparkSQL-第二章-3-总结.mp4 5.56MB |
│ │ │ ├─3-第三章 |
│ │ │ │ ├─SparkSQL-第三章-1-DataFrame对象的构成.mp4 18.96MB |
│ │ │ │ ├─SparkSQL-第三章-10-DSL风格入门API.mp4 200.05MB |
│ │ │ │ ├─SparkSQL-第三章-11-SQL风格入门API.mp4 73.21MB |
│ │ │ │ ├─SparkSQL-第三章-12-WordCount案例.mp4 216.29MB |
│ │ │ │ ├─SparkSQL-第三章-13-电影评分案例编程.mp4 530.2MB |
│ │ │ │ ├─SparkSQL-第三章-14-SparkSQL Shuffle阶段分区数参数设定.mp4 108.97MB |
│ │ │ │ ├─SparkSQL-第三章-15-异常数据处理API.mp4 300.02MB |
│ │ │ │ ├─SparkSQL-第三章-16-DataFrame数据写出.mp4 153.07MB |
│ │ │ │ ├─SparkSQL-第三章-17-DataFrame使用JDBC协议读写数据库(MySQL).mp4 176.64MB |
│ │ │ │ ├─SparkSQL-第三章-18-总结.mp4 9.53MB |
│ │ │ │ ├─SparkSQL-第三章-2-DataFrame创建-1.mp4 194.59MB |
│ │ │ │ ├─SparkSQL-第三章-3-DataFrame创建-2.mp4 92.99MB |
│ │ │ │ ├─SparkSQL-第三章-4-DataFrame创建-3.mp4 64.56MB |
│ │ │ │ ├─SparkSQL-第三章-5-DataFrame创建-4-基于Pandas的DF转换为SparkSQL的DF对象.mp4 6.96MB |
│ │ │ │ ├─SparkSQL-第三章-6-标准API读取text数据源构建DataFrame.mp4 69.29MB |
│ │ │ │ ├─SparkSQL-第三章-7-标准API读取json构建DataFrame.mp4 32.21MB |
│ │ │ │ ├─SparkSQL-第三章-8-标准API读取jcsv构建DataFrame(1).mp4 50.8MB |
│ │ │ │ ├─SparkSQL-第三章-8-标准API读取jcsv构建DataFrame.mp4 50.8MB |
│ │ │ │ └─SparkSQL-第三章-9-标准API读取jparquet构建DataFrame.mp4 65.29MB |
│ │ │ ├─4-第四章 |
│ │ │ │ ├─SparkSQL-第四章-1-UDF创建演示.mp4 228.18MB |
│ │ │ │ ├─SparkSQL-第四章-2-注册返回值是数组类型的UDF.mp4 131.32MB |
│ │ │ │ ├─SparkSQL-第四章-3-返回字典类型的UDF定义.mp4 145.4MB |
│ │ │ │ ├─SparkSQL-第四章-4-拓展-通过RDD代码模拟UDAF效果.mp4 101.6MB |
│ │ │ │ ├─SparkSQL-第四章-5-窗口函数的演示.mp4 170.8MB |
│ │ │ │ └─SparkSQL-第四章-6-总结.mp4 4.74MB |
│ │ │ ├─5-第五章 |
│ │ │ │ ├─SparkSQL-第五章-1-Catalyst优化器.mp4 54.68MB |
│ │ │ │ └─SparkSQL-第五章-2-SparkSQL执行流程及本章总结.mp4 42.14MB |
│ │ │ ├─6-第六章 |
│ │ │ │ └─SparkSQL-第六章-SparkOnHive原理和配置及总结.mp4 334.22MB |
│ │ │ └─7-第七章 |
│ │ │ └─SparkSQL-第七章-分布式SQL的执行引擎原理和配置.mp4 309.39MB |
│ │ ├─4-第四部分-案例 |
│ │ │ ├─案例-案例背景及需求1开发.mp4 81.98MB |
│ │ │ ├─案例-需求2开发.mp4 411.11MB |
│ │ │ ├─案例-需求3开发.mp4 71.42MB |
│ │ │ └─案例-需求4开发.mp4 235.69MB |
│ │ └─5-第五部分-Spark新特性及核心回顾 |
│ │ ├─Spark新特性及核心回顾-1-1-HashShuffleManager.mp4 101.99MB |
│ │ ├─Spark新特性及核心回顾-1-2-SortShuffleManager.mp4 86.46MB |
│ │ ├─Spark新特性及核心回顾-1-3-总结.mp4 18.48MB |
│ │ ├─Spark新特性及核心回顾-2-1-3.0新特性-AQE.mp4 176.45MB |
│ │ ├─Spark新特性及核心回顾-2-2-新特性-动态分区裁剪.mp4 47.1MB |
│ │ ├─Spark新特性及核心回顾-2-3-新特性-koalas库.mp4 303.84MB |
│ │ ├─Spark新特性及核心回顾-2-4-总结.mp4 24.25MB |
│ │ └─Spark新特性及核心回顾-3-Spark概念总结.mp4 60.94MB |
│ └─PySpark-资料 |
│ ├─PPT |
│ │ ├─1 – Spark基础入门.pdf 6.45MB |
│ │ ├─2 – Spark核心编程.pdf 6.92MB |
│ │ ├─3 – SparkSQL.pdf 7.08MB |
│ │ ├─4 – Spark综合案例.pdf 819.04KB |
│ │ └─5 – Spark核心回顾+新特性.pdf 2.51MB |
│ ├─代码.zip 19.52MB |
│ ├─完整虚拟机2021-SZ |
│ │ ├─2021新版本软件安装v520211002192.168.88.2安装Spark-NoSQL-Flink.docx 15.39MB |
│ │ ├─centos20211005.zip.001 7.96GB |
│ │ ├─centos20211005.zip.002 7.96GB |
│ │ ├─centos20211005.zip.003 7.96GB |
│ │ ├─centos20211005.zip.004 7.96GB |
│ │ ├─centos20211005.zip.005 5.66GB |
│ │ ├─大数据环境统一虚拟机 |
│ │ │ ├─文档 |
│ │ │ │ ├─01-安装VMware虚拟机.doc 638KB |
│ │ │ │ ├─02-虚拟机安装.doc 2.02MB |
│ │ │ │ ├─03-CRT连接linux.doc 1.05MB |
│ │ │ │ ├─04-vmware软件卸载.doc 578KB |
│ │ │ │ ├─05-大数据环境配置统一.doc 3.12MB |
│ │ │ │ ├─06-zookeeper集群安装.doc 138.5KB |
│ │ │ │ ├─07-hadoop集群安装操作.doc 287.5KB |
│ │ │ │ ├─08-hive安装操作.doc 154KB |
│ │ │ │ ├─09-spark部署文档.doc 2.47MB |
│ │ │ │ ├─10-HBase安装操作.docx 203.36KB |
│ │ │ │ ├─11-Phoenix的安装操作.doc 359.5KB |
│ │ │ │ ├─12-kafka环境搭建.docx 89.1KB |
│ │ │ │ ├─13-flume安装以及nosql综合案例环境.doc 86.5KB |
│ │ │ │ └─14-flink集群安装.doc 3.9MB |
│ │ │ ├─虚拟机 |
│ │ │ │ ├─node1.zip 11.21GB |
│ │ │ │ ├─node2.zip 8.72GB |
│ │ │ │ └─node3.zip 7.58GB |
│ │ │ └─资料.zip 9.1GB |
│ │ ├─说明1:1-7快照截图.jpg 26.3KB |
│ │ └─说明2.txt 192B |
│ └─资料 |
│ ├─Anaconda3-2021.05-Linux-x8664.sh 544.41MB |
│ ├─Anaconda3-2021.05-Windows-x8664.exe 477.2MB |
│ ├─apache-hive-3.1.2-bin.tar.gz 265.9MB |
│ ├─DAG 和 Action.drawio 2.3KB |
│ ├─hadoop-3.3.0 |
│ │ └─bin |
│ │ ├─hadoop.dll 85KB |
│ │ ├─hadoop.exp 19.3KB |
│ │ ├─hadoop.lib 32.46KB |
│ │ ├─hadoop.pdb 684KB |
│ │ ├─libwinutils.lib 1.25MB |
│ │ ├─winutils.exe 110KB |
│ │ └─winutils.pdb 1.13MB |
│ ├─hadoop-3.3.1.tar.gz 577.15MB |
│ ├─jdk-8u211-linux-x64.tar.gz 185.96MB |
│ ├─mysql-connector-java-5.1.41-bin.jar 969.54KB |
│ ├─mysql-connector-java-8.0.13.jar 2.03MB |
│ ├─pyarrow-4.0.1-cp38-cp38-manylinux2014x8664.whl 20.87MB |
│ ├─Spark On YARN Client模式.drawio 2.12KB |
│ ├─Spark On YARN Cluster模式.drawio 1.98KB |
│ ├─spark-3.2.0-bin-hadoop3.2.tgz 287.02MB |
│ ├─Spark层次关系概念图.png 118.54KB |
│ ├─Spark核心概念.png 724.93KB |
│ ├─Spark核心概念.xmind 746.76KB |
│ ├─Spark部署文档.md 28.93KB |
│ ├─WordCount代码执行的图示.drawio 2.27KB |
│ └─测试数据 |
│ ├─accumulatorbroadcastdata.txt 212B |
│ ├─apache.log 1.41KB |
│ ├─mini.json 118.62MB |
│ ├─minimini.json 1.17MB |
│ ├─order.text 2.84KB |
│ ├─SogouQ.txt 1.34MB |
│ ├─sql |
│ │ ├─helloworld.txt 37B |
│ │ ├─people.csv 188B |
│ │ ├─people.json 73B |
│ │ ├─people.txt 32B |
│ │ ├─stuscore.txt 1.2KB |
│ │ ├─u.data 1.89MB |
│ │ ├─user.avsc 185B |
│ │ ├─users.avro 334B |
│ │ ├─users.orc 547B |
│ │ └─users.parquet 615B |
│ ├─stuinfo.txt 331B |
│ ├─stuscore.txt 1.2KB |
│ ├─tinyfiles |
│ │ ├─1.txt 38B |
│ │ ├─2.txt 38B |
│ │ ├─3.txt 38B |
│ │ ├─4.txt 38B |
│ │ └─5.txt 38B |
│ └─words.txt 38B |
本站所有资源均来自网络,版权归原作者所有,本站仅提供收集与推荐,若侵犯到您的权益,请【给我们反馈】,我们将在24小时内处理!
聚资料(juziliao.com)免责声明:
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!(gm@juziliao.com)
2. 分享目的仅供大家学习和交流,请不要用于商业用途!如需商用请联系原作者购买正版! 3.如有链接无法下载、失效或洽谈广告,请联系网站客服(微信:shangen0228)处理!