2023-2024年最新大数据学习路线
  ghF4SG6eYwQj 2023年11月02日 47 0



文章目录

  • 2023-2024年最新大数据学习路线
  • 大数据开发入门*01*
  • 阶段案例实战
  • 大数据核心基础*02*
  • 阶段案例实战
  • 千亿级数仓技术*03*
  • 阶段项目实战
  • PB级内存计算04
  • 阶段项目实战
  • 亚秒级实时计算*05*
  • 阶段项目实战
  • 大厂面试*06*


2023-2024年最新大数据学习路线

新路线图在Spark一章不再以Java,而把Python语言作为第一语言,更适应未来的发展趋势,路线图主要分为六大模块,根据以下内容对照自己掌握了多少大数据的知识,查缺补漏!文末送全套视频+源码资料。


2023-2024年最新大数据学习路线_开发语言

大数据开发入门01

Linux

基本命令

用户管理

权限管理

网络管理

SSH

VI

MySQL

DDL

DML

DQL

多表查询

分组查询

约束

Kettle

数据转换脚本组件Job开发

BI工具

基本操作常用图表仪表板

阶段案例实战

* 传统数据仓库实战

课程视频

1、Linux零基础入门到进阶

2、数据开发基础课程

大数据核心基础02

Zookeeper

架构原理

存储模型

ZK集群搭建

选举机制

Hadoop HDFS

HDFS架构

Block块存储

读写流程

NameNode

DataNode

高可用集群

Hadoop MapReduce

核心原理

执行流程

Shuffle机制

Hadoop YARN

YARN组件 架构原理 执行流程 调度器

Hive

HQL

数据类型

分区分桶

拉链表

元数据

数据压缩

存储格式

原理架构

性能优化

阶段案例实战

* 社交APP案例实战

课程视频1、零基础快速入门大数据

千亿级数仓技术03

CDH

CM架构

组件构建

CM实操

基于阿里数仓分层架构

ODS DIM DWS DWD DM ADS

Hive + Presto

架构原理 SQL调优 集群构建

Hive 性能调优

数据倾斜 JOIN调优 HIVE索引

调度

DS Azkaban Oozie

阶段项目实战

* 在线教育大数据数仓*

课程视频1、在线教育数仓实战

PB级内存计算04

Python编程

基本语法 数据结构 函数 面向对象 异常处理 模块与包 网络编程 多进程多线程 闭包 装饰器 迭代器

Spark

架构原理 Spark RDD Spark DF Spark DAG Spark SQL内存迭代 性能调优

任务调度 Pandas on Spark Spark on Hive Spark Shuffle

Spark 3.x 新特性

阶段项目实战

* 工业项目实战 保险大数据实战

课程视频

1、零基础快速入门Python编程

2、Python编程进阶

3、PySpark基础到精通

4、工业项目实战

亚秒级实时计算05

Flink Core

架构原理

批流一体

Window操作

State操作

DataStream

Checkpoint

Flink SQL

任务调度

负载均衡

状态管理

Runtime

执行计划

Flink性能监控与调优

Flink + Elasticsearch

Flink + KafkaFlink + Pulsar

Flink + ClickHouseFlink + Doris

阶段项目实战

* 车联网项目实战* 金融证券项目实战

课程视频

1、中间件&存储框架

2、Flink开发课程

3、车联网实时计算项目

4、金融证券项目实战

大厂面试06

数据结构

栈树图数组链表哈希表

高频算法

排序

查找

数组

字符串

链表

队列

二叉树

回溯

动态规划

贪心

复杂度

面试真题

编程语言

SQL

Hadoop生态

Hive

Spark

Flink

大厂架构

美团点评数仓架构 小米大数据架构 平安大数据架构

课程视频

1、北大硕士算法专题课

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
  xaeiTka4h8LY   2024年05月31日   38   0   0 MySQL数据库
  xaeiTka4h8LY   2024年05月17日   51   0   0 数据库JavaSQL
  xaeiTka4h8LY   2024年05月17日   47   0   0 数据库SQL
  xaeiTka4h8LY   2024年05月17日   37   0   0 MySQL数据库
  xaeiTka4h8LY   2024年05月31日   37   0   0 数据库mongodb
ghF4SG6eYwQj