
课程核心价值体系
本课程专为数学基础扎实且希望掌握分布式计算技术的开发者设计,通过三个阶段的教学模块,帮助学员完成从语言基础到企业级开发的跨越。
教学模块 | 技术要点 | 实训项目 |
---|---|---|
基础开发 | Scala语法精讲、Spark核心原理 | 环境搭建与基础数据处理 |
进阶应用 | Spark SQL优化、流式计算 | 实时日志分析系统 |
企业实战 | 机器学习算法、集群部署 | 电商用户行为分析 |
技术能力培养体系
-
分布式计算框架
掌握Spark Core运行机制与资源调度策略,学习RDD编程模型与性能优化技巧
-
实时数据处理
运用Spark Streaming构建流式处理管道,实现Kafka集成与状态管理
-
机器学习实战
应用MLlib实现分类、聚类算法,完成特征工程与模型评估全流程
企业级项目实战
电商用户画像系统
基于Spark SQL构建用户行为分析模型,实现点击流数据多维分析
金融风控模型
应用逻辑回归与决策树算法,构建信用卡欺诈检测系统