Learning Apache Spark with Python
1. 序言
2. 为什么要用 Python Spark?
3. 配置运行平台
4. Apache Spark简介
5. 用RDD编程
6. 统计学与线性代数预科
7. 数据探索
8. 回归
9. 正则化
10. 分类
11. 聚类
12. RFM分析
13. 文本挖掘
14. 社会网络分析
15. ALS:股票组合建议
16. 蒙特卡罗模拟
17. 马尔可夫链蒙特卡罗
18. 神经网络
19. 我的PySark套装
20. 个人私藏
21. PySpark API
22. 齐柏林飞艇到Jupyter笔记本
23. 主要参考文献
Learning Apache Spark with Python
Docs
»
20. 个人私藏
20. 个人私藏
¶
您可以下载PDF版本:
PySpark Cheat Sheet
和
pdDataFrame vs rddDataFrame
.