Skip to content

Latest commit

 

History

History
12 lines (5 loc) · 424 Bytes

README.md

File metadata and controls

12 lines (5 loc) · 424 Bytes

Spark RDDS

RDD(Resilient Distributed Datasets)全称为弹性分布式数据集,是一种分布的内存抽象。RDD是Spark的核心概念,它表示一个只读的记录分区集合,即一旦被创建就无法修改,只能通过RDD的转化操作产生一个新的RDD。

{% page-ref page="rdds-de-te-dian.md" %}

{% page-ref page="rdds-de-cao-zuo.md" %}

{% page-ref page="transformations-xiang-jie.md" %}