RDD(Resilient Distributed Datasets)全称为弹性分布式数据集,是一种分布的内存抽象。RDD是Spark的核心概念,它表示一个只读的记录分区集合,即一旦被创建就无法修改,只能通过RDD的转化操作产生一个新的RDD。
{% page-ref page="rdds-de-te-dian.md" %}
{% page-ref page="rdds-de-cao-zuo.md" %}
{% page-ref page="transformations-xiang-jie.md" %}