标签: RDD


  1. Spark-特殊的RDD

    pair RDD

    键值对类型的RDD,一个重要的RDD


  2. Spark-RDD

    RDD

    RDD(Resilient Distributed Datasets)弹性分布式数据集,是在集群应用中分享数据的一种高效,通用,容错的抽象,是Spark提供的最重要的抽象的概念,它是一种有容错机制的特殊集合,可以分布在集群的节点上,以函数式编操作集合的方式,进行各种并行操作。