spark 집중 추출 방식의 차이collect ()take()_foreach()

1372 단어 spark
spark 집중 추출 방식의 차이
RDD                      RDD               
  。
              、        collect(),      RDD     
 。
collect()           ,     RDD          ,collect()                       。

take(n)    RDD    n    ,             ,          
      。      ,                     。

                   ,                。
          ,      top()   RDD         。top()      
     ,               ,        。

                     。takeSample(withReplacement, num, 
seed)                  ,       。

       RDD               ,               
  ,      。      JSON                 ,    
       。      ,      

foreach()        RDD           ,      RDD     。

좋은 웹페이지 즐겨찾기