DStream是Spark Streaming的基礎(chǔ)抽象,代表持續(xù)的數(shù)據(jù)流,它由一系列連續(xù)的RDD組成,一個批次間隔接收的數(shù)據(jù)只會存放在一個block中,因此每個批次間隔都只會產(chǎn)生一個RDD。
DStream與RDD同樣是不可變的,每個算子都會創(chuàng)建一個新的DStream,因此一個批次可能會有多個DStream。
對同一個DStream連續(xù)window沒有意義,因為foreach只會按照最后一個window生成的DStream來對待RDD。