問題詳情

28. Spark巨量資料處理技術所使用的主要資料模型是彈性分散式資料集(Resilient Distributed Dataset, RDD),下列何者不是RDD的核心成分?
(A) Partition Set
(B) Relational Scheme
(C) Dependencies Set
(D) Partition Scheme

參考答案

答案:B
難度:適中0.583
書單:沒有書單,新增

用户評論

BoAn】評論

RDD 主要由以下三個核心成分組成:Partition Set(分割集):RDD 將數據分成多個分割(partitions),每個分割都是數據的一個子集。分割集表示 RDD 中的所有分割。Dependencies Set(相依性集):這描述了 RDD 之間的相依性。例如,一個 RDD 可能依賴於另一個 RDD 來進行轉化操作。Partition Scheme(分割方案):這決定了如何將數據分割成分割集。RDD 的分割方案指定了如何在集群中分佈數據。Relational Scheme(關聯模式)在 RDD 的核心成分中不包括在內。RDD 主要用於分散式數據處理,而關聯模式通常用於描述數據表的結構和關係,例如在關聯式數據庫中使用。因此,選項 (B) Relational Scheme 是不正確的。