26. 下列哪項不是Hadoop之特性?(A)開放原始碼 (Open Source) (B)即時性(Real Time)(C)以Java為其程式基礎 (D)分散式計算 (Distributed Com
31. 有關分析巨量社群網路資料之敘述,下列何者有誤?(A)連結預測(Link Prediction) 之技術可用來推薦朋友(B)使用者的朋友個數之分配通常遵從冪次法則(Power-law distr
32. 有關頻繁樣式探勘(Frequent Pattern Mining) 之敘述,下列何者有誤?(A)若一項目集合之所有子集合皆為頻繁,則該項目集合必定也為頻繁(B)所有最大(maximal) 頻繁
33. 巨量資料庫管理最常用的操作包含Selection、Projection、Union與Intersection。對於此4種資料庫操作,若想實作在Hadoop的工作任務中,哪2種操作需要同時使用一
34. 在資料分析中,經常遇到一分類或預測模型產生高或低的偏差(Bias) 與變異性(Variance)。以下有4個關於模型偏差與變異數之敘述,下列何者正確?1過適(Overfitting)的模型通常
36. 在巨量資料分析專案中,下列何者比較無助於提升分類模型準確度(Accuracy)?(A)使用交叉驗證(Cross-Validation)(B)增加或減少模型參數(Parameters)以提升或降
37. 下列的統計學習(Statistical Learning)方法經常被用於分析巨量資料,請問何者應用的領域問題與其它不同?(A)隨機森林(Random Forests) (B)主成分分析(Pri
38. 有關隨機森林(Random Forests)之敘述,下列何者正確? (A)採用 Boosting 方法(B)使用多個淺層決策樹 (Decision Stump) 構建整個森林(C)是一種重抽樣
39. 在統計學習(Statistical Learning)方法論中,有關模型的過適(Overfitting)之敘述,下列何者有誤?(A)此種模型的錯誤(Error)常來自於高的方差(High Va
40. 有關近年來巨量資料處理與分析的發展,下列何者有誤?(A)異質運算(Heterogeneous Computing)的興起 (B)記憶體內運算(In-memory Computing)的普及(C
41. 有關巨量資料分析的平台環境建置之敘述,下列何者正確?(A)傳統的關聯式資料庫管理系統無法處理巨量資料(B)NoSQL資料庫系統已逐漸取代傳統的關聯式資料庫系統(C)Apache Hadoop可
42. 有關 MapReduce程式模型(Programming Model)之敘述,下列何者有誤?(A)比較不適合用來處理疊代式(Iterative) 的資料處理分析過程(B)概念來自於函數式程式語
43. 有關統計學習(Statistical Learning)中的非監督式學習(Unsupervised Learning)方法,下列敘述何者有誤?(A)可以做為維度縮減 (Dimensionali
45. 如何降低模型過適(Overfitting)問題?(A)降低資料量(B)在目標函數中加入參數正則化(Regularization) 項(C)對資料作正規化(Normalization)前處理(D
47. 在Hadoop中,下列何者為有效的資料分析流程?(A)Input → Reducer → Mapper → Combiner → Output(B)Input → Mapper → Reduc