14. 下列何者為巨量資料最適當的定義?(A)巨大資料量的資料集(B)資料量大於1 TB的資料集(C)資料量超出傳統資料庫的抓取、儲存、管理和分析能力的資料集(D)資料量超出人類的抓取、儲存、管理和分
15. 巨量資料會使分析資訊的方式產生三大改變,不包括下列何者?(A)能夠取得、分析的資料量大為增加 (B)不會堅持一切都要做到精準(C)放下長久以來對於因果關係的堅持 (D)不需找出資料之間的相關性
16. 關於巨量資料分析的概念,下列何者正確?(A)巨量資料分析主要是針對量大的數據分析,因此對於資料來源多樣性和資料產生快慢等因素將不列入考慮(B)巨量資料分析的資料格式僅限於結構化資料,因此非結構
17. 關於分類的訓練資料集與測試資料集的敘述,下列何者有誤?(A)訓練資料是從要分析的資料庫中隨機取樣(B)訓練資料必須已經知道其類別(C)測試資料集不應該包含訓練資料集中的資料(D)測試資料可以不
19. 巨量資料分析是一連串分階段流程的處理步驟(Pipeline),針對此巨量資料分析的流程,下列何者正確?(A) ETL(Extract Transform Load)的處理是屬於此分析流程中最後
20. 一般巨量資料處理的單位為PB級;1 PB的資料為1 GB資料的幾倍大?(A) 1,000 (B) 1,000,000 (C) 1,000,000,000 (D) 1,000,000,000,0
22. 對於決策樹(Decision Tree)機器學習演算法,下列何者有誤?(A)決策樹最末端葉面點(Leaves)是標示資料分類別的結果(B)決策樹中間的點是提供資料分類時特徵值的判斷(C)決策樹
23. 關於Hadoop的敘述,下列何者有誤?(A) Hadoop的做法,是將資料打散成小塊,分散到不同的電腦中(B)由於資料量夠大,Hadoop不會儲存資料的備份(C) Hadoop預設,由於資料量
24. 如果使用者在MapReduce中打算使用外部執行檔來定義其工作,需要利用下列何者?(A) Virtual Machine (B) Streaming (C) Pipeline (D) Filt
25. 下列何者是知識發現(Knowledge Discovery)的正確程序?(A)資料探勘、資料準備、樣式評估、知識呈現(B)資料準備、資料探勘、樣式評估、知識呈現(C)資料準備、樣式評估、資料探
15. 已知樣本n = 324和母體標準差σ= 9,則在95 %信心水準下,最大的估計誤差是?(Z0.05=1.645;Z0.025=1.96)(A) 0.8225 (B) 0.98 (C) 1.64
16. 某老師想了解學生寫作業的平均時間是多少,已知母體標準差σ=30分鐘,則在95 %信心水準和估計誤差至多10分鐘下,需要多大的樣本?(Z0.05=1.645;Z0.025=1.96)(A) 13
18. 型I誤差(Type I Error)的意思為下列何者?(A)當虛無假設(H0)為真時,接受H0 (B)當虛無假設(H0)為真時,接受對立假設(H1)(C)當對立假設(H1)為真時,接受H1 (
19. 計算列聯表(contingency table)的卡方值(Chi-Square value),當這個值很小時,說明這兩個變數間可能的關係是下列何者?(A)兩變數間獨立 (B)兩變數間相依(C)