題庫堂
檢索
題庫堂
首頁
數學
英文學習
政治學
統計學
經濟學
藥理學
中醫藥物學
財政學
法學知識
公共行政
警察學
BI規劃師
財務管理
公共衛生學
工程經濟學
電力電子學
當前位置:
首頁
18. 為了能夠有效分散處理巨量資料,分散式資料處理演算法常基於下列 何種概念進行設計? (A) 貪婪演算法(greedy) (B) 啟發法(heuristic) (C) 反覆迭代(iteration
問題詳情
18. 為了能夠有效分散處理巨量資料,分散式資料處理演算法常基於下列
何種概念進行設計?
(A) 貪婪演算法(greedy)
(B) 啟發法(heuristic)
(C) 反覆迭代(iteration)
(D) 先分散(map) 後聚合(reduce)
參考答案
答案:D
統計:A:0,B:1,C:0,D:2,E:0
難度:計算中
上一篇 :
17. 關於 MapReduce 框架,下列敘述何者「不正確」? (A) Mapper 的輸出需要是鍵值組(key-value pair)的結構 (B) 實現 Reducer,通常是定義如何處理個別鍵
下一篇 :
19. 假設某一企業使用大數據進行分析,下列敘述何者「不正確」? (A) 大數據透過內外部的資料做結合 (B) 可透過大數據分析來輔助決策行為 (C) 大數據的資料結構並非固定型態 (D) 影音類型的
資訊推薦
20. 關於 HDFS 之 Erasure Coding(EC)技術,下列敘述何者「不正確」? (A) EC 適用於節省 HDFS 總空間 (B) EC 適用於常用之資料,主要目的是提升查詢效率 (C
21. 參考下方報表之結果,下列敘述何者正確? (A) eruptions 變數的最小值為 43.0 (B) eruptions 變數的 75 百分位數為 4.454 (C) waiting 變數的最
2. Python 語言中,x 為 Pandas 的 DataFrame 物件(如附圖),請問下列何者為 type(x['name'])的回傳值? (A) pandas.core.
34. 下列何者「不能」反映數據的集中趨勢的統計量? (A) 平均數 (B) 中位數 (C) 變異數 (D) 眾數
35. 下列何者適合用來呈現[車速,油耗]資料? (A) XY 散佈圖 (B) 直條圖 (C) 直方圖 (D) 折線圖
36. 關於關聯型態探勘(Association Pattern Mining),下列敘述何者「不正確」? (A) 典型的關聯型態探勘是分析超市中顧客購買的品項集合資料(通 常被稱為交易資料,或是購物
37. 自動編碼器(Autoencoder)通常「不會」用來做下列何項工作? (A) 資料降維 (B) 無損壓縮影像 (C) 特徵擷取 (D) 去雜訊
38. 對於二元分類問題,依真實資料的真假值與模型預測輸出的真假值, 可以組合出真陽性(True Positive, TP)、真陰性(True Negative, TN)、 偽陽性(False Pos
39. 特徵挑選(Feature Selection)是指挑選原始資料中的合宜屬性,或可視為移除缺乏訊息內涵之變數的維度縮減策略,下列常用的降維方法 中,何者屬於特徵挑選的方式? (A) 因子分析(F
40. 特徵萃取(Feature Extraction)是指將原始資料的屬性進行結合,以產生新的代理變數(Surrogate Variables)。下列常用的降維方法中,何者 屬於特徵萃取的方式? (
41. 模型複雜度與預測誤差之間的變化關係,通常是越複雜的模型與訓練集合配適的越好。因此,一般而言訓練集的預測誤差,會隨著模型複 雜度如何變化? (A) 增加而增加 (B) 減少而減少 (C) 增加而
42. 下列何種演算法較「不適合」進行分類預測? (A) 決策樹(Decision Tree) (B) 線性迴歸(Linear Regression) (C) 羅吉斯迴歸(Logistic Regre
43. 請問若只需輸入大學生的身高和體重來預測其腰圍,使用何種演算法 較為合適? (A) 簡單線性迴歸 (B) 多元線性迴歸 (C) 羅吉斯迴歸 (D) 關聯規則
44. 迴歸問題和分類問題都屬於監督式學習,關於兩者的反應變數,下列 敘述何者正確? (A) 前者是類別型反應變數,後者是數值型反應變數 (B) 前者是數值型反應變數,後者是類別型反應變數 (C) 兩
45. 在進行機器學習時,下列何者「不是」避免過度配適(overfitting)的方法? (A) 減少資料量 (B) 減少模型參數 (C) 使用較簡單的模型 (D) 在損失函數(loss functi
46. 下列何種統計機器學習方法,容許資料中存有遺缺值? (A) 類神經網路(Artificial Neural Networks) (B) 分類與迴歸樹(Classification and Reg
47. 當資料集的預測變數過多時,下列哪種方法是從只有截距項的最簡單 模型出發,逐步加入重要的變數? (A) 後向式逐步迴歸 (B) 前向式逐步迴歸 (C) 中向式逐步迴歸 (D) 反覆式逐步迴歸
48. 關於羅吉斯迴歸(Logistic Regression)分類,下列敘述何者「不正確」? (A) 它是建立二元類別機率值之勝率(odds ratio)對數值的線性分類 (B) 其反應變數假設是二
49. 關於機器學習中的交叉驗證(Cross-Validation),下列敘述何者正確? (A) 使用不同架構的模型在相同的資料上,以驗證訓練效果 (B) 是預測評估模型配適(fitting)度及尋找
50. 關於模型訓練與測試機制中的資料切分,下列敘述何者「不正確」? (A) 實務上常用重抽樣法進行模型最佳化 (B) 決定最佳的模型複雜度或參數組合後,最後再以整個校驗集 (calibration
複選題29. 小瑩在複式顯微鏡下觀察動物組織玻片,視野中觀察到少量細胞散佈於大量的細胞外 基質中。下列相關敘述哪些正確? (A) 小瑩想把視野右上角的A細胞移至視野中央觀察,她應將玻片往左下方移動 (
2. 請問下列何者適合用稀疏矩陣(sparse matrix)儲存? (A) 基於康熙字典,對 500 字短文進行單字是否出現的單熱編碼 (one-hot encoding) (B) 每日經過雪山隧道
3. 關於 R 語言的資料結構,下列敘述何者「不正確」? (A) 向量(vector)內的所有資料型態必須要一致 (B) 陣列(array)內的所有資料型態必須要一致 (C) 矩陣(matrix)內的
4. 比較 XML 格式與 JSON 格式,下列敘述何者「不正確」? (A) XML 解析複雜,JSON 解析速度快 (B) JSON 資料的體積相對較小,傳遞的速度較快 (C) JSON 是 Jav
5. 關於 R 語言中的因子(factor)特性,下列敘述何者正確? (A) 因子為 R 語言中的最小單位 (B) 因子為專門用來儲存類別資料的變數 (C) 因子為「多維」向量,屬於「一維」向量的擴充