題庫堂
檢索
題庫堂
首頁
數學
英文學習
政治學
統計學
經濟學
藥理學
中醫藥物學
財政學
法學知識
公共行政
警察學
BI規劃師
財務管理
公共衛生學
工程經濟學
電力電子學
當前位置:
首頁
11. 對於某些資料屬性內出現異常大的值,有可能會導致誤導模型訓練的結果,此時會將該屬性值進行何種處理,使所有屬性值被轉換到 0 至 1 之間?(A) 資料組織(B) 資料特徵縮放(C) 資料清理(D
問題詳情
11. 對於某些資料屬性內出現異常大的值,有可能會導致誤導模型訓練的結果,此時會將該屬性值進行何種處理,使所有屬性值被轉換到 0 至 1 之間?
(A) 資料組織
(B) 資料特徵縮放
(C) 資料清理
(D) 資料分析
參考答案
答案:B
難度:
計算中
-1
書單:
沒有書單,新增
上一篇 :
10. 下列哪個方法是將時間序列資料轉換到頻域空間?(A) 傅立葉轉換(B) 特徵值加權(C) 資料降維(D) 隨機抽樣
下一篇 :
12. 胖虎目前在分析一間公司的健康檢查資料,其中有一個欄位是 BMI 值,胖虎想要將其根據不同區段分類為過輕、正常、過胖、肥胖,請問胖虎正在做的是何種屬性轉換?(A) 二值化(Binarizatio
資訊推薦
13. 下列何者不是屬性轉換的主要目的?(A) 轉換後可能更容易發現資料之間的關係,使沒有關係變成有關係(B) 資料可能呈現嚴重的偏態分布,經過轉換後差異可以拉開(C) 讓資料能夠符合模型所需要的假設
14. 下列哪種方法不屬於特徵選擇(Feature-Selection)的標準方法?(A) 嵌入方法(Embedded)(B) 過濾方法(Filter)(C) 包裝方法(Wrapper)(D) 抽樣方
15. 關於資料特徵,下列敘述何者不正確?(A) 資料特徵個數越多,該模型所需的運算時間也就越短(B) 資料特徵個數越多,容易引起維度災難,而模型也會越複雜(C) 剔除不相關或多餘的資料特徵,以減少資
16. 關於巨量資料,下列敘述何者不正確?(A) 巨量資料分析始於找出大量資料之間的關聯性(B) 隨著巨量資料分析技術俱進,分析人員可以忽略數據的真實性,依然仍夠得到理想的結果(C) 好的巨量資料運算
17. 關於 MapReduce 框架,下列敘述何者不正確?(A) Mapper 的輸出需要是鍵值組(key-value pair)的結構(B) 實現 Reducer,通常是定義如何處理個別鍵值下的值
18. 下列敘述何者在描述巨量資料中多樣性(Variety)的特性?(A) 能夠處理相當大的資料,例如 100TB 的歷史資料(B) 善於處理非結構化資料,例如各式網站資料等(C) 能夠大幅縮短分析的
19. 關於巨量資料技術架構,下列何者不是應具備的需求?(A) 可以被平行擴充(B) 儘可能能夠被分散式處理(C) 儘可能的使用單一節點資料庫(D) 具有高容錯性
20. 關於 HDFS 的文件寫入,下列敘述何者正確?(A) 支持多用戶對同一份文件的寫入操作(B) 用戶可以在文件的任意位置進行修改(C) 預設將文件複製三份存放(D) 複製的文件預設都存在同一個主
21. 下列何種統計量無法由盒鬚圖(box-and-whisker plot, boxplot)得知?(A) 最小值(B) 中位數(C) 變異數(D) 全距
22. 若兩事件 X、Y 為某試驗可能發生之二獨立事件,P(X)>0,P(Y)>0,下列何者不正確?(A) P(XY)=P(X)+P(Y)(B) P(X|Y)=P(X)(C) P(X|Y)P(Y)=
23. 對自變數 X 與依變數 Y 作簡單線性迴歸得到的相關係數 r,下列敘述何者正確?(A) r = -1 代表 X 與 Y 完全無關(B) r = 0 代表數據點恰好落在同一條水平直線上(C) r
24. 關於單一變量的(univariate)統計量數,下列敘述何者不正確?(A) 變異係數(coefficient of variation)適用於量化變數(B) 四分位距(inter-quarti
25. 關於邏輯斯迴歸中的迴歸係數,可以使用下列何種方法求解?(A) 最小平方法(B) 牛頓迭代法(C) 馬可夫鏈演算法(D) 最大概似估計法
26. 行銷部選擇部分客戶進行簡訊產品推薦,同時獲取了客戶是否願意購買產品的資訊;而通過這些已知資訊,用來判斷其他用戶的購買意願,請問屬於下列何種方法?(A) 推薦系統(B) 預測模型(C) 探索性分
27. 下列何者不屬於非監督式學習?(A) 關聯法則(B) K-Means(C) Word2Vec(D) K Nearest Neighbor
28. 請問下列敘述何者不正確?(A) 機器學習(machine learning)某種程度來說亦可稱為統計學習(statistical learning)(B) 從所搜集的資料中建構出 X 與 Y
29. 關於模型績效評估,下列敘述何者不正確?(A) 殘差(或稱預測誤差)是預測的反應變數值減去真實的反應變數值(B) 迴歸模型績效衡量大多基於殘差(C) 赤池弘次訊息準則(Akaike’s Info
30. 關於獨立(independence)與相依(dependency),下列敘述何者不正確?(A) 獨立與相依是描述兩變數之間關係的概念(B) 相關(correlation)係數為 0,代表兩變數
31. 下列何種方法通常應用在集群(Clustering)問題?(A) Support Vector Machine(B) Random Forest(C) K Nearest Neighbors(D
32. 下列何者不是資料降維的方法?(A) Principal Component Analysis(B) Linear Discriminant Analysis(C) K Nearest Neig
33. 下列哪種圖表最能展現所有類別的總和為 100%?(A) 圓餅圖(B) 折線圖(C) 散布圖(D) 雷達圖
34. 以政府所有之人口統計與死亡登記資料所編制之生命表稱為?(A) 普通生命表(B) 完全生命表(C) 經驗生命表(D) 綜合生命表
24. 下列為 Python 程式的物件導向概念: 請問顯示出的 c.i 值為下列何者?(A) 0(B) 2(C) 4(D) 8
34. 某公司員工 8 人,月薪如下: 下列敘述何者不正確?(A) 薪資中位數為 29 千元(B) 有 50%的員工,薪資≥第二四分位數(C) 有 50%的員工,薪資≥平均值(D) 繪製成箱形圖(Bo
2. 如圖41,求電壓源的功率。 (A)10W (B)40W (C)50W(D)90W