題庫堂
檢索
題庫堂
首頁
數學
英文學習
政治學
統計學
經濟學
藥理學
中醫藥物學
財政學
法學知識
公共行政
警察學
BI規劃師
財務管理
公共衛生學
工程經濟學
電力電子學
當前位置:
首頁
2. 將非結構化的資料轉變為結構化的資料,這樣的過程屬於下列何種工 作? (A) 資料前處理 (B) 資料標準化 (C) 資料視覺化 (D) 資料載入
問題詳情
2. 將非結構化的資料轉變為結構化的資料,這樣的過程屬於下列何種工
作?
(A) 資料前處理
(B) 資料標準化
(C) 資料視覺化
(D) 資料載入
參考答案
答案:A
統計:A:5,B:1,C:0,D:0,E:0
難度:計算中
上一篇 :
5. 附圖六名男女的身高體重,請問***遺缺的部分,如果以「平均法」 來填補,應為何者?(A)163 (B) 165 (C) 168(D)172
下一篇 :
3. 假設您每分鐘都會收到某張股票的開盤價、收盤價、最低價、最高價、 成交量,若您只想儲存收盤價,最適合 R 語言中的何種結構? (A) 向量(Vector) (B) 矩陣(Matrix) (C) 字
資訊推薦
4. 為找出某一篇英文文章中較為正確且重要的詞頻(如 Cat 與 Cats 均併 做 Cat 計算),下列何者「不」是必要的步驟? (A) 移除停用字(Stop Words) (B) 詞幹提取(Ste
5. 考慮某資料欄位為銷售地區,資料包括北部、中部、南部與離島。如 果須使用單熱編碼(One-Hot Encoding),則離島值最合適的編碼為何? (A) [1 1 1 1] (B) [1 0 0
6. 下列何種圖表最適合用來展示資料中各類型數據所佔比例? (A) 圓餅圖(Pie chart) (B) 散點圖(Scatter plot) (C) 折線圖(Line chart) (D) 長條圖(B
7. 下列何種圖表最適合用來展示時間序列(Time Series)類型的資料? (A) 圓餅圖(Pie chart) (B) 散佈圖(Scatter plot) (C) 折線圖(Line chart
8. 關於將資料去識別化,下列敘述何者「不」正確? (A) 將姓名轉換成 MD5 雜湊值是一種去識別化的方式 (B) 將年齡資料,例如:「39 歲」轉換成「>35 歲」是一種去識別化的 方式 (C)
9. R 語言中,下列函數何者可以回傳資料向量中各百分位數? (A) var() (B) sd() (C) mean() (D) quantile()
10. 關於資料彙總(Data Aggregation),下列敘述何者最為正確? (A) 可降低資料尺度、資料偏斜性對於模型的不良影響 (B) 是運用推論統計學,以展現資料的基本特質 (C) 是以摘要
11. 資料縮減(Data Reduction)包括屬性挑選(Feature Selection)與屬性 萃取(Feature Extraction),下列何者「不」是屬性萃取的方法? (A) 主成份
12. 關於屬性萃取(Feature Extraction),下列敘述何者「不」正確? (A) 可以消除屬性間的相互影響,增加模型的效果 (B) 屬性萃取方法有監督式與非監督式兩種 (C) 能夠降低屬
13. 假設您要對一含有數百個生物特徵屬性的資料進行分析,可使用下列 何種方法來萃取重要的訊息? (A) 主成分分析(Principle Component Analysis) (B) K 近鄰法(
14. 在資料處理中,有些資料可能不是連續型的數值,而是一些分類值, 例如職業、性別等,對於這樣的特徵值,我們將該屬性的欄位的各種 狀態,設置獨立的欄位,並在發生該狀態的欄位中,填入 1,請問此 種資
15. 關於正規化(Normalization),下列敘述何者正確? (A) 一定落在[-1, 1]區間內 (B) 為了消除數據特徵之間的量綱影響 (C) 針對類變變量進行處理 (D) 會影響資料原來
16. 透過 Web 瀏覽器上傳信用卡資料時,下列何者為最合適的請求方法? (A) POST (B) PUT (C) GET (D) UPLOAD
17. 下列敘述何者「不」正確? (A) GET 方法傳輸速度較 POST 慢 (B) POST 方法適合傳送較為隱私的資料 (C) POST 方法允許傳送 GET 方法更多的資料 (D) GET 和
18. 下列何者為進行資料分析時的首要步驟? (A) 資料收集 (B) 資料清理 (C) 資料建模 (D) 資料分析
19. 關於集中式資料庫系統(Centralized Database)與分散式資料庫系統 (Distributed Database),下列敘述何者正確? (A) 集中式資料庫系統中,資料一般是存放
20. 建立數據分析工作流程時,除了要得到分析結果外,如何建立「有效 率」、「易維護」、「可重複使用」的良好品質程式碼亦十分重要。下列 敘述何者較「不」恰當? (A) 以 try-except 建立良
21. 若欲比較兩公司員工薪資之離散程度,可採用下列何者統計量? (A) 變異數 (B) 全距 (C) 平均數 (D) 變異係數
22. 「林書豪的球衣號碼」屬於下列那一種量度尺度分類? (A) 名目尺度(Nominal Scale) (B) 順序尺度(Ordinal Scale) (C) 比率尺度(Ratio Scale) (
23. 關於連續型機率分配,下列敘述何者正確? (A) 常態分配中,平均值為 0、變異數為 0 之分配,稱為標準常態分 配 (B) 已知均勻分配為 U(a, b),則平均值為(a-b)\/2 (C)
24. 附圖為某機器維修時間之次數分配所繪製之結果,下列敘述何者正確? (A) 圖形名稱為長條圖(Bar Chart) (B) 維修時間出現最多的範圍為 80~85 (C) 資料呈現常態分配 (D)
12. Two 100 cm3 aqueous solutions, one containing 0.010 mol NaOH and the other 0.010 mol HCl, are a
15. 有關長期成本之敘述,下列何者正確? (A) 長期總成本、長期平均成本與長期邊際成本分別為短期總成本、短期平均成本與短期邊際成本的包絡曲線 (B) 長期總成本曲線應由原點出發,長期邊際成本線通過
229 下列圖示,何者屬於Windows 7系統所預設的捷徑圖示? (A)(B)(C)(D)
16. 若某廠商的需求函數為Qd =16 − P ,MR =16 − 2Q ,下列何者錯誤? (A) 此廠商有可能處於不完全競爭市場 (B) 廠商在短期均衡時,若出現經濟損失,則平均收益線與平均成本線