【葉子】評論
https://www.tibco.com/zh-hant/reference-center/what-is-data-mining資料探勘的過程資料探勘過程有四個基本步驟,如下所述。定義問題任何資料探勘專案的第一步都是瞭解目標和要求,這必須從業務角度明確指定,並且應該制定一個基本實施計畫。如果業務問題是想要增加銷售,那麼資料探勘問題就是「什麼樣的客戶可能購買產品?」實施第一步是基於舊客戶關係和屬性等資料來建立模型,包括人口統計、家庭規模、年齡、住處等。資料收集和準備第二階段為資料收集和探索。對收集的資料進行檢查,您將瞭解做為解決業務問題的基礎資料是否準確適用。在這個階段,人們可能會決定取消一些資料參數或引入一些新參數。在這裡,可以解決資料品質問題,並探索資料中的可能模式。資料準備階段包括表格、案例和屬性選擇等任務,也包括資料清理和轉換、重複資料刪除、標準化輸入標題、和其他資料檢查。模型構建和評估第三步是選擇和應用各種建模技術,並將參數調校到最佳水準。在這個開始構建模型的階段,最好使用較小的、經過深思熟慮的資料集,以此為基礎再次評估模型解決業務問題的效果,是一個很好的選擇,在這個階段可以添加任何形式的改進。模型部署最後一個是部署階段,可以從收集的資料中獲得洞察見解和可供操作的資訊,然後將這些知識部署到目標環境中。部署可能包括將模型應用於任何新資料、提取模型細節、將模型整合到應用程式中等等