問題詳情

二、假設現在有一些文件需要被分類成+和兩類,為簡化起見,我們僅考慮3個詞,分別是 "資料庫"、"資料探勘"和"電子商務",我們共有2100 份文件的訓練資料集,它們對於這3個詞和類別的資訊如【表1】所示,其中T表示有出現,F表示無出現:

比如,第1 列的資料顯示在有出現"資料庫"、"資料探勘"和"電子商務"3 個詞的文件裡, 有100份的類別標籤是+,而另100份的類別標籤是。現在有1 份新文件,它沒有出現"資料庫",但有出現"資料探勘"和"電子商務",請利用簡 易貝式分類器(Naïve Bayesian Classifier)來預測新文件的類別,須列出詳細計算式(15分), 以及簡易貝式分類器有何假設(5分)?

參考答案

答案:D
難度:非常簡單1
統計:A(0),B(0),C(0),D(85),E(0)