二、假設現在有一些文件需要被分類成+和兩類,為簡化起見,我們僅考慮3個詞,分別是 "資料庫"、"資料探勘"和"電子商務",我們共有2100 份文件的訓練資料集,它們對於這3個詞和類別的資訊如【表1】所示,其中T表示有出現,F表示無出現:
比如,第1 列的資料顯示在有出現"資料庫"、"資料探勘"和"電子商務"3 個詞的文件裡, 有100份的類別標籤是+,而另100份的類別標籤是。現在有1 份新文件,它沒有出現"資料庫",但有出現"資料探勘"和"電子商務",請利用簡 易貝式分類器(Naïve Bayesian Classifier)來預測新文件的類別,須列出詳細計算式(15分), 以及簡易貝式分類器有何假設(5分)?