問題詳情

14. 以下關於分類器(classifier)效能測量的相關描述何者錯誤?

參考答案

答案:D
難度:困難0.4
書單:沒有書單,新增

用户評論

洪小漢】評論

F值,亦被稱做F-measure,是一種量測方法的精確度常用的指標,經常用來判斷演算法的精確度。目前在辨識、偵測相關的演算法中經常會分別提到精確率(precision)和召回率(recall),F-score能同時考慮這兩個數值,平衡的反映這個演算法的精確度。TP, FN, FP, TN編輯前面的true/false修飾後面的positive/negative,後面的positive/negative是我們的方法的判斷。TP (true positive):我們的方法判斷為真,這個判斷是對的。即事實上為真,而且被我們的方法判斷為真的情形。FN (false negative):我們的方法判斷為不真,這個判斷是錯的。即事實上為真,卻未被我們的方法判斷為不真的情形。FP (false positive):我們的方法判斷為真,這個判斷是錯的。即事實上不為真,卻被我們的方法誤判為真的情形。TN (true negative):我們的方法判斷為不真,這個判斷是對的。即事實上不為真,而且被我們的方法判斷成不為真的情形。以抓犯人為例,TP是有罪而且被抓到的情形,FP是無罪但被誤抓的情形,FN是有罪但沒被抓到的情形,TN是無罪且未被誤逮的情形混淆矩陣 判斷為真判斷不為真事實上為真TPFN事實上不為真FPTNPrecision和RecallPrecision的分母為兩種判斷為真的情形的總和(范恩圖中完整綠色的部份)解釋:當辨識結果為FP的代價很高時,F-score應該著重此指標,亦即precision要很高。例子:辨識電郵信箱裡的垃圾郵件時,如果某封被誤判成垃圾郵件(即FP)時,使用者可能就此錯過重要的通知。Recall的分母為事實上為真的情形的總和(范恩圖中完整紫色的部份)解釋:當辨識結果為FN的代價很高時,F-score應該著重此指標,亦即precall要很高。舉例:一個傳染病診斷辨識系統中,如果某個傳染病患者被誤判成陰性(即FN),當地的社區的居民就落入被傳染的高風險之中。舉例:真正犯罪的人當中,有多少比例的罪犯被抓到。或,一張照片當中,有多少人臉被偵測到。 Precision和Recall的異同編輯它們的分子皆為TP。F-score的recall和precision之間存在著權衡的關係,可通過 β 調整更重視的部份。以警察抓犯人的故事為例:一位警察很厲害,抓了很多犯人,但是這些犯人當中,只有少部分真正有罪,其他都是被冤枉的。recall高,因為該抓與不該抓的犯人都被抓到了precision低,因為很多都是沒犯罪的人「寧可錯抓一百,也不可放過一個」→   recall 高,但 precision 低一個警察非常嚴謹,只逮捕真正有犯罪的人,不抓實在是沒辦法肯定的犯人。precision高,因為通常被抓到人的都是有罪的,recall低,因為不小心放掉一大群犯人「寧可錯放一百,也不可冤枉一個」→   precision 高,但 recall 低