如此將ROC曲線上的每個(gè)點(diǎn)轉(zhuǎn)化為代價(jià)平面上的一條線段,然后取所有線段的下界,圍成的面積即為在所有條件下學(xué)習(xí)器的期望總體代價(jià) 有了實(shí)驗(yàn)評(píng)估方法和性能度量,看起來(lái)就能對(duì)學(xué)習(xí)器的性能進(jìn)行評(píng)估b匕較了:先使用某種實(shí)驗(yàn)評(píng)估方法測(cè)得學(xué)習(xí)器的某個(gè)性能度量結(jié)果,然后對(duì)這些結(jié)果進(jìn)行比較.但怎么來(lái)做這個(gè)“比較”呢?是直接取得性能度量的值然后“比大小”嗎?實(shí)際上,機(jī)器學(xué)習(xí)中性能比較這件事要比大家想象的復(fù)雜得多,這里面涉及幾個(gè)重要因素:首先,我們希望比較的是泛化性能,然而通過(guò)實(shí)驗(yàn)評(píng)估方法我們獲得的是測(cè)試集上的性能,兩者的對(duì)比結(jié)果可能未必相同;第二,測(cè)試集上的性能與測(cè)試集本身的選擇有很大關(guān)系,且不論使用不同大小的測(cè)試集會(huì)得到不同的結(jié)果,即便用相同大小的測(cè)試集,若包含的測(cè)試樣例不同,測(cè)試結(jié)果也會(huì)有不同;第三,很多機(jī)器學(xué)習(xí)算法本身有一定的隨機(jī)性,即便用相同的參數(shù)設(shè)置在同一個(gè)測(cè)試集上多次運(yùn)行,其結(jié)果也會(huì)有不同,那么,有沒(méi)有適當(dāng)?shù)姆椒▽?duì)學(xué)習(xí)器的性能進(jìn)行比較呢?
想了解更多IT資訊,請(qǐng)?jiān)L問(wèn)中培偉業(yè)官網(wǎng):中培偉業(yè)