統(tǒng)計假設(shè)檢驗(hypothesis test)為我們進(jìn)行學(xué)習(xí)器性能比較提供了重要依據(jù),基于假設(shè)檢驗結(jié)果我們可推斷出,若在測試集上觀察到學(xué)習(xí)器A比B好,則A的泛化性能是否在統(tǒng)計意義上優(yōu)于B,以及這個結(jié)論的把握有多大,下面更多關(guān)于假設(shè)檢驗的介 宅介紹兩種最基本的假設(shè)檢驗,然后介紹幾種常用的機器學(xué)習(xí)性能比較方紹可參見[Wellek, 2010】便于討論,本節(jié)默認(rèn)以錯誤率為性能度量,用E表示.