如何解決人工智能圖像識別時過擬合?有個好方法
ai智能識別,統(tǒng)計學,解決過擬合:如果有多個條件都可以同樣準確率識別,那么盡可能保留最簡單的,且備注,現(xiàn)有數(shù)據(jù)無法判斷這么多個獨立的條件哪些條件沒用。? 這些條件之間可能是and,or,或其他組合關(guān)系。
就像數(shù)學的多解問題,現(xiàn)有題目數(shù)據(jù)得出的就是多解。
如果題目變一變,實驗數(shù)據(jù)更多,或許能減少答案的數(shù)量,甚至找到唯一解。發(fā)現(xiàn)哪些條件沒用,哪些條件有用。
舉例,訓練數(shù)據(jù)里的人的圖像數(shù)據(jù)中,人總是拿著手機,ai發(fā)現(xiàn)如果有手機就一定能識別為人。所以ai認為手機就是人。
然后測試數(shù)據(jù)上,有很多人圖像沒有手機,ai就認為這些不是人的圖像,結(jié)果測試成功率不高。
解決辦法就是,當訓練集上ai發(fā)現(xiàn)先手機就能識別為人時,先做個記錄,然后不識別手機找其他條件去識別人的圖像,比如用手,腳,眼睛嘴巴等去識別為人。
最后做個列表記錄
? ? 1.用手機識別,成功率c1
? ? 2.用手識別,成功率c2
? ? 3.用眼睛識別,成功率c3
? ? 4.用嘴識別,成功率c4
? ? 5.等等。
手機,手,眼睛,嘴,的and or 所有組合成功率分別多少。
這就是多解。
最后測試集上用所有這些條件去分別識別。
當然最優(yōu)先用那個成功率最高的多個模型里最簡潔的模型去測試。
當然可能結(jié)果準確率有高有低。
這才是統(tǒng)計學和科學,猜想驗證。
如果想要一次訓練就找到唯一的且正確又簡潔的答案,解,模型,就需要很多很多訓練數(shù)據(jù)。
標簽: