
目前,使用深度學習目標檢測進行工業缺陷檢測時,主要有以下缺點:
(1)缺陷未知性:由于缺陷的成像有位置、形狀、光源等影響因素在,不同因素會組合成各種各樣的缺陷,將使得AI目標檢測算法學習起來變得異常困難。只能不斷增加已知的缺陷類別,如果將來出現未知類型的缺陷類別,設備將失去其該有的作用,可能會給生產方帶來損失。
(2)缺陷收集困難:缺陷數據集收集困難,人造或合成的缺陷與真實缺陷相差大,存在低質量樣本數據,數據收集周期較長,可能持續推遲設備的交付日期,這使得生產方將在人力成本上繼續投入,且項目前期誤檢漏檢情況出現頻繁,使得使用方對設備檢測能力的信心出現動搖,這將違背深度學習在工業領域的初衷,為企業提供智能化、無人化的工廠,減小過程成本。
(3)低頻缺陷攔截困難:即使是已知且數據集充足類別的缺陷,也會出現與此種類別特征不相近的缺陷,可能出現漏檢情況

基于以上問題點,異常檢測算法應用在工業質檢行業的優勢就涌現了出來,因為無監督算法的特性在,可以繞開目標檢測算法在工業領域遇到的部分問題。
異常檢測算法優勢:
(1)異常檢測是無監督算法,不需要缺陷數據集,僅需要ok數據集即可,部分異常檢測算法僅需要少量ok數據集,避免了收集缺陷困難的問題。
(2)不需要對各類別各形態缺陷進行定性,避免了新類別或新特征不能檢出問題,避免了難區分缺陷類別的認定。

鑒于以上問題,通過深度學習異常檢測算法,避免了低頻缺陷數據集收集困難,未知類別缺陷難攔截的問題,并在缺陷數據集不足的情況下,能夠很好的解決檢出問題。對于工業領域的零漏檢的高標準要求更進一步。有效的減少了項目周期,更加快速的給企業帶來生產環節上的效益增長。
異常檢測:
異常是指偏離預期的事件或項目。與標準事件的頻率相比,異常事件的頻率較低。產品中可能出現的異常通常是隨機的,例如顏色或紋理的變化、劃痕、錯位、缺件或比例錯誤。
異常檢測(Anomaly Detection)也稱偏差(deviation)檢測或者離群點(outlier)檢測,從數據的角度來看,其實就是檢測出和眾多其他觀測值差別非常大的一個特殊的觀測值。異常檢測在歷史上實際是數據預處理的一個步驟,但是在現代研究中越來越重要,逐漸發展為一個獨立的領域。
無監督異常檢測:
沒有標簽情況下,往往目標是將一個得分或標號賦予給每個數據對象。比如聚類算法,根據一些規則將數據進行無監督的聚類。簡單直白地講,如果聚類簇比較偏遠,或者密度比較少,可能就是異常。類似查找圖像離群點算法如孤立森林、SVM等。 但是基于檢測圖像中離群點是不穩定的,由于零件本身形態特性復雜,很多時候不能區分開正常點與離群點。

以前基于深度學習的工作主要集中在生成算法,如生成對抗網絡(GAN)或變分自動編碼器(VAEs) 。無監督生成模型通過學習真實數據的本質特征,刻畫出樣本數據的分布特征,生成與訓練樣本相似的新數據。模型能夠發現并有效地內化數據的本質,并生成這些數據。生成式模型可以用于在沒有目標類標簽信息的情況下捕捉觀測到可見數據的高階相關性。
如基于生成對抗網絡(GAN)或變分自動編碼器(VAEs)的生成網絡,在該網絡中,編碼器接受輸入數據,并將其壓縮為潛伏空間表示,然后解碼器將從該空間重構輸入數據。
VAE將圖像轉換為統計分布的參數:均值和方差。然后,VAE使用均值和方差參數隨機采樣分布的一個元素,并將該元素解碼回原始輸入。該過程的隨機性提高了魯棒性并迫使潛在空間在任何地方編碼有意義的表示:在潛在空間中采樣的每個點被解碼為有效輸出。
隨著深度學習算法不斷進軍工業界,服務于工業領域的AI算法也將更加成熟、穩定,針對工業領域的算法與解決方案不斷的涌現,其數據集也在不斷收集中,且出現了異常檢測算法評估數據集MVTec,在異常檢測算法頻繁刷榜MVTec后,相信在不久將來會廣泛應用于工業領域。由于目標檢測極其依賴缺陷數據集,異常檢測可能在某些情形下會替代目標檢測,或許兩者結合才是更佳的方案。