這幾年來,數(shù)據(jù)科學(xué)與人工智能(AI)技術(shù)已成功應(yīng)用于各個(gè)領(lǐng)域各類事件的預(yù)測和檢測。比如:
網(wǎng)上搜索“機(jī)器學(xué)習(xí)用例”,會搜出連篇累牘的文檔鏈接,都是描述機(jī)器學(xué)習(xí)(ML)算法是怎么檢測或預(yù)測某些數(shù)據(jù)領(lǐng)域中的某類事件。
總的說來,成功的機(jī)器學(xué)習(xí)應(yīng)用肯定是用充足的通用訓(xùn)練集訓(xùn)練出來的。機(jī)器學(xué)習(xí)模型在訓(xùn)練期間應(yīng)攝入足夠的可用樣例以學(xué)習(xí)每一類事件。任何數(shù)據(jù)科學(xué)項(xiàng)目的關(guān)鍵,都是有足夠大的事件樣例集可供算法訓(xùn)練。
應(yīng)用機(jī)器學(xué)習(xí)進(jìn)行IoT事件預(yù)測
安全團(tuán)隊(duì)能夠應(yīng)用機(jī)器學(xué)習(xí)算法預(yù)測和識別機(jī)械部件損壞,或者以之檢測網(wǎng)絡(luò)安全事件嗎?答案顯然是肯定的。數(shù)據(jù)科學(xué)技術(shù)在IoT和網(wǎng)絡(luò)安全領(lǐng)域已經(jīng)得到了成功的應(yīng)用。比如說,機(jī)器學(xué)習(xí)在IoT領(lǐng)域的一個(gè)經(jīng)典用例就是需求預(yù)測。今晚有多少顧客會光臨餐廳?能賣出多少箱奶?明天的用電量是多少?提前知道這些數(shù)據(jù)可以進(jìn)行更好的規(guī)劃。
醫(yī)療健康也是IoT數(shù)據(jù)科學(xué)非常常見的一個(gè)用例。有很多運(yùn)動健身應(yīng)用和設(shè)備可以監(jiān)測我們的關(guān)鍵指標(biāo),近實(shí)時(shí)地提供大量數(shù)據(jù)供人分析和評估健康狀況。
IoT領(lǐng)域另一個(gè)常見案例研究是預(yù)測性維護(hù)。預(yù)測機(jī)械部件是否需要維護(hù)以及何時(shí)需要維護(hù),可以優(yōu)化維護(hù)安排,延長機(jī)械部件的壽命。鑒于很多機(jī)械部件都相當(dāng)復(fù)雜且昂貴,能夠做到這一點(diǎn)可是不小的優(yōu)勢。只要數(shù)據(jù)集可用,這種方法就相當(dāng)奏效。如果數(shù)據(jù)集還經(jīng)過了合理標(biāo)記,這種方法就更有效了。經(jīng)過標(biāo)記的數(shù)據(jù)意味著描述事件的每個(gè)數(shù)字向量都被預(yù)分配給了某一類事件。
異常發(fā)現(xiàn):尋找非預(yù)期事件
數(shù)據(jù)科學(xué)有個(gè)特別的分支:異常發(fā)現(xiàn)。異常是什么?異常就是相當(dāng)罕見,難以歸入某一特定類型,難以預(yù)測。異常事件就是非預(yù)期事件,不能以當(dāng)前所知加以分類。異常是數(shù)據(jù)科學(xué)最難攻破的用例之一:
因此,異常檢測的問題可以簡單地歸結(jié)為尋找我們毫無所知的非預(yù)期、無樣例事件。雖然看起來難以解決,異常檢測卻還真不是什么罕見用例。比如說:
以上案例,基于已標(biāo)記數(shù)據(jù)樣例集的傳統(tǒng)數(shù)據(jù)科學(xué)方法,是無法應(yīng)用的。這一問題的解決方案就是對常規(guī)算法學(xué)習(xí)做一些調(diào)整。
IoT異常檢測
異常檢測問題不會提供帶已標(biāo)記樣例的經(jīng)典訓(xùn)練集(出自正常系統(tǒng)的信號和出自類比系統(tǒng)的信號)。這種情況下,我們只能在僅有“正常”樣例的訓(xùn)練集上訓(xùn)練機(jī)器學(xué)習(xí)模型,以原始信號和預(yù)測信號之間的偏差值來觸發(fā)異常警報(bào)。
IoT數(shù)據(jù)中,信號時(shí)序由特意部署在機(jī)械部件上或其周邊的傳感器產(chǎn)生。時(shí)序就是時(shí)間變量值序列。IoT環(huán)境中,這些變量描述物體的機(jī)械屬性,由一個(gè)或多個(gè)傳感器測量而得。
這些機(jī)械部件通常運(yùn)轉(zhuǎn)良好。因此,正常狀態(tài)下的樣例很多,而故障情況下的樣例卻幾近于零。關(guān)鍵部件上更是如此,因?yàn)槲恢锰^重要,通常在出現(xiàn)故障時(shí)導(dǎo)致整個(gè)機(jī)器報(bào)廢前就會被換掉。
IoT世界中,一個(gè)重要課題就是在事發(fā)前預(yù)測機(jī)械故障發(fā)生的概率。如果能預(yù)測,我們就可以用足其整個(gè)生命周期而又不危及機(jī)械鏈的其他部分。預(yù)測機(jī)械故障可能跡象的工作,便被稱為預(yù)測性維護(hù)異常檢測。