科技前沿看點:微軟和英特爾項目在分析惡意軟件之前將其轉換成圖像

新時代高科技不計其數越來越發達,小伙伴們看過不少科技新聞吧,在我們生活中應該也用到很多這些高科技東西,有哪些小伙伴值的關注的呢,今天就跟大家分享一篇有關科技方面知識,希望大家會喜歡。

微軟和英特爾最近合作了一個新的研究項目,探索了一種新的方法來檢測和分類惡意軟件。

該項目名為STAMINA(Static Malware-as-Image Net work Analysis),它依賴于一種新技術,將惡意軟件樣本轉換為灰度圖像,然后掃描圖像以惡意軟件樣本特有的紋理和結構模式。

英特爾-微軟研究團隊說,整個過程遵循了幾個簡單的步驟。 第一種方法是獲取輸入文件并將其二進制形式轉換為原始像素數據流。

然后,研究人員拍攝了這種一維(1D)像素流,并將其轉換為二維照片,以便正常的圖像分析算法能夠對其進行分析。

根據輸入文件的大小選擇圖像的寬度,使用下表。 高度是動態的,這是由于將原始像素流除以所選擇的寬度值。

在將原始像素流組裝成正常的二維圖像后,研究人員將得到的照片調整到更小的尺寸。

英特爾和微軟團隊表示,調整原始圖像的大小并不會“對分類結果產生負面影響”,這是必要的一步,這樣計算資源就不必與由數十億像素組成的圖像一起工作,這很可能會減緩處理速度。

然后將駐留的圖像輸入預先訓練的深度神經網絡(DNN),該網絡掃描圖像(惡意軟件菌株的2D表示)并將其歸類為干凈或感染。

微軟表示,它提供了220萬個感染PE(便攜式可執行文件)的樣本作為研究的基礎。

研究人員使用60%的已知惡意軟件樣本來訓練原始的DNN算法,20%的文件來驗證DNN,其他20%用于實際測試過程。

該研究小組表示,STAMINA在識別和分類惡意軟件樣本方面的準確率為99.07%,誤報率為2.58%。

“研究結果肯定鼓勵將深度轉移學習用于惡意軟件分類,”Jugal Parikh和Marc Marino說,他們是代表微軟威脅保護情報小組參與研究的兩名微軟研究人員.

這項研究是微軟最近利用機器學習技術改進惡意軟件檢測的一部分。

STAMINA使用了一種叫做深度學習的技術。 深度學習是機器學習(ML)的一個子集,是人工智能(AI)的一個分支,它指的是智能計算機網絡,能夠自己從存儲在非結構化或未標記格式的輸入數據中學習-在這種情況下,是隨機惡意軟件二進制文件。

微軟說,雖然STAMINA在處理較小的文件時是準確和快速的,但它對較大的文件感到困惑。

微軟上周在一篇博客文章中說:“對于規模更大的應用程序,由于將數十億像素轉換為JPEG圖像并調整其大小的限制,STAMINA變得不那么有效。”

然而,這很可能不重要,因為該項目只能用于小文件,并取得了優異的結果。

在本月早些時候接受ZDNet的采訪時,微軟威脅保護安全研究主任TanmayGanacharya說,微軟現在在很大程度上依賴機器學習來檢測新出現的威脅,這個系統使用的是正在部署在客戶系統或微軟服務器上的不同的機器學習模塊。

Ganacharya說,微軟現在使用客戶端機器學習模型引擎、云端機器學習模型引擎、機器學習模塊來捕獲行為序列或捕獲文件本身的內容。

根據報告的結果,STAMINA可能是非常好的ML模塊之一,我們可能很快會看到在微軟實現作為一種方法來發現惡意軟件。

目前,微軟可以使這種方法比其他公司更好地工作,主要是因為它擁有數億WindowsDefender安裝的數據。

Ganacharya說:“任何人都可以建立一個模型,但是標記的數據、數量和質量確實有助于適當地訓練機器學習模型,從而確定它們的有效性。”

“而我們微軟公司的優勢在于,我們確實有傳感器,通過電子郵件、身份、端點以及能夠將它們組合在一起,給我們帶來很多有趣的信號。”

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時候聯系我們修改或刪除,多謝