關鍵詞:xgboost算法 web安全 機器學習
摘要:常見的php-webshell檢測方法主要有靜態檢測方法和動態檢測方法兩類,相較于動態檢測方法,靜態檢測方法以其占用資源少,檢測周期短,效率高的優點,獲得了更為廣泛的應用,但是傳統的基于正則匹配的靜態檢測方法,不能有效識別混淆后的php-webshell腳本,也不能有效識別從未出現過的php-webshell腳本,新興的使用機器學習算法的靜態檢測方法又有著特征普適性差的缺點.針對以上問題,提出了一種基于文本向量的php-webshell檢測方法,使用n-gram算法和TF-IDF算法將php腳本執行過程中產生的操作碼序列轉化為文本向量,以文本向量作為輸入特征,使用極限梯度提升算法XGBoost對php腳本分類,通過判斷分類結果,實現php-webshell檢測,實驗結果表明,所提方法能有效地檢測php-webshell,提高了php-webshell靜態檢測方法的準確率.
數據通信雜志要求:
{1}正文:文內標題簡捷、層次分明。文字、標點及數字的運用應符合規范。
{2}多作者稿署名時須征得其他作者同意,排好先后次序,接“擬用通知”后不再改動。
{3}正文內各級標題處理如下:一級標題為“一、二、三……”,二級標題為“(一)、(二)、(三)……”,三級標題為“1、2、3……”,四級標題為“(1)、(2)、(3)……”。單獨成行。
{4}摘要應具有獨立性和自明性,須說明論文的目的、方法、結果(包括主要數據)和結論,著重于創新與發現,以300字左右為宜。
{5}文稿首頁頁腳處注明投稿日期和通信作者簡介(包括姓名、出生年、性別、職稱、學位、研究方向、E-mail)。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社