關(guān)鍵詞:社區(qū)發(fā)現(xiàn)算法 爬蟲 賭博網(wǎng)站識別 pagerank算法
摘要:為了實現(xiàn)準確批量檢測賭博網(wǎng)站,依據(jù)現(xiàn)階段賭博網(wǎng)站的特點,區(qū)別于傳統(tǒng)的賭博網(wǎng)站檢測技術(shù),以域名作為研究對象,對已有賭博網(wǎng)站下鏈接進行爬取,截取新增域名作為待分類數(shù)據(jù),利用社區(qū)發(fā)現(xiàn)算法聚類新域名后,結(jié)合Page Rank算法獲得的PR值排序,實現(xiàn)批量分類賭博網(wǎng)站和白名單網(wǎng)站,最終可實現(xiàn)單次批量獲取60%以上賭博網(wǎng)站。
現(xiàn)代計算機雜志要求:
{1}基金項目:獲得基金資助產(chǎn)出的文章應注明基金項目名稱,并在括號內(nèi)注明其項目編號。
{2}稿件內(nèi)容來稿請按如下順序撰寫:論文標題,作者姓名,內(nèi)容提要,關(guān)鍵詞,正文,(征引書目),參考文獻。
{3}本刊全彩印刷,要求圖文并茂,圖片高清美觀。
{4}本刊采用頁下注釋。正文中注號用阿拉伯數(shù)字加圓圈標注于相關(guān)句子的右上角,通常應在相關(guān)標點之外。
{5}正文:文內(nèi)標題簡捷、層次分明。文字、標點及數(shù)字的運用應符合規(guī)范。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社