原创 CVE-2017-12617

CVE-2017-12617 Apache Tomcat Remote Code Execution via JSP Upload Severity: Important Vendor: The Apache Software Foun

原创 關於機器學習中支持向量機相關問題

前言   在機器學習中,分類問題佔了很大一部分,而對於分類問題的處理有很多方法,比如決策樹、隨機森林、樸素貝葉斯、前饋神經網絡等等;而最爲常見的分類需求一般是二分類問題,即將樣本分爲兩個集合,然後通過學習某些參數,對新的輸入進行識別並劃分到

原创 關於機器學習中的受限玻爾茲曼機(RBM)的非二值情況的推導

前言  近一段時間以來筆者一直在查找關於受限玻爾茲曼機(Restricted Boltzmann Machine,下簡稱RBM)的相關資料,其實CSDN上的相關帖子已經其二值分佈的情況介紹的比較到位,而且在《機器學習》(於劍著)也以較短的篇

原创 勒索軟件暗網經濟比去年增長2502% 揭祕勒索軟件黑產鏈和經濟體

美國網絡安全公司今天發佈的一份報告顯示, 與前一年相比, 勒索軟件 在 暗網 的經濟增長了2502%。這份報告的目的是加強大多數網絡安全專家去年的預測, 當時他們說勒索軟件將在安全性和犯罪經濟方面扮演更重要的角色。專家確定有超過4.5萬個勒

原创 關於機器學習中C均值算法的相關介紹

前言  在機器學習的無監督算法中,可能C均值算法是較早出現(筆者在韓家煒教授上世紀90年代所著的《數據挖掘》中最早看到)同時其若干變種可能也是應用最爲廣泛的一類無監督算法,只不過那時可能機器學習一詞使用的還不甚廣泛,而是叫做數據挖掘(Dat

原创 關於機器學習中貝葉斯決策的相關討論

前言  貝葉斯決策可能在相關機器學習或數據挖掘或專家系統中有着廣泛的應用,故其地位也相當重要;比如在垃圾郵件的過濾、釣魚郵件的判定、垃圾(釣魚)短信過濾等場合的應用就相當多(因爲筆者較多地從事這些工作),或者可以說上述這些應用其實其主要方法

原创 關於機器學習中數據降維的相關方法

前言  在之前一些文章的討論中,通過一些例子我們可以發現(主要是關於決策樹或隨機森林的相關內容)其實並不是樣本的所有屬性可能都是那麼得重要,只要不是同等重要,特別是在分類問題上可能可以去除一些屬性或特徵(一般決策樹需要進行剪枝,其實剪枝的原

原创 關於機器學習中一般線性迴歸的補充

  在之前的文章中,筆者給出了關於最小二乘法相關公式的整體推導過程,最小二乘法本身除了可以利用數據進行相關參數的擬合(主要是係數和偏置),而且作爲分類問題中最爲簡單的模型也有着重要作用,我們也可以將其稱作最爲簡單的線性迴歸模型(以後需要涉及

原创 關於機器學習中文本處理的一些常用方法

前言  文本挖掘也是機器學習或者說是人工智能最需要處理的一類信息(其它的諸如語音、圖像及視頻處理等);隨着數字信息化和網絡化進程不斷深入,用戶的在線交流、發佈、共享等都被以文字形式記錄下來,它們成爲分析語言和理解社會的重要素材來源,對於文本

原创 關於DPDK17或18無法在CentOS6上綁定網卡問題的解決方案

問題:如題;主要出現在內核版本在2.6.37以下的系統,內核模塊可以編譯和插入,但是綁定網卡總是失敗(message中給出的trace是說中斷問題); 後查找一些資源並對比了16的相關實現代碼,發現其中有個標誌送的有問題,修改後就可

原创 關於tensorflow使用的一些簡單的問題

  筆者在前兩年爲了驗證一些神經網絡問題曾經在Ubuntu上安裝了Tensorflow,這個好像運行並沒有什麼太大的問題,但近期又在Windows(Win10)下安裝使用最新的Tensorflow,不知爲什麼總是存在一些麻煩,後來才明白在W

原创 關於機器學習中的一些常用方法的補充

前言  機器學習相關算法數量龐大,很難一一窮盡,網上有好事之人也評選了相關所謂十大算法(可能排名不分先後),它們分別是: 1.       決策樹2.       隨機森林算法3.       邏輯迴歸4.       支持向量機5.