原创 算法編程方法總結

動態規劃 1、通常用數組表示,且通常從後往前思考,編程從前往後迭代實現,如兩個字符串的匹配 2、寫出邊界函數,遞歸規律 樹 1、回溯法 (套用backTrack) 2、前序、後續。。 3、利用遞歸左右子樹與或,如下,先判斷當前節點no

原创 數據分析 kaggle 天池 競賽常用函數整理

// 顯示數據的缺失程度 def miss_value_table(df): mis_val = df.isnull().sum() mis_val_percent = 100*(mis_val/len(df))

原创 ubuntu18 ssh 遠程登錄服務器

ssh 用戶名@遠程服務器ip 而後會有提示輸入密碼

原创 Ubuntu18.04開啓Mongodb,設置數據庫文件路徑

參考https://www.cnblogs.com/shileima/p/7823434.html 因爲不想創建在根目錄data/db,利用虛擬機的共享文件,設置新的路徑 如果 sudo service mongod start,出

原创 論文筆記-Fast Abstractive Summarization with Reinforce-Selected Sentence Rewriting

Fast Abstractive Summarization with Reinforce-Selected Sentence Rewriting 利用強化選擇句子進行快速抽象概括簡介新的改變功能快捷鍵合理的創建標題,有助於目錄的生成

原创 論文筆記 A New Alert Correlation Algorithm Based on Attack Graph

A New Alert Correlation Algorithm Based on Attack Graph 基於攻擊圖的一種新型告警關聯算法摘要介紹告警關聯基於攻擊圖的高性能關聯定義映射聚合告警依賴性搜索實驗和討論結論 Aut

原创 特徵工程 處理類別類型特徵 One-Hot Encoding 和LabelEncoder 區別

LabelEncoder可以將[中國,美國,日本]轉化爲[0,1,2],但這樣會出現一個問題:中國和日本的平均會等於日本。 決策樹、隨機森林算法等可以直接處理這樣的類別類型特徵,並且這種方法使用的特徵空間很少。 One-Hot Enc

原创 Python 將Unix時間戳轉化爲通用時間(年,天,時,分)。處理Dataframe中的Unix時間戳

import time def time_transform(unix_time): tt = {} # 利用字典存儲 t = time.gmtime(unix_time) # 重要的是這個函數,可獲得更多的信

原创 論文筆記- Collection Mechanism and Reduction of IDS Alert

Collection Mechanism and Reduction of IDS Alert AbstractRelated WorkMethodologyTraffic Data Retrieval and Collection

原创 pandas 查看屬性列的重複特性,

#該方法只能用於非數值型屬性,如果要判斷數值型,可以先暫時轉換爲str類型 df.describe(include=['O']) unique爲不重複的個數,如有值[‘A’,‘B’,‘A’,‘C’]4個值,其unique=3。 d