台部落呆萌的代Ma

原始數據是 dataframe 的一列 “timestamp” 需要按照每5分鐘做一次切分，下面是切分的代碼： import pandas as pd def dataframe_strip(dataframe: pd.Data

2020-07-08 04:48:59

這個就是內存佔用超過了限制，解決方案：加載文件的容量太大這個只能切分文件，使用BufferedInputStream一行行讀取： BufferedInputStream bufferedReader = new Buffere

2020-07-08 04:48:59

目前沒有找到一個函數來做這件事的,因此自己敲一個: 計算相鄰兩行的均值: dataframe['length_mean'] = (dataframe['length'].shift(-1) + \

2020-07-07 12:02:08

通過解析pcap文件，按照{src ip, src port, transport protocol , dst ip, dst port} 拆分流，並提取出前向流(Forward)與後向流(Backward)，代碼如下： imp

2020-07-07 12:02:08

D star lite 算法的論文網址：http://idm-lab.org/bib/abstracts/papers/aaai02b.pdf 根本思想是從後往前計算，每當客觀環境發生變化時就可以節省未變環境的計算量： Gi

2020-07-07 12:02:08

本博客旨在把idea全家桶中快捷鍵的英文與中文羅列出來，方便大家自定義中文英文位置代碼提示 Basic code - completion - Basic 同時多行輸入 Add or Remove Car

2020-07-07 12:02:08

如果是篩選某一列中等於某個值的那一行,可以使用: dataframe[dataframe['列名'] == "具體值"] 如果篩選某兩列中的值等於具體值的那幾行,可以使用: search_se = dataframe.loc[d

2020-07-07 12:02:08

亂序多線程寫入舉個最簡單的例子，只要求快速寫入即可，對順序無要求時： import threading def write_string(string, path="test.csv"): with open(path

2020-07-07 12:02:08

在整數規劃時遇到 max{a, b, c} 或是 min{d, e, f} 這樣的約束時, 我們把它轉換爲代碼的形式, 這樣就能方便建模了 def max_to_code(change_list=[]): def get_max

2020-06-26 06:04:40

文章目錄一新型冠狀病毒肺炎國內分省分日期全部數據（1.16起）：原始json格式數據下載csv格式數據下載二數據來源與抓取數據到手流程三數據下載與整理成csv 一新型冠狀病毒肺炎國內分省分日期全部數據（1.16起）：原始

2020-06-26 06:04:40

首先導入庫： import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt import seaborn as sns %matplotlib i

2020-06-26 06:04:40

我們使用exec構造代碼,並用兩種方法打印出來: 構造代碼 code = "a = 6" 執行代碼: exec(code) 在程序中得到a的值: #方法一: exec(print(a)) #方法二: b = locals()["

2020-06-26 06:04:40

文章目錄1 常用命令抓取一個固定主機ip的端口號，並保存在本地後臺抓取多個主機的數據包按抓包的時間保存數據包2 自定義操作自定義網絡接口自定義端口自定義抓取數據包的個數自定義指定協議參考鏈接剛從wireshark轉到tcpdu

2020-06-26 06:04:29

使用fitter庫，安裝： pip install -i https://pypi.tuna.tsinghua.edu.cn/simple fitter Github官網：https://github.com/cokelaer/fitt

2020-06-26 06:04:29

文章目錄Hurst不同值對應的圖代碼基於重標極差(R/S)分析方法基礎上的赫斯特指數，是作爲判斷時間序列數據遵從隨機遊走還是有偏的隨機遊走過程的指標，簡單來講：就是判斷“大勢所趨”裏的“大勢”是什麼 Hurst的值域是 [0,1

2020-06-26 06:04:28