原创 2.9學習筆記(西瓜書1)

提高模型性能:自己製作特徵,製作多個模型 特徵選擇: 1.跑一遍隨機森林得到特徵重要性,刪掉重要性低的 2.計算每個特徵和label的相關性 1.加載數據,數值化求特徵 2.svm算法學習一個模型 3.利用模型對新數據做分類預測

原创 0302學習筆記(css)

簡單使用方式 方式1,在html頁面裏的style標籤中添加樣式 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Titl

原创 9.17學習筆記(重複值處理、數據清洗)

pandas的duplicated()判斷重複值記錄 pandas的drop_duplicates()刪除數據記錄,可指定特定列或全部 numpy中unique()返回所有不同的值,且按照從小到大的順序 set(),python自

原创 9.18學習筆記(特徵工程)

import re #加載正則表達式庫 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns fr

原创 9.19學習筆記(數據清洗、建模)

數據清洗完整代碼 import re #加載正則表達式庫 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn

原创 9.20學習筆記(模型)

運用訓練的模型文件進行預測 from sklearn.externals import joblib import numpy as np dataset=np.loadtxt(fname="tree.data",delimite

原创 4.8實驗記錄(爬取so問答)

只爬取指定的類的div from bs4 import BeautifulSoup soup=BeautifulSoup(h,'html.parser') a=soup.find_all('div',class_="post-te

原创 2.13實驗記錄

c環境下 一、linux下 zombie2.c #include<stdio.h> #include<stdlib.h> int main(){ int i=0; int p=fork();

原创 20200116

fuzzywuzzy:字符串模糊處理庫 fuzz.ratio(“python package”,“pythonpackage”) 兩個字符串的距離 from fuzzywuzzy import fuzz print(fuzz.ra

原创 200619學習筆記(膽戰心驚的自動部署)

要傳的東西在/home/yangyuexiang,下面整個目錄全是 scp -r /home/yangyuexiang root@#14:/home/tr 實現免密碼,假設以後91節點是發送者 生成配對密鑰(兩邊ID要一樣所以先切

原创 2.26實驗記錄

試圖製作一個centos7+python3.x+mysql的容器 思路1:找現成的(失敗) 思路2:拿已有的centos+python的容器,在裏面安裝mysql,然後製作成鏡像 在docker裏安裝一直報錯 在linux裏安裝卡

原创 2.23實驗記錄

殺死指定用戶所有進程的方法 1.pkill -u user_id 2.killall -u user_id 3.ps列出user的pid然後依次kill掉 ps -ef | grep user_id | awk ‘{ print

原创 SQL刷領釦

620 有趣的電影 餘數用mod比%要效率 where 列 != 值

原创 200616學習筆記(查看端口是否佔用+KVM建立虛擬機)

netstat -an |findstr 80 查找80端口的進程 重啓的小腳本 #coding:utf-8 # handly retart nginx in case of nginx exits anormaly imp

原创 2.26實驗記錄續(txt寫入mysql)

docker pull mysql docker run -p 3306:3306 --name mysql -e MYSQL_ROOT_PASSWORD=123456 -d mysql 查看狀態 docker containe