原创 用戶和組

groupadd 新增組 -g (gid)groupdel 刪除組(組中沒有賬戶)useradd 增加賬戶  -u (uid)   -g 使其屬於某個已經存在的組後可接組id或者組名  -d 自定義用戶家目錄  -M 不建立家目錄userd

原创 linux 磁盤管理

1.df 查看已掛載磁盤的總容量,使用容量,剩餘容量(k爲單位) “-i” 查看inodes使用狀況“-h,-k,-m” 使用合適的單位顯示,例如 ‘G’”/dev/shm” 爲內存掛載點du 查看某個文件或者目錄佔用空間大小2.fdisk

原创 文檔壓縮與打包(理解)

gz gzip 壓縮工具壓縮的文件.bz2 bzip2 壓縮工具壓縮的文件.tar tar 打包程序打包的文件(tar並沒有壓縮功能,只是把一個目錄合併成一個文件).tar.gz 可以理解爲先用tar打包,然後再gzip壓縮.tar.bz2

原创 rpm安裝包(重點)

1安裝rpm 包  rpm -ivh      -i 安裝   -v 可視化   -h顯示進度升級rpm 包  rpm -Uvh filename卸載rpm包 rpm -e filename查詢包是否安裝  rpm -q 包名rpm -qa

原创 源碼安裝步驟

把源碼編譯成二進制的可執行文件(自定義修改源代碼,定製相關功能,附加額外選項)編譯器(gcc):安裝 yum install -y gcc echo $?驗證是否安裝成功 成功輸出爲0源碼安裝步驟1)./configure 可定製相關功能(

原创 apache

原创 python爬蟲思路

python2爬蟲:從網頁上採取數據爬蟲模塊:urllib,urllib2,re,bs4,requests,scrapy,xlml1.urllib2.request3.bs44.正則re5種數據類型(1)數字Number(2)字符串Stri

原创 解決中文亂碼問題

1.獲取網站中文亂碼 在獲取網頁源碼,聲明r的編碼方式r.encoding 2.非法字符拋出異常 將某個字符從gbk解碼爲unicode,str.decode('gbk')unicodeDecodeError:'Gbk' codec ca

原创 gawk

1.定義變量保存數據2.使用算數和字符串操作符處理數據3.使用結構化編程概念來爲數據處理增加處理邏輯4.通過提取數據文件中的數據元素,將其重新排列或格式化,生成格式化報告5.gawk options program file

原创 linux 日常管理

監控系統狀態w 查看當前系統負載(整體負載)第一行從左到右:時間,系統運行時間,登錄用戶數,平均負載(單位時間內cpu活動進程數(值越大 服務器壓力越大,只要不超過cpu數量就可以))(1分鐘內系統平均負載值,5分鐘內系統平均負載值,15分

原创 shell入門

vi /vim編輯器命令基礎(100多個)網絡服務(基礎)nfs、sync、 inotify、 lamp、 sersync、 ssh key批量分發管理#!/bin/bash#author by xiaojiang#print hello

原创 源碼安裝步驟

把源碼編譯成二進制的可執行文件(自定義修改源代碼,定製相關功能,附加額外選項)編譯器(gcc):安裝 yum install -y gcc echo $?驗證是否安裝成功 成功輸出爲0源碼安裝步驟1)./configure 可定製相關功能(

原创 文本處理工具sed awk

sed 非交互式流編輯器 1.默認情況sed不會改變原文件,處理文本時以行爲單位,每處理一行就打印出來,然後再處理下一行,直到文件結束2.編輯動作:刪除、查找替換、添加、插入、從其他文件讀入數據3.要保存修改後的文件,使用重定向4.直接修改

原创 解決中文亂碼問題

1.獲取網站中文亂碼 在獲取網頁源碼,聲明r的編碼方式r.encoding 2.非法字符拋出異常 將某個字符從gbk解碼爲unicode,str.decode('gbk')unicodeDecodeError:'Gbk' codec ca

原创 linux字符處理

一.grep :Global search regular expression and prin out the line grep:基於行的文本處理工具#grep [-ivnc] '需要匹配的字符' 文件名#-i 不區分大小寫#-v