原创 Linux文件內容去重

原文鏈接:https://blog.csdn.net/qq_27446553/article/details/50476172 (1)兩個文件的交集,並集 取出兩個文件的並集(重複的行只保留一份) cat file1 file

原创 vim 多行同時操作

刪除操作 光標移到所開始的行 按 control + v 進入 VISUAL BLOCK 模式 選中要刪除的內容 d刪除 插入操作 光標移到所開始的行 按 control + v 進入 VISUAL BLOCK 模式 選中要插入的

原创 vim——替換

將當前行第一個a替換爲b :s/a/b/ 將當前行的所有a替換爲b :s/a/b/g 將第n行到最後一行第一個a替換爲b :n,$s/a/b/ 將第n行到最後一行所有a替換爲b :n,$s/a/b/g 將當前行到最後一行所

原创 Python set() 函數 —— 去重,交集,並集,差集

描述 set() 函數創建一個無序不重複元素集,可進行關係測試,刪除重複數據,還可以計算交集、差集、並集等。 語法 set 語法: class set([iterable]) 參數說明: iterable -- 可迭代對象對象; 返回值

原创 linux命令(備份壓縮)

Linux gzip命令Linux gzip命令用於壓縮文件。gzip是個使用廣泛的壓縮程序,文件經它壓縮過後,其名稱後面會多出".gz"的擴展名。語法gzip [-acdfhlLnNqrtvV][-S <壓縮字尾字符串>][

原创 Linux下查看文件文件內容

查看文件第5行內容#方法一: $ head -5 file.txt | tail -1 #方法二: $ nl file.txt | sed -n '5p' #方法三: $ sed -n '5p' file.txt #方法四: $ a

原创 python2 spider 今日頭條

requests + json直接上代碼:#!/usr/bin/python # coding=utf-8 import requests import json url = 'http://www.toutiao.com/api/

原创 python2 spider 豆瓣電視劇

直接上代碼,第一種方式獲取不到數據。#.*-coding:utf-8-*- import requests import re import sys reload(sys) sys.setdefaultencoding("utf-8")

原创 Python3爬蟲實戰一之爬取糗事百科段子

參考:靜覓 » Python爬蟲實戰一之爬取糗事百科段子python3 + requests + csv1.抓取糗事百科熱門段子2.過濾帶有圖片的段子3.實現每按一次回車顯示一個段子的發佈時間,發佈人,段子內容,點贊數。4.寫入csv文件

原创 python3 詞頻統計

主要是對正則表達式、字符串內建函數、collections模塊的Counter類的應用。正則表達式 http://www.runoob.com/python3/python3-reg-expressions.htmlre.split   

原创 Ubuntu17.10安裝MySQL

1、安裝MySQL首先執行下面三條命令:$ sudo apt-get install mysql-server $ sudo apt-get isntall mysql-client $ sudo apt-get install libm

原创 對find,xargs,grep和管道的一些深入理解

轉自於:http://fatmouse.xyz/2016/05/10/2016-05-10-find-grep-xargs-and-pipe/問題相信大家都知道在目錄中搜索含有固定字符串文件的命令:1 find . -name '*.py