自動化運維利器Ansible要點彙總

由於大部分互聯網公司服務器環境複雜,線上線下環境、測試正式環境、分區環境、客戶項目環境等造成每個應用都要重新部署,而且服務器數量少則幾十臺,多則千臺,若手工一臺臺部署效率低下,且容易出錯,不利後期運維,因此需要Ansible或者Saltstack來解決此問題。

  Ansible與Saltstack最大的區別是Ansible無需在被控主機部署任何客戶端代理,默認直接通過SSH通道進行遠程命令執行或下發配置,這裏不作詳細對比,直接使用Ansible。Ansible是DevOps項目基礎工具之一,致力於自動化、工具化的全新維護模式,通過工具化自動化的作業,提高生產效率的同時減輕維護人員的重擔。

  Ansible是一款基於Python開發的自動化運維工具,實現了批量系統配置、批量程序部署、批量運行命令等功能,主要特點:

部署簡單,只需在主控端部署Ansible環境,被控端無需做任何操作,默認使用SSH協議對設備進行管理;

配置簡單、功能強大、擴展性強;

支持API及自定義模塊,可通過Python輕鬆擴展;

通過Playbooks來定製強大的配置、狀態管理;

冪等性:一種操作重複多次結果相同

Ansible工作流程


  ansible.cfg主要配置指定host文件路徑,指定roles_path參數,其它參數默認。

  部署Ansible的控制機需要python 2.7及以上,需要安裝paramiko模塊、PyYAML、Jinja2、httplib2等模塊,若被管節點爲windows,則需要有powershell3並制授權遠程管理。

  控制節點交互一般採用公鑰認證,這需要將主機節點的公鑰發放到所有被管節點,也可採用密碼形式通訊,但由於需要在hosts文件中明文標出不安全 不推薦,配置密碼:

/etc/ansible/hosts192.168.0.200ansible_ssh_user=root ansible_ssh_pass=123@abc

  主機清單(host inventory)定義了管理主機的策略,需要在host文件中寫入主機的IP地址即可,若操作的主機未在清單中會提示錯誤。

ansible命令執行過程

1、加載自己的配置文件,默認/etc/ansible/ansible.cfg

2、查找對應的主機配置文件,找到要執行的主機或者組。

3、加載自己對應的模塊文件,如command

4、通過ansible將模塊或命令生成對應的臨時py文件,並將該文件傳輸至遠程服務器

5、對應執行用戶家目錄的.ansible/tmp/XXX/XXX.PY文件

6、給文件+x執行

7、執行並返回結果

8、刪除臨時py文件,sleep 0 退出。

  Ansible完成任務的兩種方式,一種是Ad-Hoc,就是ansible命令,另一種就是Ansible-playbook,也就是ansible-playbook命令。他們的區別就像是Command命令行和Shell Scripts。

ansible命令

獲取192.168.0.123主機信息

ansible 192.168.0.123 -m shell -a "uname -a"


ansible常用模塊

command、shell、raw、script執行shell命令

copy:複製文件到遠程主機,可以改權限等

file設置文件目錄屬性等

fetch 從遠程某主機獲取文件到本地

service 服務程序管理,啓動停止重啓服務等操作

user管理用戶賬號

script在指定節點運行服務端的腳本

Playbooks中的一些技巧

playbook目錄結構

  webservice.yml爲入口,files目錄存放靜態文件,handlers存放一些task的handler,templates存放jinja2模板文件,vars存放變量文件。

  ansible-playbook執行logstash安裝劇本

ansible-playbook /logstash/site.yml

  這裏不詳細介紹playbook的使用,只摘出幾個重要的使用場景方法。

delegate_to

  將某一個任務委託給指定主機,如在192.168.0.9服務器上檢測k8s集羣狀態:

- name: get status

  command: get k8s status

  delegate_to: "192.168.0.9"

  若委派給本機的時候,還可以使用更快捷的方法local_action

- name: get status

  local_action : command 'get k8s status'

run_once

  run_once: true來指定該task只能在某一臺機器上執行一次. 可以和delegate_to 結合使用,指定在"192.168.0.9"上執行一次升級數據庫操作

- command: /opt/upgrade_db.py

run_once: true

delegate_to: "192.168.0.9"

  如果沒有delegate_to, 那麼這個task會在第一臺機器上執行

ignore_errors

  指定 ignore_errors:true,任務失敗繼續完成剩餘的任務。例如,當刪除最初並不存在的日誌文件時拋錯 但忽略錯誤繼續執行剩餘的任務。

- name: 'Delete logs'

shell: rm -f /var/log/nginx/errors.log

ignore_errors: true

register 註冊變量

  使用 debug 模塊與 register 變量,輸出網絡信息

- hosts: proxyservers

tasks:

- name: "get host port info"

shell: netstat -lntp

register: host_port

- name: "print host port"

debug:

#msg: "{{ host_port }}" # 輸出全部信息

#msg: "{{ host_port.cmd }}" # 引用方式一

msg: "{{ host_port['stdout_lines'] }}" # 引用方式二

connection: local

  在本地服務器上運行命令,而不是SSH

- name: 創建 aggregator proxy證書籤名請求

template: src=aggregator-proxy-csr.json.j2 dest=/ssl/aggregator-proxy-csr.json

connection: local

until輪詢等待

  輪詢等待kube-apiserver啓動完成,查看api服務是否running狀態,重試10次,每次間隔3秒

- name: 輪詢等待kube-apiserver啓動

  shell: "systemctl status kube-apiserver.service|grep Active"  register: api_status

  until: '"running" in api_status.stdout'  retries: 10  delay: 3  tags: upgrade_k8s, restart_master

when判斷

  當系統爲centos等時執行centos.yml任務

- import_tasks: centos.yml

  when: 'ansible_distribution in ["CentOS","RedHat","Amazon","Aliyun"]'

內置變量inventory_hostname

  inventory_hostname變量可以獲取到被操作的當前主機的主機名稱,這裏所說的主機名稱並不是linux系統的主機名,而是對應主機在清單中配置的名稱

如果使用IP配置主機,inventory_hostname的值就是IP,如果使用別名,inventory_hostname的值就是別名

  如只給k8s主節點分發配置文件

- name: 分發kubeconfig配置文件

  copy: src=cluster_dir/item dest=/etc/kubernetes/item

  when: "inventory_hostname in groups['kube_master']"

notify指令和handlers

  如果在某個task中定義了notify指令,當Ansible在監控到該任務 changed=1時,會觸發該notify指令所定義的handler,然後去執行handler,需要注意的是hander是被觸發而被動執行的。

  網上示例,安裝httpd、複製配置文件到遠端主機、啓動httpd服務:

cat apache.yml- hosts: webservers

  remote_user: root

  tasks:

  - name: install apache

    yum: name=httpd state=latest

  - name: install configure filefor httpd

    copy: src=/root/conf/httpd.conf dest=/etc/httpd/conf/httpd.conf

    notify:

    - restart httpd  #通知restart httpd這個觸發器

    - check httpd  #可以定義多個觸發器

  - name: start httpd service

    service: enabled=truename=httpd state=started

  handlers:  #定義觸發器,和tasks同級

  - name: restart httpd  #觸發器名字,被notify引用,兩邊要一致

    service: name=httpd state=restart

  - name: check httpd

    shell: netstat -ntulp | grep80

ansible管理windows

  環境要求Ansible管理主機Linux系統,遠程主機的通信方式也由SSH變更爲PowerShell,同時管理機必須預安裝Python的Winrm模塊。

  Windows客戶端主機開啓Winrm服務,PowerShell需3.0+版本且Management Framework 3.0+版本,實測Windows 7 SP1和Windows Server 2008 R2及以上版本系統經簡單配置可正常與Ansible通信。

  具體安裝內容這裏不作詳情介紹。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章