由於大部分互聯網公司服務器環境複雜,線上線下環境、測試正式環境、分區環境、客戶項目環境等造成每個應用都要重新部署,而且服務器數量少則幾十臺,多則千臺,若手工一臺臺部署效率低下,且容易出錯,不利後期運維,因此需要Ansible或者Saltstack來解決此問題。
Ansible與Saltstack最大的區別是Ansible無需在被控主機部署任何客戶端代理,默認直接通過SSH通道進行遠程命令執行或下發配置,這裏不作詳細對比,直接使用Ansible。Ansible是DevOps項目基礎工具之一,致力於自動化、工具化的全新維護模式,通過工具化自動化的作業,提高生產效率的同時減輕維護人員的重擔。
Ansible是一款基於Python開發的自動化運維工具,實現了批量系統配置、批量程序部署、批量運行命令等功能,主要特點:
部署簡單,只需在主控端部署Ansible環境,被控端無需做任何操作,默認使用SSH協議對設備進行管理;
配置簡單、功能強大、擴展性強;
支持API及自定義模塊,可通過Python輕鬆擴展;
通過Playbooks來定製強大的配置、狀態管理;
冪等性:一種操作重複多次結果相同
Ansible工作流程
ansible.cfg主要配置指定host文件路徑,指定roles_path參數,其它參數默認。
部署Ansible的控制機需要python 2.7及以上,需要安裝paramiko模塊、PyYAML、Jinja2、httplib2等模塊,若被管節點爲windows,則需要有powershell3並制授權遠程管理。
控制節點交互一般採用公鑰認證,這需要將主機節點的公鑰發放到所有被管節點,也可採用密碼形式通訊,但由於需要在hosts文件中明文標出不安全 不推薦,配置密碼:
/etc/ansible/hosts192.168.0.200ansible_ssh_user=root ansible_ssh_pass=123@abc
主機清單(host inventory)定義了管理主機的策略,需要在host文件中寫入主機的IP地址即可,若操作的主機未在清單中會提示錯誤。
ansible命令執行過程
1、加載自己的配置文件,默認/etc/ansible/ansible.cfg
2、查找對應的主機配置文件,找到要執行的主機或者組。
3、加載自己對應的模塊文件,如command
4、通過ansible將模塊或命令生成對應的臨時py文件,並將該文件傳輸至遠程服務器
5、對應執行用戶家目錄的.ansible/tmp/XXX/XXX.PY文件
6、給文件+x執行
7、執行並返回結果
8、刪除臨時py文件,sleep 0 退出。
Ansible完成任務的兩種方式,一種是Ad-Hoc,就是ansible命令,另一種就是Ansible-playbook,也就是ansible-playbook命令。他們的區別就像是Command命令行和Shell Scripts。
ansible命令
獲取192.168.0.123主機信息
ansible 192.168.0.123 -m shell -a "uname -a"
ansible常用模塊
command、shell、raw、script執行shell命令
copy:複製文件到遠程主機,可以改權限等
file設置文件目錄屬性等
fetch 從遠程某主機獲取文件到本地
service 服務程序管理,啓動停止重啓服務等操作
user管理用戶賬號
script在指定節點運行服務端的腳本
Playbooks中的一些技巧
playbook目錄結構
webservice.yml爲入口,files目錄存放靜態文件,handlers存放一些task的handler,templates存放jinja2模板文件,vars存放變量文件。
ansible-playbook執行logstash安裝劇本
ansible-playbook /logstash/site.yml
這裏不詳細介紹playbook的使用,只摘出幾個重要的使用場景方法。
delegate_to
將某一個任務委託給指定主機,如在192.168.0.9服務器上檢測k8s集羣狀態:
- name: get status
command: get k8s status
delegate_to: "192.168.0.9"
若委派給本機的時候,還可以使用更快捷的方法local_action
- name: get status
local_action : command 'get k8s status'
run_once
run_once: true來指定該task只能在某一臺機器上執行一次. 可以和delegate_to 結合使用,指定在"192.168.0.9"上執行一次升級數據庫操作
- command: /opt/upgrade_db.py
run_once: true
delegate_to: "192.168.0.9"
如果沒有delegate_to, 那麼這個task會在第一臺機器上執行
ignore_errors
指定 ignore_errors:true,任務失敗繼續完成剩餘的任務。例如,當刪除最初並不存在的日誌文件時拋錯 但忽略錯誤繼續執行剩餘的任務。
- name: 'Delete logs'
shell: rm -f /var/log/nginx/errors.log
ignore_errors: true
register 註冊變量
使用 debug 模塊與 register 變量,輸出網絡信息
- hosts: proxyservers
tasks:
- name: "get host port info"
shell: netstat -lntp
register: host_port
- name: "print host port"
debug:
#msg: "{{ host_port }}" # 輸出全部信息
#msg: "{{ host_port.cmd }}" # 引用方式一
msg: "{{ host_port['stdout_lines'] }}" # 引用方式二
connection: local
在本地服務器上運行命令,而不是SSH
- name: 創建 aggregator proxy證書籤名請求
template: src=aggregator-proxy-csr.json.j2 dest=/ssl/aggregator-proxy-csr.json
connection: local
until輪詢等待
輪詢等待kube-apiserver啓動完成,查看api服務是否running狀態,重試10次,每次間隔3秒
- name: 輪詢等待kube-apiserver啓動
shell: "systemctl status kube-apiserver.service|grep Active" register: api_status
until: '"running" in api_status.stdout' retries: 10 delay: 3 tags: upgrade_k8s, restart_master
when判斷
當系統爲centos等時執行centos.yml任務
- import_tasks: centos.yml
when: 'ansible_distribution in ["CentOS","RedHat","Amazon","Aliyun"]'
內置變量inventory_hostname
inventory_hostname變量可以獲取到被操作的當前主機的主機名稱,這裏所說的主機名稱並不是linux系統的主機名,而是對應主機在清單中配置的名稱
如果使用IP配置主機,inventory_hostname的值就是IP,如果使用別名,inventory_hostname的值就是別名
如只給k8s主節點分發配置文件
- name: 分發kubeconfig配置文件
copy: src=cluster_dir/item dest=/etc/kubernetes/item
when: "inventory_hostname in groups['kube_master']"
notify指令和handlers
如果在某個task中定義了notify指令,當Ansible在監控到該任務 changed=1時,會觸發該notify指令所定義的handler,然後去執行handler,需要注意的是hander是被觸發而被動執行的。
網上示例,安裝httpd、複製配置文件到遠端主機、啓動httpd服務:
cat apache.yml- hosts: webservers
remote_user: root
tasks:
- name: install apache
yum: name=httpd state=latest
- name: install configure filefor httpd
copy: src=/root/conf/httpd.conf dest=/etc/httpd/conf/httpd.conf
notify:
- restart httpd #通知restart httpd這個觸發器
- check httpd #可以定義多個觸發器
- name: start httpd service
service: enabled=truename=httpd state=started
handlers: #定義觸發器,和tasks同級
- name: restart httpd #觸發器名字,被notify引用,兩邊要一致
service: name=httpd state=restart
- name: check httpd
shell: netstat -ntulp | grep80
ansible管理windows
環境要求Ansible管理主機Linux系統,遠程主機的通信方式也由SSH變更爲PowerShell,同時管理機必須預安裝Python的Winrm模塊。
Windows客戶端主機開啓Winrm服務,PowerShell需3.0+版本且Management Framework 3.0+版本,實測Windows 7 SP1和Windows Server 2008 R2及以上版本系統經簡單配置可正常與Ansible通信。
具體安裝內容這裏不作詳情介紹。