虛擬化

CPU虛擬化:

1、模擬:emulation;

2、虛擬:virtualization;

a、完全虛擬化(full-virtualization):BT:二進制翻譯(軟件)、HVM:硬件輔助的虛擬化(硬件)

b、半虛擬化(para-virtualization):

Memory虛擬化:

進程:線性地址空間

內核:物理地址空間

MMU   virtualization:

1、intel:EPT,extended page table

2、amd:NPT,nested page  table

TLB(Translation Lookaside Buffer)轉換檢測緩衝區  virtualization:tagged TLB

I/O 虛擬化:

外存:硬盤、光盤、U盤

網絡設備:網卡

顯示設備:VGA;frame buffer(幀緩存)機制

鍵盤鼠標:ps/2、usb

總結I/O虛擬化的方式:

1、模擬:完全使用軟件來模擬真實硬件;

2、半虛擬化:通常僅適用於硬盤、網卡設備;

3、IO-through:IO透傳;intel:VT-d

虛擬化模型:即實現方式

類型一:在系統上電之後首先加載運行虛擬機監控程序,而傳統的操作系統則是運行在其創建的虛擬機中。代表:xen、vmware esx/esxi;

類型二:在系統上電之後仍然運行一般意義上的操作系統(也就是俗稱的宿主操作系統),虛擬機監控程序作爲特殊的應用程序,可以視作操作系統功能的擴展。代表:kvm、vmware workstation、virtualbox;

Intel硬件輔助的虛擬化:
CPU: vt-x, EPT, tagged-TLB
IO/CPU: vt-d, IOV, VMDq
第一類:跟處理器相關:vt-x
第二類:跟芯片相關:vt-d
第三類:跟IO相關:VMDq和SR-IOV

虛擬化技術的分類:
模擬:著名的模擬器,PearPC, Bochs, QEMU
完全虛擬化:也稱爲native virtulization
兩種加速方式:
BT
HVM
VMware Workstation, VMware Server, Parallels Desktop, KVM, Xen(HVM)
半虛擬化:para-virtualization
xen, uml(user-mode linux)
OS級別的虛擬化:
OpenVZ, lxc
Solaris Containers
FreeBSD jails
庫虛擬化:
wine
應用程序虛擬化:
jvm

虛擬化網絡:
nat mode
bridge mode
routed mode
isolation mode

使用brctl的配置的過程示例:

brctl addbr br0

brctl stp br0 on

ifconfig eth0 0 up

brctl addif br0 eth0

ifconfig br0 IP/NETMASK up

route add default gw GW

KVM: Kernel-based Virtual Machine, Qumranet公司, 依賴於HVM;Intel VT-x, ADM ADM-V;

KVM模塊載入後的系統的運行模式:
內核模式:GuestOS執行I/O類操作,或其它的特殊指令的操作;稱作“來賓-內核”模式;
用戶模式:代表GuestOS請求I/O類操作;
來賓模式:GuestOS的非I/O類操作;事實上,它被稱作“來賓-用戶”模式;
kvm hypervisor:

KVM的組件:
兩類組件:
/dev/kvm:工作於hypervisor,在用戶空間可通過ioctl()系統調用來完成VM創建、啓動等管理功能;它是一個字符設備,功能:
創建VM、爲VM分配內存、讀寫VCPU的寄存器、向VCPU注入中斷、運行VCPU等等;
qemu進程:工作於用戶空間,主要用於實現模擬PC機的IO設備;

KVM特性:
內存管理:
將分配給VM的內存交換至SWAP;
支持使用Huge Page;
支持使用Intel EPT或AMD RVI技術完成內存地址映射;GVA-->GPA-->HPA
支持KSM (Kernel Same-page Merging)
硬件支持:
取決於Linux內核;
存儲:
本地存儲:
網絡附加存儲:
存儲區域網絡:
分佈式存儲:例如GlustFS
實時遷移:
支持的GuestOS:
Linux, Windows, OpenBSD, FreeBSD, OpenSolaris;
設備驅動:
IO設備的完全虛擬化:模擬硬件
IO設備的半虛擬化:在GuestOS中安裝驅動;virtio
virtio-blk, virtio-net, virtio-pci, virtio-console, virtio-ballon

KVM侷限性:
1、一般侷限性:
a、CPU overcommit
b、時間記錄難以精確,依賴於時間同步機制
2、MAC地址:
a、VM量特別大時,存在衝突的可能性;
b、實時遷移:
c、性能侷限性:

KVM的工具棧:
1、qemu:
qemu-kvm
qemu-img
qemu-io
2、libvirt:
GUI: virt-manager, virt-viewer
CLI: virt-install, virsh

QEMU主要提供了以下幾個部分:
處理器模擬器
仿真IO設備
關聯模擬的設備至真實設備;
調試器
與模擬器交互的用戶接口

安裝:
(1) 確保CPU支持HVM

grep -E --color=auto "(vmx|svm)" /proc/cpuinfo

(2) 裝載模塊

modprobe kvm

modprobe kvm-intel

(3) 驗正:
/dev/kvm

管理工具棧:
1、使用qemu-kvm管理工具:

yum install qemu-kvm

ln -sv /usr/libexec/qemu-kvm /usr/bin/

2、libvirt:
安裝:virt-install、virt-manager
管理:virsh、virt-manager、virt-viewer

qemu-kvm [options] [disk_image]
options分類:
◇ 標準選項;
◇塊設備選項;
◇顯示選項;
◇i386平臺專用選項;
◇網絡選項;
◇字符設備選項;
◇藍牙相關選項;
◇Linux系統引導專用選項;
◇調試/專家模式選項;
◇PowerPC專用選項;
◇Sparc32專用選項;

qemu-kvm的標準選項
qemu-kvm的標準選項主要涉及指定主機類型、CPU模式、NUMA、軟驅設備、光驅設備及硬件設備等。
◇-name name:設定虛擬機名稱;
◇-M machine:指定要模擬的主機類型,如Standard PC、ISA-only PC或Intel-Mac等,可以使用“qemu-kvm -M ?”獲取所支持的所有類型;
◇-m megs:設定虛擬機的RAM大小;
◇-cpu model:設定CPU模型,如coreduo、qemu64等,可以使用“qemu-kvm -cpu ?”獲取所支持的所有模型;
◇-smp n[,cores=cores][,threads=threads][,sockets=sockets][,maxcpus=maxcpus]:設定模擬的SMP架構中CPU的個數等、每個CPU的核心數及CPU的socket數目等;PC機上最多可以模擬255顆CPU;maxcpus用於指定熱插入的CPU個數上限;
◇-numa opts:指定模擬多節點的numa設備;
◇-fda file
◇-fdb file:使用指定文件(file)作爲軟盤鏡像,file爲/dev/fd0表示使用物理軟驅;
◇-hda file
◇-hdb file
◇-hdc file
◇-hdd file:使用指定file作爲硬盤鏡像;
◇-cdrom file:使用指定file作爲CD-ROM鏡像,需要注意的是-cdrom和-hdc不能同時使用;將file指定爲/dev/cdrom可以直接使用物理光驅;
◇-drive option[,option[,option[,...]]]:定義一個硬盤設備;可用子選項有很多。
file=/path/to/somefile:硬盤映像文件路徑;
if=interface:指定硬盤設備所連接的接口類型,即控制器類型,如ide、scsi、sd、mtd、floppy、pflash及virtio等;
index=index:設定同一種控制器類型中不同設備的索引號,即標識號;
media=media:定義介質類型爲硬盤(disk)還是光盤(cdrom);
snapshot=snapshot:指定當前硬盤設備是否支持快照功能:on或off;
cache=cache:定義如何使用物理機緩存來訪問塊數據,其可用值有none、writeback回寫、unsafe和writethrough通寫四個;
format=format:指定映像文件的格式,具體格式可參見qemu-img命令;
◇-boot [order=drives][,once=drives][,menu=on|off]:定義啓動設備的引導次序,每種設備使用一個字符表示;不同的架構所支持的設備及其表示字符不盡相同,在x86 PC架構上,a、b表示軟驅、c表示第一塊硬盤,d表示第一個光驅設備,n-p表示網絡適配器;默認爲硬盤設備;
-boot order=dc,once=d

qemu-kvm的顯示選項
顯示選項用於定義虛擬機啓動後的顯示接口相關類型及屬性等。
◇-nographic:默認情況下,qemu使用SDL來顯示VGA輸出;而此選項用於禁止圖形接口,此時,qemu類似一個簡單的命令行程序,其仿真串口設備將被重定向到控制檯;
◇-curses:禁止圖形接口,並使用curses/ncurses作爲交互接口;
◇-alt-grab:使用Ctrl+Alt+Shift組合鍵釋放鼠標;
◇-ctrl-grab:使用右Ctrl鍵釋放鼠標;
◇-sdl:啓用SDL;
◇-spice option[,option[,...]]:啓用spice遠程桌面協議;其有許多子選項,具體請參照qemu-kvm的手冊;
◇-vga type:指定要仿真的VGA接口類型,常見類型有:
cirrus:Cirrus Logic GD5446顯示卡;
std:帶有Bochs VBI擴展的標準VGA顯示卡;
vmware:VMWare SVGA-II兼容的顯示適配器;
qxl:QXL半虛擬化顯示卡;與VGA兼容;在Guest中安裝qxl驅動後能以很好的方式工作,在使用spice協議時推薦使用此類型;
none:禁用VGA卡;
◇-vnc display[,option[,option[,...]]]:默認情況下,qemu使用SDL顯示VGA輸出;使用-vnc選項,可以讓qemu監聽在VNC上,並將VGA輸出重定向至VNC會話;使用此選項時,必須使用-k選項指定鍵盤佈局類型;其有許多子選項,具體請參照qemu-kvm的手冊;

display:
(1)host:N
172.16.100.7:1, 監聽於172.16.100.7主的5900+N的端口上
(2) unix:/path/to/socket_file
(3) none

options:
password: 連接時需要驗正密碼;設定密碼通過monitor接口使用change
reverse: “反向”連接至某處於監聽狀態的vncview上;

-monitor stdio:表示在標準輸入輸出上顯示monitor界面
-nographic
Ctrl-a, c: 在console和monitor之間切換
Ctrl-a, h: 顯示幫助信息

網絡屬性相關選項
網絡屬性相關選項用於定義網絡設備接口類型及其相關的各屬性等信息。這裏只介紹nic、tap和user三種類型網絡接口的屬性,其它類型請參照qemu-kvm手冊。
◇-net nic[,vlan=n][,macaddr=mac][,model=type][,name=name][,addr=addr][,vectors=v]:創建一個新的網卡設備並連接至vlan n中;PC架構上默認的NIC爲e1000,macaddr用於爲其指定MAC地址,name用於指定一個在監控時顯示的網上設備名稱;emu可以模擬多個類型的網卡設備,如virtio、i82551、i82557b、i82559er、ne2k_isa、pcnet、rtl8139、e1000、smc91c111、lance及mcf_fec等;不過,不同平臺架構上,其支持的類型可能只包含前述列表的一部分,可以使用“qemu-kvm -net nic,model=?”來獲取當前平臺支持的類型;
注意:macaddr默認爲:52:54:00:12:34:56;需要特別指定。
◇-net tap[,vlan=n][,name=name][,fd=h][,ifname=name][,script=file][,downscript=dfile]:通過物理機的TAP網絡接口連接至vlan n中,使用script=file指定的腳本(默認爲/etc/qemu-ifup)來配置當前網絡接口,並使用downscript=file指定的腳本(默認爲/etc/qemu-ifdown)來撤消接口配置;使用script=no和downscript=no可分別用來禁止執行腳本;
◇-net user[,option][,option][,...]:在用戶模式配置網絡棧,其不依賴於管理權限;有效選項有:
vlan=n:連接至vlan n,默認n=0;
name=name:指定接口的顯示名稱,常用於監控模式中;
net=addr[/mask]:設定GuestOS可見的IP網絡,掩碼可選,默認爲10.0.2.0/8;
host=addr:指定GuestOS中看到的物理機的IP地址,默認爲指定網絡中的第二個,即x.x.x.2;
dhcpstart=addr:指定DHCP服務地址池中16個地址的起始IP,默認爲第16個至第31個,即x.x.x.16-x.x.x.31;
dns=addr:指定GuestOS可見的dns服務器地址;默認爲GuestOS網絡中的第三個地址,即x.x.x.3;
tftp=dir:激活內置的tftp服務器,並使用指定的dir作爲tftp服務器的默認根目錄;
bootfile=file:BOOTP文件名稱,用於實現網絡引導GuestOS;如:qemu -hda linux.img -boot n -net user,tftp=/tftpserver/pub,bootfile=/pxelinux.0

cat /etc/qemu-ifup

#!/bin/bash
#
bridge=br0

if [ -n "$1" ]; then
ip link set $1 up
sleep 1
brctl addif $bridge $1
[ $? -eq 0 ] && exit 0 || exit 1
else
echo "Error: no interface specified."
exit 1
fi

cat /etc/qemu-ifdown

#!/bin/bash
#
bridge=br0

if [ -n "$1" ];then
brctl delif $bridge $1
ip link set $1 down
exit 0
else
echo "Error: no interface specified."
exit 1
fi

qemu-img:qemu磁盤管理工具
qemu-img是qemu用來實現磁盤映像管理的工具組件,其有許多子命令,分別用於實現不同的管理功能,而每一個子命令也都有一系列不同的選項。其使用語法格式爲“qemu-img  subcommand  [options]”,支持的子命令如下。
◇create:創建一個新的磁盤映像文件;
◇check:檢查磁盤映像文件中的錯誤;
◇convert:轉換磁盤映像的格式;
◇info:顯示指定磁盤映像的信息;
◇snapshot:管理磁盤映像的快照;
◇commit:提交磁盤映像的所有改變;
◇rbase:基於某磁盤映像創建新的映像文件;
◇resize:增大或縮減磁盤映像文件的大小;

qemu-img command [command options]
常用command:
1、create [-q] [-f fmt] [-o options] filename [size]
2、convert [-c] [-p] [-q] [-n] [-f fmt] [-t cache] [-T src_cache] [-O output_fmt] [-o options] [-s snapshot_name] [-S sparse_size] filename [filename2 [...]] output_filename
3、snapshot [-q] [-l | -a snapshot | -c snapshot | -d snapshot] filename
4、resize [-q] filename [+ | -]size

qemu-kvm:常用選項:
標準選項:-m,-cpu;-name;-smp;
塊設備選項:-drive file=/path,if=,media;-boot order=dc,once=d   (其中d表示光驅,c表示硬盤,n表示網卡);
顯示選項:-vnc  host:number;-nographic;-monitor  stdio;-vga qxl;
網絡選項:-net nic,macaddr=mac,mode=virtio;-net tap,ifname=,script=/etc/qemu-ifup,downscript=/etc/qemu-ifdown;
-daemonize:讓qemu-kvm的虛擬機運行於後臺
-usbdevice  tablet:鼠標軌跡同步
-balloon virtio:讓VM中運行的GuestOS動態調整其內存大小;

案例:qemu-kvm創建xp虛擬機
1、創建磁盤文件winxp.qcow2

qemu-img create -o size=20G -f qcow2 winxp.qcow2

2、啓動xp虛擬機

qemu-kvm -name "xp" -m 512 -smp 4 -cpu host -drive file=xp_sp3.iso,media=cdrom -drive file=winxp.qcow2,media=disk,cache=writeback,format=qcow2 -boot order=dc,once=d

virtio半虛擬化:
HVM:虛擬化CPU
I/O半虛擬化分成兩段:
a、前端驅動(virtio前半段):virtio-blk, virtio-net, virtio-pci, virtio-balloon, virtio-console
                 Linux:CentOS 4.8+, 5.3+, 6.0+, 7.0+
                 Windows:
b、virtio: 虛擬隊列,virt-ring
c、transport:
d、後端處理程序(virt backend drivers):在QEMU中實現;

virtio-balloon:
ballooning: 讓VM中運行的GuestOS動態調整其內存大小;

qemu-kvm  -balloon virtio

手動查看GuestOS的內存用量:
info balloon
balloon N

virtio-net:
其依賴於GuestOS中的驅動,及Qemu中的後端驅動
GuestOS: virtio_net.ko
Qemu: qemu-kvm -net nic,model=?

qemu-kvm  -net nic,model=virtio

Host中的GSO, TSO
關掉可能會提升性能:
ethtool -K $IF gso off
ethtool -K $IF tso off
ethtool -k $IF

vhost-net:用於取代工作於用戶空間的qemu中爲virtio-net實現的後端驅動以實現性能提升的驅動;

-net tap[,vnet_hdr=on|off][,vhost=on|off]

qemu-kvm -net tap,vnet_hdr=on,vhost=on

virtio-blk:
其依賴於GuestOS中的驅動,及Qemu中的後端驅動

-drive file=/path/to/some_image_file,if=virtio

kvm_clock: 半虛擬化的時鐘

grep -i "paravirt" /boot/config-2.6.32-504.el6.x86_64

CONFIG_PARAVIRT_GUEST=y
CONFIG_PARAVIRT=y
CONFIG_PARAVIRT_CLOCK=y

VM Migration:虛擬機遷移:前提是需要共享存儲;
1、static migration
2、live migration
整體遷移時間
服務器停機時間
對服務的性能的影響

在待遷入主機使用

qemu-kvm    -vnc :N -incoming tcp:0:7777

vncviewer :590N

在源主機使用:
monitor接口:
migrate tcp:DEST_IP:DEST:PORT

隔離模型:
激活tap,並將其加入到指定的bridge;

路由模型:
激活tap,並將其加入到指定的bridge;
額外:給虛擬的bridge添加地址,打開核心轉發;

nat模型:
激活tap,並將其加入到指定的bridge;
額外:打開核心轉發,並添加nat規則;

橋接模型:
激活tap,並將其加入到指定的bridge;

libvirt工具棧:
支持的虛擬化技術:KVM,XEN,VMWARE,Qemu,LXC,OpenVZ;
被管理的各節點運行libvirtd;管控端運行libvirt工具;

命令行模式:virt-install:虛擬機創建和安裝的工具;virsh:虛擬機的命令行管理工具
圖形化模式:virt-manager:全生命週期的圖形化管理工具;

guestfish:檢查和修改虛擬機磁盤映像;

安裝:
centos6:# yum install libvirt libvirt-client python-virtinst virt-manager
centos7:# yum install libvirt libvirt-client virt-install virt-manager

libvirt和libvirtd的配置文件:
libvirt配置文件:/etc/libvirt/libvirt.conf
守護進程配置文件:/etc/libvirt/libvirtd.conf

virt-install是一個命令行工具,它能夠爲KVM、Xen或其它支持libvirt API的hypervisor創建虛擬機並完成GuestOS安裝;此外,它能夠基於串行控制檯、VNC或SDL支持文本或圖形安裝界面。安裝過程可以使用本地的安裝介質如CDROM,也可以通過網絡方式如NFS、HTTP或FTP服務實現。對於通過網絡安裝的方式,virt-install可以自動加載必要的文件以啓動安裝過程而無須額外提供引導工具。當然,virt-install也支持PXE方式的安裝過程,也能夠直接使用現有的磁盤映像直接啓動安裝過程。

virt-install命令有許多選項,這些選項大體可分爲下面幾大類,同時對每類中的常用選項也做出簡單說明。
◇一般選項:指定虛擬機的名稱、內存大小、VCPU個數及特性等;
-n NAME, --name=NAME:虛擬機名稱,需全局惟一;
-r MEMORY, --ram=MEMORY:虛擬機內在大小,單位爲MB;
--vcpus=VCPUS[,maxvcpus=MAX][,sockets=#][,cores=#][,threads=#]:VCPU個數及相關配置;
--cpu=CPU:CPU模式及特性,如coreduo等;可以使用qemu-kvm -cpu ?來獲取支持的CPU模式;
◇安裝方法:指定安裝方法、GuestOS類型等;
-c CDROM, --cdrom=CDROM:光盤安裝介質;
-l LOCATION, --location=LOCATION:安裝源URL,支持FTP、HTTP及NFS等,如http://172.16.0.1/cobbler/ks_mirror/CentOS-7-x86_64;
--pxe:基於PXE完成安裝;
--livecd: 把光盤當作LiveCD;
--os-type=DISTRO_TYPE:操作系統類型,如linux、unix或windows等;
--os-variant=DISTRO_VARIANT:某類型操作系統的變體,如rhel5、fedora8等;
-x EXTRA, --extra-args=EXTRA:根據--location指定的方式安裝GuestOS時,用於傳遞給內核的額外選項,例如指定kickstart文件的位置,--extra-args "ks=http://172.16.0.1/class.cfg"
--boot=BOOTOPTS:指定安裝過程完成後的配置選項,如指定引導設備次序、使用指定的而非安裝的kernel/initrd來引導系統啓動等 ;例如:
--boot  cdrom,hd,network:指定引導次序;
--boot kernel=KERNEL,initrd=INITRD,kernel_args=”console=/dev/ttyS0”:指定啓動系統的內核及initrd文件;
◇存儲配置:指定存儲類型、位置及屬性等;
--disk=DISKOPTS:指定存儲設備及其屬性;格式爲--disk /some/storage/path,opt1=val1,opt2=val2等;常用的選項有:
device:設備類型,如cdrom、disk或floppy等,默認爲disk;
bus:磁盤總線類型,其值可以爲ide、scsi、usb、virtio或xen;
perms:訪問權限,如rw、ro或sh(共享的可讀寫),默認爲rw;
size:新建磁盤映像的大小,單位爲GB;
cache:緩存模型,其值有none、writethrouth(緩存讀)及writeback(緩存讀寫);
format:磁盤映像格式,如raw、qcow2、vmdk等;
sparse:磁盤映像使用稀疏格式,即不立即分配指定大小的空間;
--nodisks:不使用本地磁盤,在LiveCD模式中常用;
◇網絡配置:指定網絡接口的網絡類型及接口屬性如MAC地址、驅動模式等;
-w NETWORK, --network=NETWORK,opt1=val1,opt2=val2:將虛擬機連入宿主機的網絡中,其中NETWORK可以爲:
bridge=BRIDGE:連接至名爲“BRIDEG”的橋設備;
network=NAME:連接至名爲“NAME”的網絡;
   其它常用的選項還有:
model:GuestOS中看到的網絡設備型號,如e1000、rtl8139或virtio等;
mac:固定的MAC地址;省略此選項時將使用隨機地址,但無論何種方式,對於KVM來說,其前三段必須爲52:54:00;
--nonetworks:虛擬機不使用網絡功能;
◇圖形配置:定義虛擬機顯示功能相關的配置,如VNC相關配置;
--graphics TYPE,opt1=val1,opt2=val2:指定圖形顯示相關的配置,此選項不會配置任何顯示硬件(如顯卡),而是僅指定虛擬機啓動後對其進行訪問的接口;
TYPE:指定顯示類型,可以爲vnc、sdl、spice或none等,默認爲vnc;
port:TYPE爲vnc或spice時其監聽的端口;
listen:TYPE爲vnc或spice時所監聽的IP地址,默認爲127.0.0.1,可以通過修改/etc/libvirt/qemu.conf定義新的默認值;
password:TYPE爲vnc或spice時,爲遠程訪問監聽的服務進指定認證密碼;
--noautoconsole:禁止自動連接至虛擬機的控制檯;
◇設備選項:指定文本控制檯、聲音設備、串行接口、並行接口、顯示接口等;
--serial=CHAROPTS:附加一個串行設備至當前虛擬機,根據設備類型的不同,可以使用不同的選項,格式爲“--serial type,opt1=val1,opt2=val2,...”,例如:
--serial pty:創建僞終端;
--serial dev,path=HOSTPATH:附加主機設備至此虛擬機;
--video=VIDEO:指定顯卡設備模型,可用取值爲cirrus、vga、qxl或vmvga;

◇虛擬化平臺:虛擬化模型(hvm或paravirt)、模擬的CPU平臺類型、模擬的主機類型、hypervisor類型(如kvm、xen或qemu等)以及當前虛擬機的UUID等;
-v, --hvm:當物理機同時支持完全虛擬化和半虛擬化時,指定使用完全虛擬化;
-p, --paravirt:指定使用半虛擬化;
--virt-type:使用的hypervisor,如kvm、qemu、xen等;所有可用值可以使用’virsh capabilities’命令獲取;
◇其它:
--autostart:指定虛擬機是否在物理啓動後自動啓動;
--print-xml:如果虛擬機不需要安裝過程(--import、--boot),則顯示生成的XML而不是創建此虛擬機;默認情況下,此選項仍會創建磁盤映像;
--force:禁止命令進入交互式模式,如果有需要回答yes或no選項,則自動回答爲yes;
--dry-run:執行創建虛擬機的整個過程,但不真正創建虛擬機、改變主機上的設備配置信息及將其創建的需求通知給libvirt;
-d, --debug:顯示debug信息;

--import:導入已存在系統的磁盤映像;

儘管virt-install命令有着類似上述的衆多選項,但實際使用中,其必須提供的選項僅包括--name、--ram、--disk(也可是--nodisks)及安裝過程相關的選項。此外,有時還需要使用括--connect=CONNCT選項來指定連接至一個非默認的hypervisor。

注意:每個虛擬機創建後,其配置信息保存在/etc/libvirt/qemu目錄中,文件名與虛擬機相同,格式爲XML。

示例:利用已經存在的磁盤映像文件(已經有安裝好的系統)創建一個名爲cirros的虛擬機
方法1:# virt-install --name=cirros --ram=1024 --vcpus=4 --cpu=host --disk=/images/cirros/cirros-no_cloud-0.3.0-x86_64-disk.img --import --graphics vnc
方法2(直接啓動終端):# virt-install --name=cirros --ram=1024 --vcpus=4 --cpu=host --disk=/images/cirros/cirros-no_cloud-0.3.0-x86_64-disk.img --import --nographics --serial=pty --console=pty
退出控制端:ctrl +  ];重新連接控制端:virsh   console

virsh的幾個常用命令:
virt-install:創建虛擬機,並安裝OS;也可創建虛擬機並導入Image文件;
根據xml文件創建:
create:創建並啓動
define:創建但不啓動
關閉domain:
destroy
shutdown
reboot
刪除domain:
undefine
連接至console:
console
列出:
list
附加或拆除disk:
attach-disk
detach-disk
附加或拆除網卡:
attach-interface
detach-interface
保存狀態至磁盤文件或從磁盤文件恢復:
save
restore
暫停於內存或繼續運行:
suspend
resume

virt-manager:GUI工具

kvm虛擬機管理平臺:
oVirt、ConVirt等較輕量化:;
OpenStack、CloudStack、OpenNebula、openQRM等雲計算平臺
http://www.linux-kvm.org/page/Management_Tools

網絡虛擬化技術

OpenVSwitch: 虛擬交換機

VLAN, VXLAN

虛擬路由器

什麼是VLAN?
Virtual LAN; LAN即爲廣播幀能夠到的節點範圍,也即能夠直接通信的範圍;

VLAN:
基於MAC地址
基於交換機Port實現
基於IP地址實現
基於用戶實現

交換機接口的類型:
訪問鏈接:access link
匯聚鏈接:trunk link

VLAN的匯聚方式:
IEEE 802.1q
ISL: Inter Switch Link(思科專有協議)

VLAN間路由:
路由器:
訪問鏈接:router爲每個VLAN提供一個接口
匯聚鏈接:router只向交換提供一個接口
三層交換機

虛擬化技術:
cpu, memory, i/o

IaaS(Infrastructure as a Service),即基礎設施即服務。
PaaS(Platform as a Service),即平臺即服務。
SaaS(Software as a Service),即軟件即服務

Linux內核:
namespace
文件系統隔離;
網絡隔離: 主要用於實現網絡資源的隔離,包括網絡設備、IPv4以及IPv6地址、IP路由表、防火牆、/proc/net、/sys/class/net以及套接字等;
IPC隔離;
用戶和用戶組隔離:
PID隔離:對名稱空間內的PID重新標號,兩個不同的名稱空間可以使用相同的PID;
UTS隔離:Unix Time-sharing System,提供主機名稱和域名的隔離;
cgroups
用於完成資源配置;用於實現限制被各namespace隔離起來的資源,還可以爲資源設置權重 、計算使用量、完成各種所需的管理任務等;

Linux Network NameSpace:注意其核心轉發功能直接依賴於宿主機的net.ipv4.ip_forward參數設置;
注意:netns在內核實現,其控制功能由iproute所提供的netns這個OBJECT來提供;CentOS6.6提供的iproute不具有此OBJECT,需要依賴於OpenStack Icehouse的EPEL源來提供;

網絡虛擬化中:
交換機功能模擬:1、brctl創建bridge;2、openvswitch創建bridge;
路由器功能模擬:通過linux network namespace模擬隔離的空間,開啓路由或者snat、dhcp等實現;

成對虛擬網卡的創建:ip link add FRONTEND-NAME type veth peer name BACKEND-NAME
將網卡分配給namespace:ip link set  DEVICE  netns  NAME
將網卡分配給bridge:brctl addif  BRIDGE   DEVICE
在namespace開啓dhcp和網關:1、yum install dnsmasq;2、ip netns  exec r1  dnsmasq   -F   192.168.71.100,192.168.71.200   --dhcp-option=option:router,192.168.71.1

netns基本命令:
ip netns list
ip netns add NAME
ip netns del NAME
ip netns exec NAME COMMAND:在隔離的namespace執行命令

複雜的虛擬化網絡:
netns
OpenVSwitch

OVS:基於C語言研發;特性:
802.1q, trunk, access
NIC bonding
NetFlow, sFlow
QoS配置及策略
GRE, VxLAN,
OpenFlow

OVS的組成部分:
ovs-vswitchd:OVS daemon, 實現數據報文交換功能,和Linux內核兼容模塊一同實現了基於流的交換技術;
ovsdb-server:輕量級的數據庫服務,主要保存了整個OVS的配置信息,例如接口、交換和VLAN等等;ovs-vswithed的交換功能基於此庫實現;
ovs-dpctl:
ovs-vsctl:用於獲取或更改ovs-vswitchd的配置信息,其修改操作會保存至ovsdb-server中;
ovs-appctl
ovsdbmonitor:gui工具,顯示OVS的數據庫信息;
ovs-controller
ovs-ofctl
ovs-pki

ovs-vsctl命令的使用:
            show: ovsdb配置內容查看
            add-br NAME:添加橋設備;
            list-br: 顯示所有已定義BRIDGE
           del-br BRIDGE: 刪除橋
           add-port BRIDGE PORT: 將PORT添加至指定的BRIDGE
           list-ports BRIDGE: 顯示指定BRIDGE上已經添加的所有PORT
           del-port [BRIDGE] PORT: 從指定BRIDGE移除指定的PORT
           set  port  vif0.0  tag=10:設置vif0.0的vlan爲10
           remove  port vif0.0  tag 10:移除vif0.0的vlan設置

/etc/if-up腳本:
#!/bin/bash
#
bridge=br-in

if [ -n "$1" ]; then
   ip link set $1 up
   sleep 1
   ovs-vsctl add-port $bridge $1
   [ $? -eq 0 ] && exit 0 || exit 1
else
   echo "Error: no port specified."
   exit 2
fi

/etc/if-down腳本:
#!/bin/bash
#
bridge=br-in

if [ -n "$1" ]; then
   ip link set $1 down
   sleep 1
   ovs-vsctl del-port $bridge $1
   [ $? -eq 0 ] && exit 0 || exit 1
else
   echo "Error: no port specified."
   exit 2
fi

一、同一個物理宿主機上的虛擬機通信:
a、在同一個ovs構建的虛擬交換機中,通過設置tap來劃分vlan

ovs-vsctl  set   port   vif0.0 tag=10

b、在不同的ovs構建的虛擬交換機中,需要生成一對網卡,各接入虛擬交換中,並設置端口的trunks、vlan_mode的值;

二、不在同一個物理宿主機上的虛擬機通信:
GRE: Generic Routing Encapsulation,通用路由封裝;是一種隧道技術;
a、宿主機物理接口橋接到虛擬交換機上,並在虛擬交換機上配置ip地址;
b、通過GRE隧道技術來實現;需額外添加一個gre0到虛擬交換機上;

ovs-vsctl add-port  br-in   gre0

ovs-vsctl set interface  gre0  type=gre  options:remote_ip=192.168.20.2     #此IP爲宿主機間的物理網卡間通信的ip

c、通過配置vxlan;需額外添加一個vx0到虛擬交換機上;

ovs-vsctl add-port  br-in   vx0

ovs-vsctl set interface  vx0  type=vxlan  options:remote_ip=192.168.20.2     #此IP爲宿主機間的物理網卡間通信的ip

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章