origin:http://blog.csdn.net/sagata/article/details/9979543
1 計算節點起不來的一般問題
兩個網卡ping的通嗎 配置文件設置正確嗎 看日誌 看一下nova-manage service list
2 Permission denied: '/var/lib/nova/instances/_base/eae678cf9d2afbfe78a6b0e11ee1d1b1229ba6f1.part' 想把一個分區掛載到/var/lib/nova/instances/_base下。先創建_base,然後掛載,然後創建實例,但是創建不了,其實是_base的權限問題。chown nova _base這條命令解決。
3 用fdisk 新建的分區,想要掛載在文件夾下,各種有問題,比較對的步驟應該是new完之後reboot一下,然後mkfs -t ext4 /dev/sda4 這樣格式化,然後再mount。
4 Unable to complete operation on network fee014ad-1700-4de4-8e7d-2e38ea415877. There are one or more ports still in use on the network. 只要quantum floatingip-list 一個個刪了就行。
5 nova-compute 起不來,查看日誌發現ERROR nova.compute.manager [req-2b1a2df4-bd90-4e24-9b02-bb194879b254 None None] Instance e9710b21-ba10-4ba7-8208-2236f42b1efb found in the hypervisor, but not in the database 這個時候要用kvm命令來刪除這些實例 具體可以參考這個帖子http://blog.csdn.net/sahusoft/article/details/4512992 使用的命令是virsh list --all 和 virsh destroy 如果destroy不行的話 就用undefine
6 虛擬路由的interface處於down的狀態
7 Setting instance to ERROR state. 配置文件問題 在multihost的時候遇到這個問題 我在nova.conf裏面加了這句 scheduler_default_filters=AllHostsFilter
8 Instance failed to spawn
9 ERROR nova.openstack.common.rpc.common [req-f5c4217e-673d-46d3-9511-dbc1462b4bc8 None None] AMQP server on localhost:5672 is unreachable: Socket closed. Trying again in 1 seconds. 同時 nova-manage service list 全部是XXX
10 一大早過來nova-compute怎麼都起不來啊 就算是換了全新的nova.conf也不行啊 尼瑪原來是配置文件的權限問題 我直接弄個配置文件把他給替換了
11 很多時候 服務重啓下就好了
12 vm能ping通虛擬路由的wan口 但是ping不通外網 發現interfaces文件裏面的br-ex 的網關居然是錯的 擦~
13 [Errno 111] Connection refused 這事是keystone的問題 響應模塊的授權地址有問題
13 如果nova-compute本來是可以啓動的 但是重啓機子之後老是啓動不了 沒事 多試幾次 過一會就能啓動了
14 實現了multihost的方案,之前已經不能解決的網絡問題放在另外一個網絡環境裏面一下子就解決了 應該考慮到的可能是之前這邊的網絡環境太差了,也有可能是openvswitch的問題,存在兩個br-int和br-ex衝突了?? 有可能 openvswitch的東西真的還不是很懂的趕腳~
15 強制刪掉ext網絡的一個port之類的刪不掉 是因爲要先把floating ip 刪掉
16 昨兒個出現了qrouter ns刪不掉的問題 如果配置文件沒錯 那麼重啓下節點就好 如果配置文件有問題 應該是在root_helper這個參數上出問題
17 像nova-compute這種東西 啓動不了 就重啓多幾次 就行了~
18 Instance 8ad63da4-5967-4ccb-9cd9-e3e94817cfd4 found in the hypervisor, but not in the database 類似的 用virsh list看看結算節點上有沒有沒刪掉的vm 有的話 destroy掉 沒有的話 在dashboard上刪掉這個幾點上的vm 再重啓nova-compute
19 如果像9.9.0.OOXX 連9.9.0.1都ping不通 考慮可能是br-int的問題 輸入命令ifconfig br-int up 進行修復
20 add bridge failed: No such process 報了這個錯 ovs重裝就好了 重裝需要remove --purge 還有autoremove 還有需要重裝ovs-agent 還可能需要rmmod brconpat
或者直接rmmod brconpat 還有把/etc/module 裏面的brconpat 去掉
21 安全組策略在一臺計算節點上能用 在另外一臺計算節點上不能用的原因是 openvswitch裏面的一個模塊 叫做openvswitch-brcompat的 是要將它rmmod brcompat就可以了 這塊東西主要是會跟linux自帶的防火牆衝突
22 ERROR: The resource could not be found. 在建vm的時候如果這樣的話 ,肯定是各種選錯了,如果都不是那麼就是環境變量的租戶有問題。
23 在同個交換機裏面轉移控制節點,發現vnc起不來,檢查nova.conf沒有問題,後來發現是原來的控制節點只改了ip沒改網段,結果組件的消息全部發到新的控制節點上來了,解決辦法是把原來的控制節點的的ip改網段,同時重啓控制節點的rabbitmq服務器,然後重啓兩個計算節點的nova-compute服務。
24 如果網址網關都設置沒錯但是還是路由不出去的話 試試這一句 route add default gw 172.18.215.254 dev eth0
25 Unable to retrieve quota information 這一類的錯誤 無外乎是nova api配置文件錯誤 keystone數據錯誤 quantum 或者nova的數據庫有問題 也可能quantum需要重啓
26Failed to create OVS patch port. Cannot have tunneling enabled on this agent, since this version of OVS does not support tunnels or patch ports. Agent terminated!
27 AgentNotFoundByTypeHost 各種喪心病狂的錯誤 反正包括上面那個錯誤的話 都是ovs的問題 求其原因是我有一個計算節點裝了12.04.3 的 內核3.8.0-29-generic 擡高了
28 如果出現Getting disk size of instance-OOXX : [Errno 2] 那麼看看virsh list --all 然後virsh destroy 然後 virsh undefine 這些 如果還有一些沒刪除 那麼用這個命令 還有virsh undefine $domain --managed-save
29 vnc的問題 查看日誌是在 /var/log/upstart 裏面找 叫做 nova-novnc...
30 ERROR: Invalid OpenStack Nova credentials. 肯定是novarc文件的問題 好好檢查
31 ERROR: Unauthorized (HTTP 401) keystone 創建腳本問題
32 發現在一個節點上的vm有分配ip 另外一個節點上的沒有 各種沒報錯 結論就是 數據網段不同 GRE通道沒有建立
33 can't add qvb4cd94d7b-2d to bridge qbr4cd94d7b-2d 導致nova-compute 要不你找出那個vm刪了 不然就全部vm刪了 重啓novacompute
34 ERROR: The server has either erred or is incapable of performing the requested operation. 不知道爲什麼 /var/lib/nova/instances爆滿 刪掉一個之後重啓就好了
35 關於nova的instance裏面出什麼問題 幾個思路 1 virsh list 2 /var/lib/nova/instances/裏面的東西 3 清空nova數據庫 重建一下