openstack各种问题的debug

origin:http://blog.csdn.net/sagata/article/details/9979543


1 计算节点起不来的一般问题

两个网卡ping的通吗  配置文件设置正确吗  看日志 看一下nova-manage service list

2  Permission denied: '/var/lib/nova/instances/_base/eae678cf9d2afbfe78a6b0e11ee1d1b1229ba6f1.part' 想把一个分区挂载到/var/lib/nova/instances/_base下。先创建_base,然后挂载,然后创建实例,但是创建不了,其实是_base的权限问题。chown nova _base这条命令解决。

3  用fdisk 新建的分区,想要挂载在文件夹下,各种有问题,比较对的步骤应该是new完之后reboot一下,然后mkfs -t ext4 /dev/sda4 这样格式化,然后再mount。

4 Unable to complete operation on network fee014ad-1700-4de4-8e7d-2e38ea415877. There are one or more ports still in use on the network. 只要quantum floatingip-list 一个个删了就行。

5 nova-compute 起不来,查看日志发现ERROR nova.compute.manager [req-2b1a2df4-bd90-4e24-9b02-bb194879b254 None None] Instance e9710b21-ba10-4ba7-8208-2236f42b1efb found in the hypervisor, but not in the database  这个时候要用kvm命令来删除这些实例  具体可以参考这个帖子http://blog.csdn.net/sahusoft/article/details/4512992  使用的命令是virsh list --all  和 virsh destroy 如果destroy不行的话 就用undefine

6 虚拟路由的interface处于down的状态

7 Setting instance to ERROR state.  配置文件问题  在multihost的时候遇到这个问题 我在nova.conf里面加了这句 scheduler_default_filters=AllHostsFilter

8 Instance failed to spawn

9   ERROR nova.openstack.common.rpc.common [req-f5c4217e-673d-46d3-9511-dbc1462b4bc8 None None] AMQP server on localhost:5672 is unreachable: Socket closed. Trying again in 1 seconds.  同时 nova-manage service list 全部是XXX

10  一大早过来nova-compute怎么都起不来啊 就算是换了全新的nova.conf也不行啊     尼玛原来是配置文件的权限问题  我直接弄个配置文件把他给替换了

11  很多时候 服务重启下就好了

12 vm能ping通虚拟路由的wan口 但是ping不通外网  发现interfaces文件里面的br-ex 的网关居然是错的 擦~

13  [Errno 111] Connection refused 这事是keystone的问题 响应模块的授权地址有问题

 

 

13  如果nova-compute本来是可以启动的 但是重启机子之后老是启动不了 没事  多试几次 过一会就能启动了

14 实现了multihost的方案,之前已经不能解决的网络问题放在另外一个网络环境里面一下子就解决了 应该考虑到的可能是之前这边的网络环境太差了,也有可能是openvswitch的问题,存在两个br-int和br-ex冲突了??  有可能 openvswitch的东西真的还不是很懂的赶脚~

 15 强制删掉ext网络的一个port之类的删不掉 是因为要先把floating ip 删掉

16 昨儿个出现了qrouter ns删不掉的问题 如果配置文件没错 那么重启下节点就好  如果配置文件有问题 应该是在root_helper这个参数上出问题

17 像nova-compute这种东西 启动不了 就重启多几次 就行了~

18 Instance 8ad63da4-5967-4ccb-9cd9-e3e94817cfd4 found in the hypervisor, but not in the database  类似的 用virsh list看看结算节点上有没有没删掉的vm 有的话 destroy掉  没有的话 在dashboard上删掉这个几点上的vm 再重启nova-compute

19 如果像9.9.0.OOXX 连9.9.0.1都ping不通  考虑可能是br-int的问题 输入命令ifconfig br-int up 进行修复

20 add bridge failed: No such process 报了这个错 ovs重装就好了 重装需要remove --purge 还有autoremove 还有需要重装ovs-agent 还可能需要rmmod brconpat

或者直接rmmod brconpat  还有把/etc/module 里面的brconpat  去掉

 21 安全组策略在一台计算节点上能用 在另外一台计算节点上不能用的原因是 openvswitch里面的一个模块 叫做openvswitch-brcompat的 是要将它rmmod brcompat就可以了   这块东西主要是会跟linux自带的防火墙冲突 

22 ERROR: The resource could not be found. 在建vm的时候如果这样的话 ,肯定是各种选错了,如果都不是那么就是环境变量的租户有问题。

23 在同个交换机里面转移控制节点,发现vnc起不来,检查nova.conf没有问题,后来发现是原来的控制节点只改了ip没改网段,结果组件的消息全部发到新的控制节点上来了,解决办法是把原来的控制节点的的ip改网段,同时重启控制节点的rabbitmq服务器,然后重启两个计算节点的nova-compute服务。

24 如果网址网关都设置没错但是还是路由不出去的话 试试这一句 route add default gw 172.18.215.254 dev eth0

25 Unable to retrieve quota information 这一类的错误  无外乎是nova api配置文件错误 keystone数据错误  quantum 或者nova的数据库有问题 也可能quantum需要重启

26Failed to create OVS patch port. Cannot have tunneling enabled on this agent, since this version of OVS does not support tunnels or patch ports. Agent terminated!

27 AgentNotFoundByTypeHost 各种丧心病狂的错误  反正包括上面那个错误的话 都是ovs的问题 求其原因是我有一个计算节点装了12.04.3 的 内核3.8.0-29-generic 擡高了

28 如果出现Getting disk size of instance-OOXX : [Errno 2]  那么看看virsh list --all 然后virsh destroy  然后 virsh undefine 这些  如果还有一些没删除 那么用这个命令 还有virsh undefine $domain  --managed-save

29 vnc的问题 查看日志是在 /var/log/upstart 里面找  叫做 nova-novnc...

30 ERROR: Invalid OpenStack Nova credentials.   肯定是novarc文件的问题 好好检查

31 ERROR: Unauthorized (HTTP 401)    keystone 创建脚本问题

32 发现在一个节点上的vm有分配ip  另外一个节点上的没有 各种没报错 结论就是 数据网段不同  GRE通道没有建立

33 can't add qvb4cd94d7b-2d to bridge qbr4cd94d7b-2d  导致nova-compute  要不你找出那个vm删了 不然就全部vm删了 重启novacompute

34  ERROR: The server has either erred or is incapable of performing the requested operation.   不知道为什么 /var/lib/nova/instances爆满  删掉一个之后重启就好了

35 关于nova的instance里面出什么问题 几个思路  1 virsh list 2 /var/lib/nova/instances/里面的东西 3 清空nova数据库 重建一下


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章