android 常見死機問題-如何分析

android 常見死機問題--log分析

===================================================================================================
一般在平時工作中,基本上很多代碼可以在eclipse+ndk進行調試,但如果需要用到具體的硬件設備,如媒體播放設備無法模擬的情況下,只能上硬件(盒子或手機)上進行調試。此時唯一的調試手段就是logcat產生log信息進行分析問題了。


什麼時候會有Log文件的產生 ?一般在如下幾種情況會產生log文件 。 
1、程序異常退出 uncaused exception
2、程序強制關閉 Force Closed (簡稱FC)
3、程序無響應   Application No Response(簡稱ANR),一般主線程超過5秒麼有處理就會ANR
4、手動生成

進入控制檯輸入:logcat命令即可進行輸出

第一部分

1、分析工具介紹

a、cat /proc/meminfo 顯示基本的內存信息

------ MEMORY INFO (/proc/meminfo) ------


MemTotal:         285184 kB
MemFree:          106360 kB
Buffers:               0 kB
Cached:            60036 kB
SwapCached:            0 kB
Active:            98160 kB
Inactive:          49100 kB
Active(anon):      87260 kB
Inactive(anon):      288 kB
Active(file):      10900 kB
Inactive(file):    48812 kB
Unevictable:           0 kB
Mlocked:               0 kB
SwapTotal:             0 kB
SwapFree:              0 kB
Dirty:                 0 kB
Writeback:             0 kB
AnonPages:         87240 kB
Mapped:            26500 kB
Shmem:               324 kB
Slab:              13340 kB
SReclaimable:       1672 kB
SUnreclaim:        11668 kB
KernelStack:        2160 kB
PageTables:         5600 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:      142592 kB
Committed_AS:    1065600 kB
VmallocTotal:     417792 kB
VmallocUsed:      137700 kB
VmallocChunk:     254980 kB


重點關注這下面幾個值:
MemTotal:         285184 kB   //總計物理內存的大小
MemFree:          106360 kB   //可用內存有多少
Buffers:               0 kB //磁盤緩存內存的大小
Cached:            60036 kB   


# free
free
              total         used         free       shared      buffers
  Mem:       285184       178884       106300            0            0
 Swap:            0            0            0
Total:       285184       178884       106300


在linux中有這麼一種思想,內存不用白不用,因此它儘可能的cache和buffer一些數據,以方便下次使用。
但實際上這些內存也是可以立刻拿來使用的。
所以空閒內存=free+buffers+cached=total-used


還有幾個命令可使用:
/proc/meminfo 機器的內存使用信息
/proc/pid/maps pid爲進程號,顯示當前進程所佔用的虛擬地址。
/proc/pid/statm 進程所佔用的內存


b、查看進程信息
------ CPU INFO (top -n 1 -d 1 -m 30 -t) ------
能夠實時顯示系統中各個進程的資源佔用狀況,類似於 Windows 的任務管理器


c、android提供的一些操作工具
------ PROCRANK (procrank) ------
------ PROCMEM (procmem) ------
------ SHOWMAP (showmap) ------
... 就不一一列舉了,有興趣的朋友可以去看看


這此工具的代碼位於android的 /system/extras


d、虛擬內存的查看工具
------ VIRTUAL MEMORY STATS (/proc/vmstat) ------
------ VMALLOC INFO (/proc/vmallocinfo) ------


2、時間信息,也是我們主要分析的信息


格式如下:
------ SYSTEM LOG (logcat -b system -v time -d *:v) ------
$:logcat -b system -v time -d *:v


01-02 08:00:02.570 I/SystemServer(  957): Notification Manager
01-02 08:00:02.570 I/SystemServer(  957): Device Storage Monitor
01-02 08:00:02.580 I/SystemServer(  957): Location Manager
01-02 08:00:02.580 I/SystemServer(  957): Search Service
01-02 08:00:02.590 I/SystemServer(  957): DropBox Service
01-02 08:00:02.590 I/SystemServer(  957): Wallpaper Service


3、虛擬機信息,包括進程的,線程的跟蹤信息,這是用來跟蹤進程和線程具體點的好地方 。 
------ VM TRACES JUST NOW (/data/anr/traces.txt.bugreport: 2011-01-15 16:49:02) ------
------ VM TRACES AT LAST ANR (/data/anr/traces.txt: 2011-01-15 16:49:02) ------


格式如下 :
----- pid 1516 at 1970-01-02 08:03:07 -----
Cmd line: com.ipanel.join.appstore


DALVIK THREADS:
(mutexes: tll=0 tsl=0 tscl=0 ghl=0 hwl=0 hwll=0)
"main" prio=5 tid=1 NATIVE
  | group="main" sCount=1 dsCount=0 obj=0x4001f188 self=0xd028
  | sysTid=1516 nice=0 sched=3/0 cgrp=[fopen-error:2] handle=-1345017744
  


第二部分


如何分析log信息

1、查找錯誤信息的關鍵字眼
"error"  "failxx" "E/" 等的錯誤信息
將這些問題先行解決掉


2、動態庫死機

查看類似的“Build fingerprint:”這些關鍵字
I/DEBUG   (  692): *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** ***
I/DEBUG   (  692): Build fingerprint: 'generic/generic/generic:2.3.1/GRH78/eng.userdev-rd6-input.20120221.113348:eng/test-keys'
I/DEBUG   (  692): pid: 694, tid: 694  >>> /system/bin/mediaserver <<<
I/DEBUG   (  692): signal 11 (SIGSEGV), code 1 (SEGV_MAPERR), fault addr 00000input module init -->
010


對於這此信息,可以查看動態庫的分析:
http://blog.csdn.net/andyhuabing/article/details/7074979


3、解決java拋異常的問題解決
E/UsbObserver(  957): java.lang.NullPointerException
E/UsbObserver(  957):   at com.android.server.UsbObserver.init(UsbObserver.java:131)
E/UsbObserver(  957):   at com.android.server.UsbObserver.<init>(UsbObserver.java:65)
E/UsbObserver(  957):   at com.android.server.ServerThread.run(SystemServer.java:419)
I/SystemServer(  957): UI Mode Manager Service


這個直接找到java代碼,分析其實現即可解決


4、ANR問題
搜索“ANR”關鍵詞,快速定位到關鍵事件信息 。


定位到關鍵的事件信息如下:
I/dalvikvm( 1014): Wrote stack traces to '/data/anr/traces.txt'
I/Process (  957): Sending signal. PID: 1124 SIG: 9
E/ActivityManager(  957): ANR in com.ipanel.join.appstore
E/ActivityManager(  957): Reason: Broadcast of Intent { act=android.appwidget.action.APPWIDGET_UPDATE cmp=com.ipanel.join.appstore/.widget.SmallWidget1 (has extras) }
E/ActivityManager(  957): Load: 1.57 / 0.38 / 0.13
E/ActivityManager(  957): CPU usage from 6290ms to 0ms ago:
E/ActivityManager(  957):   70% 957/system_server: 1.1% user + 69% kernel / faults: 204 minor
E/ActivityManager(  957):   8.7% 1014/com.ipanel.join.home.jelly: 7.7% user + 0.9% kernel / faults: 899 minor
E/ActivityManager(  957):   0.3% 687/yaffs-bg-1: 0% user + 0.3% kernel
E/ActivityManager(  957):   0.3% 688/yaffs-bg-1: 0% user + 0.3% kernel
E/ActivityManager(  957):   0.3% 935/irkeyservice: 0% user + 0.3% kernel
E/ActivityManager(  957):   0% 890/galcore daemon : 0% user + 0% kernel
E/ActivityManager(  957):   0.1% 1076/com.ipanel.join.browser: 0.1% user + 0% kernel
E/ActivityManager(  957):   0.1% 1124/com.ipanel.join.appstore: 0.1% user + 0% kernel
E/ActivityManager(  957): 75% TOTAL: 4.7% user + 70% kernel
E/ActivityManager(  957): CPU usage from 622ms to 1169ms later:
E/ActivityManager(  957):   71% 957/system_server: 0% user + 71% kernel / faults: 2 minor
E/ActivityManager(  957):     67% 965/SurfaceFlinger: 0% user + 67% kernel
E/ActivityManager(  957):     1.9% 973/ActivityManager: 1.9% user + 0% kernel
E/ActivityManager(  957):     1.9% 991/CursorMove: 0% user + 1.9% kernel
E/ActivityManager(  957):   7.6% 1014/com.ipanel.join.home.jelly: 7.6% user + 0% kernel / faults: 31 minor
E/ActivityManager(  957):     5.7% 1119/Thread-13: 5.7% user + 0% kernel
E/ActivityManager(  957):     1.9% 1123/Thread-13: 1.9% user + 0% kernel
E/ActivityManager(  957): 76% TOTAL: 1.8% user + 72% kernel + 1.8% softirq


指定哪個java包出問題
E/ActivityManager(  957): ANR in com.ipanel.join.appstore


進程號爲957發生瞭如下錯誤:com.ipanel.join.appstore 包下面 Broadcast問題


ANR原因:
E/ActivityManager(  957): Reason: Broadcast of Intent { act=android.appwidget.action.APPWIDGET_UPDATE cmp=com.ipanel.join.appstore/.widget.SmallWidget1 (has extras) }


這是ANR的堆棧調用文件
I/dalvikvm( 1014): Wrote stack traces to '/data/anr/traces.txt'


通過上面的log信息分析,應該是接收一個廣播消息時超時了


我們再分析虛擬機信息 ,打開/data/anr/traces.txt,可有通過adb pull /data/anr/traces.txt .


這裏每一段都是一個線程 ,當然我們還是看線程號爲1的主線程了。通過分析發現關鍵問題是這樣:


搜索“DALVIK THREADS”關鍵詞,快速定位到本應用程序的虛擬機信息日誌
 
----- pid 1516 at 1970-01-02 08:03:07 -----
Cmd line: com.ipanel.join.appstore


DALVIK THREADS:
(mutexes: tll=0 tsl=0 tscl=0 ghl=0 hwl=0 hwll=0)
"main" prio=5 tid=1 NATIVE
  | group="main" sCount=1 dsCount=0 obj=0x4001f188 self=0xd028
  | sysTid=1516 nice=0 sched=3/0 cgrp=[fopen-error:2] handle=-1345017744
  at org.apache.harmony.luni.platform.OSNetworkSystem.connect(Native Method)
  at dalvik.system.BlockGuard$WrappedNetworkSystem.connect(BlockGuard.java:357)
  at org.apache.harmony.luni.net.PlainSocketImpl.connect(PlainSocketImpl.java:204)
  at org.apache.harmony.luni.net.PlainSocketImpl.connect(PlainSocketImpl.java:437)
  at java.net.Socket.connect(Socket.java:983)
  at org.apache.harmony.luni.internal.net.www.protocol.http.HttpConnection.<init>(HttpConnection.java:74)
  at org.apache.harmony.luni.internal.net.www.protocol.http.HttpConnection.<init>(HttpConnection.java:48)
  at org.apache.harmony.luni.internal.net.www.protocol.http.HttpConnection$Address.connect(HttpConnection.java:298)
  at org.apache.harmony.luni.internal.net.www.protocol.http.HttpConnectionPool.get(HttpConnectionPool.java:89)
  at org.apache.harmony.luni.internal.net.www.protocol.http.HttpURLConnectionImpl.getHttpConnection(HttpURLConnectionImpl.java:285)
  at org.apache.harmony.luni.internal.net.www.protocol.http.HttpURLConnectionImpl.makeConnection(HttpURLConnectionImpl.java:267)
  at org.apache.harmony.luni.internal.net.www.protocol.http.HttpURLConnectionImpl.retrieveResponse(HttpURLConnectionImpl.java:1018)
  at org.apache.harmony.luni.internal.net.www.protocol.http.HttpURLConnectionImpl.getResponseCode(HttpURLConnectionImpl.java:726)
  at com.ipanel.join.appstore.http.DefaultHttpRequest.doGet(DefaultHttpRequest.java:35)
  at com.ipanel.join.appstore.widget.AbsSmallWidget.requestApps(AbsSmallWidget.java:117)
  at com.ipanel.join.appstore.widget.AbsSmallWidget.getRemoteViews(AbsSmallWidget.java:56)
  
其實從這句話:
at org.apache.harmony.luni.platform.OSNetworkSystem.connect(Native Method)
基本上確認是 socket ->connect 連接超時了,導致主線程5s內沒有響應從而產生ANR錯誤。默認的connect連接timeout時間是75s
其實解決辦法就是利用非阻塞方式進行連接即可。


從CPU佔用率上也可以看出是在kernel中執行堵塞住了
E/ActivityManager(  957): 75% TOTAL: 4.7% user + 70% kernel




5、執行DexOpt錯誤


W/dalvikvm( 1803): DexOpt: --- END 'SettingsProvider.apk' --- status=0x000a, process failed
E/dalvikvm( 1803): Unable to extract+optimize DEX from '/system/app/SettingsProvider.apk'
E/SystemServer( 1803): Failure starting Input Manager Service
E/SystemServer( 1803): java.lang.RuntimeException: Unable to get provider com.android.providers.settings.SettingsProvider: java.lang.ClassNotFoundException: com.android.providers.settings.SettingsProvider in loader dalvik.system.PathClassLoader[/system/app/SettingsProvider.apk]
E/SystemServer( 1803):  at android.app.ActivityThread.installProvider(ActivityThread.java:3557)
E/SystemServer( 1803):  at android.app.ActivityThread.getProvider(ActivityThread.java:3356)


從上面的打印看,是在解壓或優化extract+optimize DEX的apk文件時出錯了
1、沒有出現magic number錯誤,這個原因與原子操作無關(這是一快速的加鎖和解鎖的輕量級操作函數)
2、執行dexopt出錯
查明是服務器硬盤沒空間了,導致引導文件系統的時候沒有空間進行解壓而失敗


6、系統啓動後默認其妙或隨機死機情況
出現這種錯誤:
12-01 08:11:56.027: WARN/SharedBufferStack(312): waitForCondition(LockCondition) timed out (identity=19, status=0). CPU may be pegged. trying again.
12-01 08:11:57.315: WARN/SharedBufferStack(312): waitForCondition(LockCondition) timed out (identity=19, status=0). CPU may be pegged. trying again.
12-01 08:11:59.318: WARN/SharedBufferStack(312): waitForCondition(LockCondition) timed out (identity=19, status=0). CPU may be pegged. trying again.
12-01 08:12:03.332: WARN/SharedBufferStack(312): waitForCondition(LockCondition) timed out (identity=19, status=0). CPU may be pegged. trying again.
12-01 08:12:05.329: WARN/SharedBufferStack(312): waitForCondition(LockCondition) timed out (identity=19, status=0). CPU may be pegged. trying again.
12-01 08:12:07.216: WARN/KeyCharacterMap(312): No keyboard for id 0
12-01 08:12:07.216: WARN/KeyCharacterMap(312): Using default keymap: /system/usr/keychars/qwerty.kcm.bin


查看內存: cat /proc/meminfo 發現空閒內存只剩下幾M空間了。請加大android系統的內存即可解決問題

還有一種情況是實現gralloc模塊時有死鎖的情況,請查明即可。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章