内核级的程序,总有死机的时候,如果运气好,会看到一些所谓“Oops”信息(在屏幕上或系统日志中)比如:Unable to handle kernel paging request at virtual address f899b670printing eip:c01de48c*pde = 00737067Oops: 0002 [#1]Modules linked in: bluesmoke_e752x bluesmoke_mc md5 ipv6 parport_pclp parport nls_cp936 vfat fat dm_mod button battery asus_acpi ac joydevCPU: 0EIP: 0060:[] Not tainted VLIEFLAGS: 00210286 (2.6.9-11.21AXKProbes)EIP is at kobject_add+0x83/0xd7。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 Oops 可以看成是内核级的Segmentation Fault。应用程序如果进行了非法内存访问或执行了非法指令,会得到Segfault信号,一般的行为是coredump,应用程序也可以自己截获Segfault信号,自行处理。如果内核自己犯了这样的错误,则会打出Oops信息。 Oops异常分析:编写内核模块,产生内核异常,根据OOPS分析异常原因异常代码:#include <linux/module.h>#include <linux/kernel.h>#include <linux/init.h> void D(void){ int *p = NULL; int a = 6; printk("Function D
"); *p = a+5;} void C(void){ printk("Function C
"); D();} void B(void){ printk("Function B
"); C();} void A(void){ printk("Function A
"); B();} int oops_init(void){ printk("oops init
"); A(); return 0;} void oops_exit(void){ printk("oops exit!
");} module_init(oops_init);module_exit(oops_exit);MODULE_LICENSE("GPL");MODULE_AUTHOR("David Xie"); 1、编译加载模块2、加载模块时出现了oops错误信息3、分析错误原因:“Unable to handle kernel NULL pointer dereference at vitual address 00000000” 说明了出错原因是对空指针的非法访问4、找到出错位置:”PC is at D+0x1c/0x28[oops]”说明出错的位置位于D函数偏移的0x1c处。5、反汇编找到出错位置 # objdump –D –S oops.ko > log 如果在编译过程中加上选项”-g”调试选项就可以看到相对应的C语言代码,就很容易找到问题所在加上调试选项: 在内核中Makefile文件中使”-g”使能