커널 패닉 메시지 질문입니다.
안녕하세요? 리눅스 스케쥴러를 수정해서 테스트 해보고 있는데,
간간히 갑자기 시스템이 죽습니다. 몇시간째 trace를 해보고 있는데 쉽지 않네요. 내용은 아래와 같습니다.
메시지를 보면
Unable to handle kernel NULL pointer dereference at virtual address 0000001c
NULL 포인터 참조 에러이네요.
에러 부분은
PC is at set_next_entity+0x4/0x13c
LR is at pick_next_task_fair+0xa0/0xac
이 함수 부분인듯하네요.
제가 궁금한건 커널 패닉 메시지중
Modules linked in: bcm4329
레지스터 출력 부분(생략)
Process swapper (pid: 0, stack limit = 0xc042a2f0)
이 두 부분입니다.
Modules linked 라는게 이 에러와 연관이 있어서 출력되는 것인가요?
그리고 swapper 이 부분 출력은 코드를 찾아보니 에러 발생시 실행중인 task에 대한 정보를 출력하는데,
그럼 swapper task를 실행하다 에러가 난것인가요?
[ 9082.982696] [] (set_next_entity+0x4/0x13c) from [] (schedule+0x26c/0x750)
[ 9082.982910] [] (schedule+0x26c/0x750) from [] (cpu_idle+0x84/0xa0)
[ 9082.983093] [] (cpu_idle+0x84/0xa0) from [] (start_kernel+0x25c/0x2b4)
[ 9082.983215] [] (start_kernel+0x25c/0x2b4) from [<20008034>] (0x20008034)
[ 9082.983428] Code: e2841020 e8bd4830 ea045f73 e92d4bf0 (e591301c)
[ 9082.983795] ---[ end trace ee92713f03c5ec5f ]---
[ 9082.983886] Kernel panic - not syncing: Fatal exception
[ 9082.984008] [] (unwind_backtrace+0x0/0xd8) from [] (panic+0x58/0x128)
[ 9082.984222] [] (panic+0x58/0x128) from [] (die+0x284/0x2c0)
[ 9082.984436] [] (die+0x284/0x2c0) from [] (__do_kernel_fault+0x64/0x74)
[ 9082.984649] [] (__do_kernel_fault+0x64/0x74) from [] (do_page_fault+0x1d4/0x1ec)
[ 9082.984771] [] (do_page_fault+0x1d4/0x1ec) from [] (do_DataAbort+0x34/0x94)
[ 9082.984985] [] (do_DataAbort+0x34/0x94) from [] (__dabt_svc+0x4c/0x60)
[ 9082.985168] Exception stack(0xc042bef0 to 0xc042bf38)
[ 9082.985290] bee0: c0435008 00000000 00000001 00000001
[ 9082.985473] bf00: 00000000 c0434fc8 00000000 c042dad8 c045fa20 510f00f2 c045fa20 c042bf6c
[ 9082.985687] bf20: 00000000 c042bf38 c0059f54 c0059d58 60000093 ffffffff
[ 9082.985809] [] (__dabt_svc+0x4c/0x60) from [] (set_next_entity+0x4/0x13c)
[ 9082.985992] [] (set_next_entity+0x4/0x13c) from [] (schedule+0x26c/0x750)
[ 9082.986206] [] (schedule+0x26c/0x750) from [] (cpu_idle+0x84/0xa0)
[ 9082.986419] [] (cpu_idle+0x84/0xa0) from [] (start_kernel+0x25c/0x2b4)
[ 9082.986541] [] (start_kernel+0x25c/0x2b4) from [<20008034>] (0x20008034)
이 부분이 실제 에런데, 맨 하부부터 따라가고 있는데
[<20008034>] (0x20008034) 이부분은 어떻게 찾나요? 0xcxxxxxxxx 로 시작해야 kallsyms 파일에서 찾아서 trace할 수있는데,
이부분은 유저 공간이라고 해석이 되는건가요?
만약 패닉 trace가 위 메시지 순서라면 다시 시스템을 init하는 과정인데, 이상하네요.
제 생각이 맞는지 궁금합니다.
댓글 달기