Проверка сторожей NMI Watchdog
В многопроцессорных системах операционная система Linux предлагает разработчикам ядра еще одну функциональную возможность. Это сторожа, которые могут оказаться полезными для обнаружения ошибок в ядре, вызывающих зависание системы. Для активизации такого слежения следует загрузить ядро С параметром nmi_watchdog.
Работа сторожа основана на одной нетривиальной аппаратной особенности локальных APIC-контроллеров и контроллеров I/O APIC: они могут генерировать периодические немаскируемые прерывания на каждом процессоре. Поскольку немаскируемые прерывания не маскируются ассемблерной инструкцией cii, сторож может распознать взаимные блокировки, даже когда прерывания отключены.
В результате этого на каждом тике все процессоры, независимо от того, чем они до этого занимались, запускают обработчики немаскируемых прерываний. В свою очередь, каждый обработчик вызывает функцию do nmi . Эта функция получает логический номер процессора п и проверяет поле apic timer irqs элемента массива irq stat. Если процессор работает правильно, это значение должно отличаться от значения, прочитанного при предыдущем немаскируемом прерывании. Когда с процессором все в порядке, элемент п поля apic timer irqs увеличивается обработчиком локальных таймерных прерываний. Если же счетчик не увеличен, значит, обработчик локальных таймерных прерываний не вызывался целый тик. А в этом нет ничего хорошего.
Когда обработчик немаскируемого прерывания обнаруживает зависание процессора, он звонит во все колокола: записывает устрашающие сообщения в системные журналы, выполняет дамп содержимого регистров процессора и содержимого стека (дамп "kernel oops”) и, наконец, уничтожает текущий процесс. Это дает разработчикам ядра возможность понять, в чем проблема.
Предыдущая страница | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 | Следующая страница