Verursacht ein redundanter Stromversorgungsausfall eine Kernel-Panik?

413
hamid bayat

Unmittelbar nach dem Ausfall eines Netzteils wurde der folgende Fehler in syslog behoben. (das Betriebssystem ist ubuntu 14.04.) Ich verwende eine JVM (Java Virtual Machine) mit 64 HEAP auf einem Server mit 128 RAM. glauben Sie, dass ein Stromausfall Auswirkungen auf die RAM-Zuweisung hat oder irgendeinen Effekt auf dem Betriebssystem oder der Anwendung?

0000000000000000 DR6: 00000000fffe0ff0 DR7: 0000000000000400 25 Jul 14.14.37 ubuntu-132 kernel: [14.872.493,172157] Stapel am 25. Juli 14.14.37 ubuntu-132 kernel: [14.872.493,172229] 0000000000002e04 00000000000002f9 000000000000030f ffff88025e24d280 25 Jul 14.14.37 ubuntu-132 kernel: [14872493,172492] 00000000000002c9 0000000000000021 0000000000016d00 00000000000002c9 Juli 25 14.14.37 ubuntu-132 kernel: [14872493,172755] ffff88025e24d280 000000000000008f ffff88011bb43c50 00000000000001e3 Juli 25 14.14.37 ubuntu-132 kernel: [14.872.493,173017] Call Trace: Juli 25 14:14:37 ubuntu-132-kernel: [14872493.173105] [] task_numa_migrate + 0x4a0 / 0x930 25. Juli 14:14:37 ubuntu-132-kernel: [14872493.173300] []? update_curr + 0x80 / ​​0x170 25. Juli 14:14:37 ubuntu-132-Kernel: [14872493.182774] [] numa_migrate_preferred + 0x79 / 0x80 25. Juli 14:14: 37 ubuntu-132-Kernel: [14872493.192289] [] task_numa_fault + 0x91d / 0xcc0 25. Juli 14:14:37 ubuntu-132-Kernel: [14872493.201866] []? mpol_misplaced + 0x14e / 0x190 25. Juli 14:14:37 ubuntu-132-Kernel: [14872493.211507] [] handle_pte_fault + 0x5a6 / 0x1470 25. Juli 14:14:37 ubuntu-132-Kernel: [14872493.221002] []? schedule_hrtimeout_range_clock + 0xb9 / 0x130 25. Juli 14:14:37 ubuntu-132-Kernel: [14872493.230440] []? schedule_hrtimeout_range_clock + 0xa0 / 0x130 25. Juli 14:14:37 ubuntu-132-Kernel: [14872493.239693] [] handle_mm_fault + 0x250 / 0x540 25. Juli 14:14:37 ubuntu-132-Kernel: [14872493.248859] [] __do_48 25 14:14:37 ubuntu-132-kernel: [14872493.257910] [] do_page_fault + 0x22 / 0x30 25. Juli 14:14:37 ubuntu-132-kernel: [14872493.266879] [] page_fault + 0x28 / 0x30 Jul 25 14:14:37 ubuntu-132 kernel: [14872493.275686] Code:

0
Sie bitten um Spekulation, es kann hier keine konkrete Antwort mit den gegebenen Informationen geben, aber wenn dies ein einmaliger Zufall ist, der zum Zeitpunkt des Stromausfalls aufgetreten ist, warum würden Sie dann denken, dass es etwas anderes als eine Stromversorgung ist? Fluktuation, die es verursacht hat? acejavelin vor 6 Jahren 0
@acejavelin, weil es direkt nach einem redundanten Stromausfall auftritt. Meine Frage bezieht sich auf den Einfluss eines Netzteilausfalls auf die RAM-Zuweisung, die Betriebssystem- und Systemleistung. nicht nur in diesem Fall. Danke für die Antwort. hamid bayat vor 6 Jahren 0

1 Antwort auf die Frage

1
acejavelin

Redundante Stromversorgung ist genau das, redundant ... In jedem Fall sollte eines der beiden Netzteile getrennt werden können oder ausfallen, ohne dass der Server dadurch beeinträchtigt wird. In den meisten Fällen ist dem Kernel nicht einmal bewusst, dass ein Netzteil ausgefallen ist, oder wenn er sich dessen bewusst ist, dass er lediglich protokolliert oder dem Systemadministrator ein Problem angezeigt wird.

Wenn jedoch eine Stromversorgung ausfällt, kann es vorübergehend zu einem Kurzschluss oder zu einer Über- / Unterspannung kommen, was dazu führen kann, dass fast alles im Server nicht ordnungsgemäß funktioniert. Die meisten Motherboards verfügen über Schutzvorrichtungen, die in die redundanten Stromversorgungsschaltungen integriert sind, aber sie sind nicht perfekt.

Um Ihre spezifischen Fragen zu beantworten, versuchen Sie, Ihre Fragen zu klären:

Denken Sie, dass ein Ausfall eines einzelnen Netzteils in einem redundanten Netzteilserver die RAM-Zuweisung beeinflusst?

Nein, der Ausfall der Stromversorgung selbst hat wahrscheinlich nicht zu einem Fehler bei der RAM-Zuweisung geführt. Die wahrscheinlichere Ursache ist wie oben angegeben.

Hat ein Netzteilausfall, wie oben beschrieben, Auswirkungen auf das Betriebssystem oder die laufende Anwendung?

In einer perfekten Welt sollte das Betriebssystem oder eine Anwendung nicht betroffen sein, aber wir leben nicht in einer perfekten Welt. Die wahrscheinlichere Ursache ist wie oben angegeben.

Es könnte auch sein, dass dasselbe, was dazu führt, dass eines der Netzteile ausfällt, das andere zu Störungen führt. Jasen vor 6 Jahren 1