Das System schlägt fehl, weil das Betriebssystem Panik

Renewability

Nehmen wir an, Ihr System nicht, da das Betriebssystem abstürzt. Es Neustart, startet Anwendungen wie Web-Servern und Datenbanken, und führt weiter wie vor dem Scheitern. Was ist die Wahrscheinlichkeit, dass ein erneutes Scheitern durch ein Betriebssystem Panik? Aller Wahrscheinlichkeit nach ist es genau das gleiche wie vor dem Neustart. Es gibt viele Fälle, aber, in der Reparatur eines System ändert die MTBF Merkmale des Systems und erhöht die Wahrscheinlichkeit, dass ein erneutes Scheitern in der nahen Zukunft. Wenn Sie ersetzen einem Platten auf Ihrem Auto mit der "Donut" Rettungsring, ist die MTBF für Reifen-Probleme nicht dasselbe wie wenn Sie liefen auf vier Original-Reifen, der Donut hat Geschwindigkeit und Entfernung Beschränkungen auf, es zu machen, dass sie weniger zuverlässig als einen neuen Reifen. Sie haben Ihr Fahrzeug so repariert, dass es wieder funktionsfähig, aber Sie haben das Auto nicht wieder in seine ursprüngliche MTBF Spezifikationen.

  

Das Konzept der Reparatur eines Systems, so dass ihre MTBF bleibt die gleiche heißt renewability.1 Systeme, die nicht erneuerbar sind im Laufe der Zeit abgebaut. Software im allgemeinen, darf nicht aufgrund von Problemen wie Memory Leaks oder Speicherfehler erneuerbaren, dass die Wahrscheinlichkeit des Scheiterns mit der Zeit zunehmen. Fixing ein Ausfall kann nicht wiederherstellen, das System in seinen ursprünglichen Zustand, wenn Sie jemals einen Neustart oder regelmäßige vorbeugende Wartung Neustart durchgeführt haben, haben Sie zielte darauf ab, ein System zu erneuerbaren der Brute-Force-Weg. In jedem der Beispiele und Szenarien beschreiben wir , sind wir dem Ziel, auch Systeme erneuert werden. Reparatur ein fehlerhaftes Bauteil, egal ob Hard-oder Software nicht zum erwarteten Zeitpunkt nicht berühren sollte, bevor der nächste Ausfall. Bei der Beurteilung eines Verfügbarkeit Technik, um die zentrale Frage stellen, ist "Wird diese Reparatur wieder das System in seinen ursprünglichen Zustand, so dass alle meine Annahmen über Failure Modes, Ausfallraten und Reparatur-Prozesse wie sie waren, bevor ich die Reparatur ? "Antwort" ja "und Sie können darauf vertrauen, dass Ihre MTBF-Werte aufstehen wird nach einer Reihe von Fehlschlägen und der damit verbundenen Reparaturen.

Sigmas und Nines

Six-Sigma-Methodik ist ein anderer beliebter Trend, der uns dazu bringt, werden datafocused und Prozess-intensiv. Das Herz der Six-Sigma-Methodik ist, etwas zu messen, um herauszufinden, wo Mängel eingeführt werden, und dann die Quelle der Beseitigung der Mängel, so dass die daraus resultierenden Prozess zeigt, weniger als sechs Fehler pro Million Möglichkeiten für einen Mangel (sechs Sigmas oder Standardabweichungen vom Mittelwert entfernt). Obwohl diese Methode am häufigsten für die Fertigungsprozesse und harte Waren verwendet, hat es Anwendbarkeit auf die Zuverlässigkeit vernetzter Systeme. Anstatt darüber nachzudenken, Six Sigma als zu zerstören searchand-Prozess für Mängel, darüber nachzudenken, wie ein Weg zur Verringerung der Variation.

  • Was sind die Werte, dass die Nutzer finden die meisten kritischen in Ihren Systemen? Response-Zeit? Konsistentes Verhalten? Korrektes Verhalten? Dies sind die kritisch-to-Qualität (VQ) Variablen, die Sie messen können.
  • Definieren Sie Fehler oder Mängel, auf der Grundlage dieser CTQs. Wenn eine Transaktion wird voraussichtlich in 10 Sekunden abgeschlossen sein, und es läuft für 30 Sekunden, aber schließlich komplettiert richtig ist, dass ein Scheitern? Ist es ein Fehler?
  • Können Sie beziehen sich diese Benutzer CTQs Komponenten im System? Wo liegen die Mängel eingeführt? Was sind die Ursachen für Abweichungen, und wie können Sie steuern, die System-Komponenten durch Veränderung ihrer Eigenschaften vorhanden sind?

Six-Sigma-Methodik kann Ihre Gedanken über die Verfügbarkeit aus dem Binär-Uptime-versus-Ausfallzeiten auf ein Modell, in dem Sie auf den Benutzer Erfahrung zurückblicken. Es erfordert, dass Sie Messgrößen, die Dinge, die Sie kontrollieren können miteinander verbunden sind, verringern die Variabilität durch die Beseitigung der Ursache von Fehlern in den Prozess. Wenn Sie eine langlebige Transaktion als Mangel definiert, so die Kapazitätsplanung und Ressourcenverteilung zu einem Teil Ihrer Sanierung. Wenn diese Schwankungen in Ansprechzeit ist durch das System während eines Failover-Verhalten verursacht, dann müssen Sie für eine komplexere Wiederherstellungsmodell Design kann.

Der Wert der Verfügbarkeit

Grundsätzlich ist eine hohe Verfügbarkeit eine unternehmerische Entscheidung. Computer kosten Geld um zu funktionieren. Sie kosten zusätzliches Geld scheitern sollte sie tätig werden, wenn sie zu erwarten sind. Aber der Hauptgrund Unternehmen investieren in Computern (oder etwas anderes, in diesem Fall) ist es, ihnen Geld. Computer ermöglichen, eine Organisation, die Aufgaben, die es nicht ohne den Computer durchführen durchzuführen. Computer können Dinge tun, die Menschen nicht, können sie Dinge tun, schneller und billiger und genauer, als man kann. (Nicht alles, aber vieles.) Wenn ein Computer nicht die Durchführung der Funktion, für die es erworben wurde, ist es nicht machen ihre Besitzer Geld, es ist, statt, kostet sie Geld. Ausfallzeiten Da kann deaktiviert, go on forever, gibt es scheinbar keine Grenze für die Kosten, die sich ein Computer erzeugen könnte.

Was ist High-Availability?

Es gab eine Zeit, als Ihre Autoren diskutiert unter dem Begriff "Hochverfügbarkeit" aus dem Titel dieses Artikels. Das Argument dafür war, dass der Begriff schon so Anbieter von Marketing-Organisationen hatte jede Bedeutung verloren getrübt werden. Das Argument gegen die Entfernung es war, dass es keinen anderen Begriff, der so gut zusammen, was wir versucht haben zu erreichen mit dem Artikel. Am Ende entschieden wir uns, wenn wir nahmen "Hochverfügbarkeit" aus dem Titel, niemand wäre je in der Lage, um den Artikel zu finden, und wenn wir dabei bleiben, hätten wir die Möglichkeit, sie definieren uns haben. So ließen wir es auf der er als Marketing-Entscheidung denken. Wenn Sie etwa fragen, werden Sie feststellen, dass es wirklich keine harten Definition für Hochverfügbarkeit oder eine feste Schwelle, die bestimmt, ob ein bestimmtes System nicht erreicht hat. Anbieter haben den Begriff, um ihre Bedürfnisse passen geprägt. So gut wie jedes System und Betriebssystem-Hersteller mit einer Marketing-Abteilung behauptet, hohe Verfügbarkeit im einen oder anderen Form zu liefern. Die Wahrheit ist, dass trotz der Behauptungen von 7 × 24 × oder was auch immer eine bestimmte Anzahl von Neunen, mit solchen Forderungen bemerkenswert wenig bedeuten in der Praxis von Tag zu Tag Verfügbarkeit des Systems. Die Storage Network Industry Association (SNIA) eine hervorragende technische Online-Wörterbuch (www .snia.org / Wörterbuch), in denen sie eine hohe Verfügbarkeit zu definieren wie folgt: Die Fähigkeit eines Systems zur Wahrnehmung ihrer Aufgaben kontinuierlich (ohne Unterbrechung) für einen deutlich längeren Zeitraum als die Reliabilitäten der einzelnen Komponenten zu vermuten wäre.

Hohe Verfügbarkeit ist meistens durch Ausfallsicherheit erreicht. Hohe Verfügbarkeit ist nicht leicht zu quantifizieren ist ein Begriff. Sowohl die Grenzen eines Systems, das aufgerufen wird, hochverfügbar und bis zu welchem Grad die Verfügbarkeit ist außerordentlich müssen deutlich auf einen Fall verstanden werden-zu-Fall-Basis. Verfügbarkeit ist ziemlich klar definiert, aber es ist hoch, dass das Problem ist. Ist ein 20-stöckiges Gebäude hoch? In Manhattan, Kansas, wäre es, aber in Manhattan, New York, ein 20-stöckige Gebäude befindet sich in der Menge verloren. Es ist sehr viel ein relativer Begriff. Wie hoch ist los? Wie oben hoch ist? Wie verfügbar etwas tut, müssen für sie in hohem Maße zur Verfügung? Größer als normal? Was ist normal, und wer definiert es? Auch nicht viel helfen, in diesen Definitionen. Entwicklung einer praktischen Definition für hohe Verfügbarkeit wird noch einen anderen Ansatz erfordern. Stellen Sie sich, warum jemand einen Computer-System implementiert. Jemand gibt Geld zum Kauf (oder Leasing) eines EDV-Systems. Das Ziel, wie es ist mit jedem Ausgaben der Unternehmen ist eine Art Rückkehr, oder der Wert zurück zu bekommen, auf dass die Ausgaben. Geld, das mit der Absicht, immer Wert wieder ausgegeben wird, ist eine Investition. Das Ziel ist also, zu erreichen eine angemessene Vergütung für die Investitionen getätigt, um das EDV-System zu implementieren. Die Rendite auf die Investitionen müssen nicht direkt monetär. In einem akademischen Umfeld, zum Beispiel kann die Rücksendung lehrreich. Ein Computer Science Department an einer Universität oder High School kauft Computern mit dem edlen Ziel der Lehre, wie ihre Schüler verwenden, um den Computer. Natürlich, auf lange Sicht, eine Informatik-Abteilung, die einen guten Ruf entwickelt wird eine finanzielle Rendite zu erhöhten Besucherzahlen in den einzelnen Klassen und Unterricht.

Die Bildungs-Computer an einer Hochschule nicht als kritisch anzusehen, die von den meisten kommerziellen Unternehmen, aber wenn diese Computer sind für sich so viel von der Zeit während eines Semesters, dass die Schüler nicht in der Lage sind, ihre Aufgaben vollständig, so die Computer nicht in der Lage, eine angemessene generieren Rückkehr über die finanziellen Investitionen in die sie gestellt werden. Wenn diese Ausfälle treten oft genug und lange genug, so kann die Abteilung einen guten Ruf für lausige mit Computern oder lausige Computer Verwaltung, die in jedem Fall, wirft ein äußerst schlechtes Licht auf die Abteilung und konnte im Laufe der Zeit beeinflussen Einschreibung zu entwickeln. Die Dasselbe gilt für alle Computer in jedem Unternehmen true; Computern, die unten sind, sind nicht dabei die Aufgabe, für die sie umgesetzt werden. Stellen Sie sich also, dass ein System ist hoch verfügbar, wenn es verfügbar ist genug Zeit, die für die Rückkehr zu generieren umgesetzt wurde, an erster Stelle. Um fair zu sein, bedarf es einer klaren Vision für die Zukunft zu wissen, ob ein System ausreichend gegen alle möglichen Störungen geschützt ist, und das für völlig unmöglich. So betrachten wir eine hohe Verfügbarkeit zu einem Design-Ziel als eine eigentliche Design. Wenn ein System konzipiert ist, sollte klar sein, seinen Designern, welche Anforderungen sie für die Verfügbarkeit. Wenn das System wirklich auf diese Anforderungen entwickelt worden, das System ist hochverfügbar. Unsere Definition von Hochverfügbarkeit, ist daher wie folgt: Hohe Verfügbarkeit, n. Ein Niveau von Verfügbarkeit des Systems durch ein Design, das voraussichtlich erfüllen oder übertreffen die geschäftlichen Anforderungen für die das System implementiert ist impliziert. Hohe Verfügbarkeit, ist also ein Trade-off zwischen den Kosten für Ausfallzeiten und die Kosten für die Schutzmaßnahmen, die zur Verfügung zu vermeiden oder Ausfallzeiten zu reduzieren.

Ein Artikel eingereicht von Ben Smeider


Disclaimer:Unsere Website ist nicht verantwortlich für den Inhalt dieses Artikels. Webarticles ist eine kostenlose Informationsquelle.
Wichtig: Dieser Artikel "Das System schlägt fehl, weil das Betriebssystem Panik" wurde durch ein automatisches Software übersetzt. Wir fühlen uns leid für alle Rechtschreibfehler, die möglicherweise aufgetreten sind. Vielen Dank für Ihr Verständnis.


Online: 138 users browsing the articles directory   


  

|