Il vostro sistema non è riuscito perché il sistema operativo panico

Rinnovabilità

Diciamo che il vostro sistema non è riuscito perché il panico sistema operativo. Si riavvia, riavvia applicazioni come server Web e database, e continua come prima del fallimento. Qual è la probabilità di un altro fallimento a causa di un panico sistema operativo? Con ogni probabilità, è esattamente come era prima del riavvio. Ci sono molti casi, tuttavia, in cui la riparazione di un sistema di modifiche delle caratteristiche MTBF del sistema, aumentando la probabilità di un altro fallimento nel futuro a breve termine. Quando si sostituire un pneumatico forato per la tua auto con la ciambella "ruota di scorta, il MTBF per i problemi di pneumatico non è la stessa di quando si correva su quattro ruote originali, la ciambella ha limiti di velocità e distanza su di esso che lo rendono meno affidabile un pneumatico nuovo. Hai riparato la macchina in modo che sia funzionale di nuovo, ma non hanno ripristinato la macchina alle specifiche MTBF originale.

  

Il concetto di riparare un sistema tale che la sua MTBF rimane lo stesso è chiamato renewability.1 Systems degradare che non sono rinnovabili nel corso del tempo. Software, in generale, non può essere rinnovata a causa di problemi come perdite di memoria o di corruzione della memoria che aumentano la probabilità di fallimento nel corso del tempo. Che fissa un fallimento non può ripristinare il sistema allo stato iniziale; se avete mai fatto un riavvio regolare o riavvio di manutenzione preventiva, hai l'obiettivo di creare un sistema rinnovabili come forza bruta. In tutti gli esempi e scenari che descrivono , puntiamo a rendere i sistemi rinnovabili. Riparazione di un componente guasto, sia hardware che software, non dovrebbe pregiudicare il tempo di attesa prima del fallimento successivo. Nel valutare una tecnica di disponibilità, la questione fondamentale da porsi è "Will questa riparazione ripristinare il sistema allo stato iniziale in modo che tutte le mie ipotesi circa le modalità di guasto, i tassi di fallimento, e processi di riparazione sono le stesse che erano prima ho fatto la riparazione ? "rispondere" sì "e si può avere fiducia nel fatto che i numeri di MTBF si alzerà dopo una serie di guasti e le riparazioni associati.

Sigmas e Nines

Metodologia Six Sigma è un altro trend importante che ci spinge ad essere datafocused e ai processi intensi. Il cuore di sei-sigma metodologia è quello di misurare qualcosa, scoprire dove i difetti vengono introdotti, e quindi rimuovere la fonte dei difetti in modo che il processo risultante mostra meno di sei difetti per milione di opportunità per un difetto (sei sigmas o deviazioni standard di distanza dalla media). Anche se questa metodologia è più comunemente utilizzati per i processi di fabbricazione e di beni durevoli, ha applicabilità di affidabilità dei sistemi collegati in rete pure. Invece di pensare a Six Sigma come searchand-distruggere processo per i difetti, pensare come un modo di ridurre le variazioni.

  • Quali sono i valori che gli utenti a trovare più critico nei vostri sistemi? I tempi di risposta? Coerente comportamento? Corretto comportamento? Questi sono i critici-to-qualità (CTQ) variabili che si può misurare.
  • Definire guasti o difetti, sulla base di questi CTQs. Se una transazione si prevede di completare in 10 secondi, e viene eseguito per 30 secondi, ma completa poi correttamente, è che un fallimento? È un difetto?
  • Si può legare questi CTQs all'utente di componenti del sistema? Dove sono i difetti introdotti? Quali sono le fonti di variazione, e come si può controllare tali componenti del sistema, modificando le loro caratteristiche di disponibilità?

Six-Sigma metodologia può prendere il vostro pensiero circa la disponibilità della uptime binary-versus-modello di inattività a quella in cui si guarda l'esperienza dell'utente. Si richiede che si misura le variabili che sono in relazione a ciò è possibile controllare, ridurre la variabilità eliminando la causa di difetti nel processo. Se hai definito una transazione di lungo corso come un difetto, quindi la capacità di programmazione e di allocazione delle risorse diventano parte del tuo bonifica. Se che la variabilità nel tempo di risposta è causato dal comportamento del sistema durante un failover, allora si può avere per la progettazione di un modello più complesso di recupero.

Il valore della Disponibilità

Fondamentalmente, l'alta disponibilità è una decisione aziendale. Prezzo di costo computer per funzionare. Costano soldi supplementari non riescono a funzionare quando ci si aspetta che. Ma il motivo fondamentale per le imprese investire in computer (o qualsiasi altra cosa, del resto) è di fare loro del denaro. Computer consentire una organizzazione di svolgere compiti che non potrebbe funzionare senza il computer. Computers può fare cose che la gente non può, si fanno le cose più veloce e più economico e più accurato di quanto la gente può. (Non tutto, ma molte cose.) Quando un computer non è a svolgere la funzione per la quale è stato acquistato, non è facendo i suoi proprietari di denaro, ma è, invece, costa loro soldi. Dato che i tempi di inattività può, senza controllo, andare avanti per sempre, apparentemente non vi è alcun limite per i costi che un computer verso il basso potrebbe generare.

Qual è ad alta disponibilità?

C'è stato un periodo di tempo, quando il tuo autori discusso tenendo la frase "alta disponibilità" fuori dal titolo di questo articolo. L'argomento per farlo era che il termine era diventato così infangato dalle organizzazioni di marketing venditore aveva perso ogni significato. L'argomento contro la rimozione è stata che non c'era altro termine che tanto bene riassume quello che stavamo cercando realizzare con l'articolo. Alla fine, abbiamo deciso che se abbiamo preso "alta disponibilità" fuori dal titolo, nessuno avrebbe mai potuto trovare l'articolo, e se lasciamo soggiorno, avremmo la possibilità di definire noi stessi. Così abbiamo lasciato dentro Pensate come una decisione di marketing. Se chiedete in giro, scoprirete che non c'è davvero alcuna definizione difficile per l'alta disponibilità o una soglia di un'impresa che determina se un particolare sistema ha raggiunto. I fornitori hanno modellato il termine per soddisfare le loro esigenze. Quasi tutti i sistemi e OS vendor con un ufficio marketing crediti per fornire alta disponibilità, in una forma o in un'altra. La verità è che nonostante le accuse di 7 × 24 × qualunque, o un certo numero di nove, tali domande significa ben poco in pratica giorno-a-la disponibilità del sistema al giorno. Il Storage Network Industry Association (SNIA) ha un eccellente dizionario tecnico on-line (www .snia.org / voce), in cui si definiscono ad alta disponibilità come segue: La capacità di un sistema di svolgere la sua funzione in modo continuo (senza interruzione) per un periodo significativo di tempo più lungo rispetto alla attendibilità delle sue singole componenti suggerirebbe.

Elevata disponibilità è spesso raggiunto attraverso la tolleranza fallimento. Elevata disponibilità non è un termine facilmente quantificabili. Entrambi i limiti di un sistema che è chiamato ad alta disponibilità e il grado in cui la sua disponibilità è straordinario deve essere chiaro su un caso per caso. Disponibilità è piuttosto ben definiti, ma è alto che è il problema. È un edificio di 20 piani alti? A Manhattan, Kansas, sarebbe, ma a Manhattan, New York, un edificio di 20 piani si perde nella folla. E 'molto un termine relativo. Quanto è alta up? Come up è alto? Come a disposizione fa qualcosa devono essere per essere altamente disponibili? Maggiore rispetto al normale? Ciò che è normale, e chi lo definisce? Ancora una volta, non di molto aiuto in queste definizioni. Lo sviluppo di una definizione di pratiche per l'alta disponibilità richiederà ancora un altro approccio. Domandarsi perché qualcuno implementa un sistema informatico. Qualcuno che spende soldi per l'acquisto (o leasing) di un sistema informatico. L'obiettivo, come è, con ogni spesa delle imprese, è quello di ottenere una sorta di ritorno, o valore di schiena, il che la spesa. Denaro che viene speso con l'intento di ottenere valore di ritorno, è un investimento. L'obiettivo, quindi, è quello di raggiungere un rendimento adeguato per gli investimenti effettuati per l'attuazione del sistema informatico. Il ritorno sull'investimento che gli investimenti non devono essere direttamente monetaria. In un ambiente accademico, per esempio, il rendimento può essere educativo. Un dipartimento di informatica presso un'università o una scuola di alta acquista computer con il nobile obiettivo di insegnare agli studenti come usare i computer. Naturalmente, nel lungo periodo, un dipartimento di informatica che sviluppa una buona reputazione ottiene un rendimento finanziario in frequenza maggiore nelle classi e lezioni.

I computer di istruzione in una università, non sarebbero considerati critici dalla maggior parte delle imprese commerciali, ma se i sistemi si stabilisce, per così gran parte del tempo nel corso di un semestre che gli studenti non sono in grado di completare la loro incarichi, poi i computer non sono in grado di generare un adeguato ritorno sugli investimenti finanziari in essi riposta. Se queste interruzioni si verificano abbastanza spesso, e l'ultimo abbastanza a lungo, il servizio può sviluppare una reputazione per aver computer scadente, o la somministrazione di computer scadente, che, in entrambi i casi, riflette molto male del dipartimento e potrebbe, nel tempo, riguardano l'iscrizione. Il stessa cosa vale per qualsiasi computer in qualsiasi impresa; computer che non sono giù facendo il lavoro per cui sono stati attuati. consideri, poi, che un sistema è molto disponibile quando è disponibile abbastanza tempo per generare il ritorno per il quale è stato attuato, in primo luogo. Per essere onesti, esso richiede una chiara visione del futuro per sapere se un sistema è adeguatamente protetto contro tutti gli eventi possibili, e che è chiaramente impossibile. Quindi, riteniamo che l'alta disponibilità ad essere un obiettivo di progettazione piuttosto che un progetto reale. Quando un sistema è stato progettato, dovrebbe essere chiaro ai suoi progettisti quali requisiti essa ha per la disponibilità. Se il sistema è veramente destinato a tali requisiti, allora il sistema è molto disponibile. La nostra definizione di alta disponibilità, dunque, è la seguente: Alta disponibilità, n. A livello di disponibilità del sistema implicava da un design che si prevede di raggiungere o superare i requisiti di business per il quale il sistema è implementato. Alta disponibilità, poi, è un trade-off tra il costo dei tempi di inattività e il costo delle misure di protezione che sono disponibili al fine di evitare o ridurre i tempi di inattività.

un articolo presentato da Ben Smeider


Disclaimer:Il nostro sito non è responsabile per il contenuto di questo articolo. Webarticles è una risorsa gratuita di informazioni.
Importante: Questo articolo è "Il tuo sistema non è riuscito perché il sistema operativo panico" è stato tradotto da un software automatico. Ci dispiace per eventuali errori di ortografia che possono essersi verificati. Grazie per la vostra comprensione.


Online: 266 users browsing the articles directory