Seu sistema falha porque o sistema operacional entra em pânicoRenovabilidadeDigamos que o seu sistema falhar, porque a pane no sistema operacional. Ela reinicia, reinicia aplicações tais como servidores web e bancos de dados, e continua como antes da falha. Qual é a probabilidade de um fracasso devido a uma pane no sistema operacional? Em toda a probabilidade, é exatamente o mesmo que era antes do reinício. Existem muitos casos, no entanto, que reparar um sistema muda as características MTBF do sistema, aumentando a probabilidade de uma outra falha no futuro próximo. Quando você substituir um pneu furado em seu carro com as filhós "pneu sobressalente, o MTBF para os problemas de pneu não é a mesma de quando você estava sendo executado em quatro pneus originais, a rosca tem restrições de velocidade e distância em que se tornam menos confiáveis do que um pneu novo. Você já reparou o seu carro para que seja funcional novamente, mas não se ter restaurado o carro com as especificações MTBF original.
O conceito de reparação de um sistema tal que a sua MTBF permanece a mesma é chamada renewability.1 Sistemas degradar que não são renováveis ao longo do tempo. Software, em geral, não podendo ser renovado por causa de problemas como vazamentos de memória ou de corrupção de memória que aumentam a probabilidade de falha ao longo do tempo. Fixação de uma falha não pode restaurar o sistema ao seu estado original, se você já fez um reboot regular ou reiniciar a manutenção preventiva, você teve como objetivo fazer um sistema renovável, a forma de força bruta. Em todos os exemplos e cenários que descrevemos , temos como objectivo tornar os sistemas renováveis. Reparando um componente falha, seja de hardware ou software, não deve afetar o tempo de espera antes da falha seguinte. Ao avaliar uma técnica de disponibilidade, a questão-chave para perguntar se "Será que esta reparação restaurar o sistema ao seu estado original, para que todas as minhas suposições sobre os modos de falha, as taxas de insucesso e processos de reparação são os mesmos que eram antes eu fiz o reparo ? Responda "sim" e você pode ter certeza de que seus números do MTBF vai ficar depois de uma série de falhas e reparos associados. Sigmas e NinesMetodologia Seis Sigma é uma outra tendência popular que nos impulsiona a ser datafocused e para o processo intenso. O coração do seis-sigma metodologia é medir algo, descobrir onde os defeitos estão sendo introduzidos, e depois remover a origem dos defeitos para que o processo resultante mostra menos de seis defeitos por milhão de oportunidades para um defeito (seis sigmas ou desvios-padrão longe da média). Embora esta metodologia é mais comumente usados para processos de manufatura e bens de difícil, tem aplicabilidade a confiabilidade dos sistemas em rede também. Em vez de pensar sobre o Seis Sigma como uma searchand-destruir processo de defeitos, pense nisso como uma forma de reduzir a variação.
Metodologia Seis Sigma pode ter o seu pensamento sobre a disponibilidade do uptime binário versus tempo de inatividade para um modelo em que você olhar para a experiência do usuário. Ela exige que você medir as variáveis que estão relacionadas com coisas que você pode controlar, reduzir a variabilidade, removendo a causa de defeitos no processo. Se você definiu uma operação de longa duração como um defeito, então a capacidade de planeamento e afectação de recursos se tornam parte de sua recuperação. Se que a variabilidade no tempo de resposta é causado pelo comportamento do sistema durante um failover, então você pode ter a concepção de um modelo de recuperação mais complexa. O Valor da DisponibilidadeFundamentalmente, a alta disponibilidade é uma decisão empresarial. Os computadores custam dinheiro para operar. Eles custam dinheiro adicional se eles não funcionam quando são esperados. Mas a razão fundamental investir em empresas de computadores (ou qualquer outra coisa, para essa matéria) é fazer-lhes dinheiro. Computadores permitem uma organização para realizar tarefas que não poderia funcionar sem o computador. Computadores podem fazer coisas que as pessoas não podem, eles fazem as coisas mais rápido e mais barato e mais precisão do que as pessoas podem. (Nem tudo, mas muitas coisas.) Quando um computador não está executando a função para que foi comprado, ele não está fazendo seu dinheiro donos, é, ao invés, custando-lhes dinheiro. Desde o tempo de inatividade pode, desmarcado, vá para sempre, não há aparentemente nenhum limite para os custos que um computador de baixo pode gerar. What Is High Availability?Houve um período de tempo em que seus autores, tendo debatido a frase "alta disponibilidade" para fora do título deste artigo. O argumento para isso é que o termo se tornou tão enlameada por organizações de marketing vendedor tinha perdido todo o significado. O argumento contra a remoção foi que não havia nenhum outro termo que tão bem resumiu o que estávamos tentando fazer com o artigo. No final, decidimos que se tomou "alta disponibilidade" para fora do título, ninguém jamais será capaz de encontrar o artigo, e se deixe ficar, não teríamos a oportunidade de definir a nós mesmos. Então, deixamos dentro Pense nisso como uma decisão de marketing. Se você perguntar ao redor, você verá que não há realmente nenhuma definição rígido de alta disponibilidade, ou uma empresa de limiar que determina se ou não um determinado sistema tem conseguido isso. Vendedores têm moldado o termo para atender suas necessidades. Apenas sobre cada sistema e fornecedor do sistema operacional com um departamento de comercialização de créditos para proporcionar alta disponibilidade, de uma forma ou de outra. A verdade é que apesar das alegações de 7 × 24 × quer que seja, ou o número de alguns dos noves, os créditos significam muito pouco prático no dia-a-dia a disponibilidade do sistema. The Storage Network Industry Association (SNIA) possui um dicionário on-line excelente técnico (www .snia.org / dicionário), em que se define a alta disponibilidade da seguinte forma: A capacidade de um sistema para executar sua função de forma contínua (sem interrupção) por um período significativo de tempo mais longos do que as confiabilidades dos seus componentes individuais poderia sugerir.
Os computadores educacionais de uma universidade não seria considerado crítico pela maioria das empresas comerciais, mas se os computadores estão previstas para tanto do tempo durante um semestre que os alunos são incapazes de completar suas atribuições, em seguida, os computadores não são capazes de gerar um adequado retorno sobre o investimento financeiro que lhes é conferida. Se estas falhas ocorrem com freqüência suficiente, e durar o suficiente, o departamento pode desenvolver uma reputação de ter computadores ruim ou péssima administração do computador, que, em ambos os casos, reflete muito pouco sobre o departamento e poderia, ao longo do tempo, afetam a inscrição. A mesmo é verdadeiro para qualquer computador em qualquer empreendimento; computadores que estão para baixo não estão fazendo o trabalho para o qual foram implementados. Considere-se, então, que um sistema é altamente disponíveis quando se está disponível o tempo suficiente para gerar o retorno do qual foi implementado em primeiro lugar. Para ser justo, que exige uma visão clara do futuro, para saber se um sistema está devidamente protegido contra todos os eventos possíveis, e que é claramente impossível. Assim, consideramos de alta disponibilidade para ser um objetivo do projeto, em vez de um projeto real. Quando um sistema é projetado, deve ficar claro aos seus designers que tem requisitos de disponibilidade. Se o sistema é realmente destinado a esses requisitos, então o sistema é altamente disponível. A nossa definição de alta disponibilidade, portanto, é o seguinte: Alta disponibilidade, n. Um nível de disponibilidade do sistema decorrente de um projeto que deve atender ou exceder os requisitos de negócio para o qual o sistema está implementado. Alta Disponibilidade, então, é um trade-off entre o custo de inatividade e os custos das medidas de protecção que são a fim de evitar ou reduzir o tempo de inatividade. um artigo submetido por Ben Smeider Isenção de responsabilidade:O nosso site não se responsabiliza pelo conteúdo deste artigo. Webarticles é uma fonte de informação livre. Importante: Este artigo "O sistema falha porque o sistema operacional entra em pânico" foi traduzida por um software automático. Nós sentimos muito por quaisquer erros de ortografia que pode ter ocorrido. Obrigado pela sua compreensão.
|
|||||
| Online: 284 users browsing the articles directory |
|
|