quinta-feira, 25 de outubro de 2012
Teste de hardware do servidor e Burn-in - detalhada Teste de Stress e detecção de falhas em hardware novo
Vá em frente, admita, você já pensou em você mesmo. Não seria satisfatório para definir o computador saia? Infelizmente, isso não é o que este artigo é sobre. Burning in é o termo usado para descrever o processo de testes de hardware novo servidor gerenciado para falhas antes de colocá-lo para usar em um ambiente vivo. Isto é feito através da execução de software "testes de estresse" por algum período de tempo.
Sempre que nos encontramos novo hardware de servidor, sempre fazemos uma queima completa, para assegurar que o hardware do servidor é de até nossos altos padrões. Se o hardware falhar em qualquer ponto, nós enviá-lo de volta para o fornecedor. O processo real é fácil, embora a sua criação não é.
Memória
Primeiro, quando o novo servidor está ligado, nós arrancar da rede, o que nos permite arrancar várias máquinas ao mesmo tempo sem a necessidade de 20 + arranque discos. O primeiro teste é o Memtest bem conhecido, você vai encontrá-lo no Google, este completamente verifica a memória de computadores, e funciona por cerca de 1 dia.
Se o computador passa a Memtest, ele será reiniciado e iniciado em um chapéu personalizado Red instalação kickstart que irá instalar um ambiente Hat nua Vermelho, e Cerberus Sistema de Controle de teste, um software especial que é executado inúmeros testes em todo o hardware no sistema.
CPU
Cerberus executa várias tarefas para testar a CPU. Ele compila o kernel do Linux e outra vez, corre complicados problemas matemáticos (quanto tempo você leva para saber se 3214235409234472020393848453 é primo?), E corre algum código escrito especificamente para executar o CPU no seu mais quente.
Hard Drive
Cerberus escreve grandes volumes de dados nos discos rígidos e outra vez para garantir que os pratos do disco são funcionais, e que também irá apagar e mover arquivos, e verificar os discos para erros.
Se, depois de uma semana, o servidor ainda está em execução (não fumador) e não caiu, considera-se suficiente para o uso como uma máquina de produção. Se falhar os testes em qualquer lugar ao longo do caminho, é lançado para cima e voltou a ser substituído. Servidores Web que sobreviveram este processo certamente vai sobreviver a qualquer coisa que você pode através neles.
Você normalmente esperaria que este nível de teste seria completado pelos fabricantes de hardware e assim que estes testes não devem mostrar-se eventuais falhas. Em nossas centenas experiência em testes de máquinas que fazemos regularmente encontrar falhas, e nós enviar os componentes de volta.
A razão que é tão importante para realizar esse nível de teste em computadores que serão utilizados como servidores é que as demandas uptime são tão altos. A menor falha irá causar interrupções e tempo de inatividade. Uma vez que um servidor web é implantado, nunca mais você vai ter a oportunidade de colocá-lo offline e executar testes detalhados tal. Mesmo se fosse a falhar, há sempre uma demanda que ser colocado de volta on-line o mais rápido possível, e não deixado offline enquanto diagnósticos minuciosos estão concluídas....
Assinar:
Postar comentários (Atom)
Nenhum comentário:
Postar um comentário