[FUG-BR] urucubaca 3 a revanche e reboots só na madrugada

Marcelo Gondim gondim em bsdinfo.com.br
Quinta Março 7 09:19:24 BRT 2013


Em 07/03/13 08:54, Ricardo Carlini Sperandio escreveu:
> Enviado pelo Motorola Razr
> Em 07/03/2013 08:06, "Marcelo Gondim" <gondim em bsdinfo.com.br> escreveu:
>> E ae pessoal,
>>
>> Olha o Beast deve ter brigado com Murphy ou sei lá com quem mas essa até
>> agora não descobri. Estou a semana toda tentando desvendar esse mistério
>> que me assola. rsrsrsr
>>
>> Sexta feira foi instalar um equipamento novo para ampliar nosso clear
>> channel em fibra para 2 Gbps fazendo link aggregation com 2 Intel Server
>> Giga no nosso router de borda.
>> Até aqui blz sendo que na madrugada seguinte ocorreram alguns reboots
>> espontâneos. De sábado até hoje estou sofrendo com reboots espontâneos e
>> agora é que vem o detalhe: eles só ocorrem de madrugada entre 00:00 e e
>> antes das 09:00. O restante do dia fica 100% normal, sem reboots. Eu
>> primeiramente achei que fosse um problema no no-break, então fui lá e
>> fiz uns testes no no-break e em nenhum momento o servidor reiniciou.
>> Chequei aterramento e tudo. Se removido o no-break da tomada este
>> aguenta por mais de 40 minutos tranquilo.
>> Parti pro sistema, como estou usando a versão 9.1-STABLE peguei a
>> revisão que estou usando no meu Firewall aqui sem problemas e compilei a
>> mesma revisão no router:
>>
>> FreeBSD xxx.xxx.xxx.xxx 9.1-STABLE FreeBSD 9.1-STABLE #14 r247497: Thu
>> Feb 28 21:32:09 BRT 2013
>> root em xxx.xxx.xxx.xxx:/usr/obj/usr/src/sys/XXXXX  amd64
>>
>> Usei a revisão 247497. Não adiantou e o mais estranho é que foi do nada
>> e só ocorre de madruga. No gráfico de uso de link é um horário muito
>> tranquilo de menor acesso e para tentar ver o que estava ocorrendo eu
>> habilitei o dumpdev na esperança de me gerar algum core em /var/crash
>> mas nada de core.
>>
>> Esse servidor é um Intel Dual Quad Xeon E5606  @ 2.13GHz com 8Gb de ram.
>> Tem 3 interfaces de rede Intel Gigabit Server Dual Port chipset 82576 e
>> 2 Intel Giga Server onboards.
>> A placa mãe é a Intel Motherboard S5500BC. Um tempo atrás tive problemas
>> com esse modelo mas depois de umas atualizadas no firmware o problema
> sumiu.
>> Atualizei para o último stable e nada como podem ver no log abaixo, hoje
>> rebootou 4 vezes de madruga. Eu estou bolado mesmo é por que só de
>> madrugada?
>> Olhei no cron e não vi nada que explicasse também e os horários são
>> muito aleatórios.
>> Só me restam 2 coisas: trocar a máquina e o no-break.
>>
>> Abaixo os logs:
>>
>> boot time                                  Thu Mar  7 05:19
>> boot time                                  Thu Mar  7 04:19
>> boot time                                  Thu Mar  7 03:07
>> boot time                                  Thu Mar  7 02:33
>> boot time                                  Wed Mar  6 03:14
>> boot time                                  Wed Mar  6 02:29
>> boot time                                  Tue Mar  5 04:32
>> boot time                                  Mon Mar  4 08:16
>> boot time                                  Mon Mar  4 07:09
>> boot time                                  Mon Mar  4 05:54
>> boot time                                  Mon Mar  4 05:14
>> boot time                                  Mon Mar  4 04:33
>> boot time                                  Mon Mar  4 04:29
>> boot time                                  Mon Mar  4 04:10
>> boot time                                  Mon Mar  4 04:01
>> boot time                                  Mon Mar  4 03:22
>> boot time                                  Sun Mar  3 05:55
>> boot time                                  Sat Mar  2 08:02
>> boot time                                  Sat Mar  2 07:54
>> boot time                                  Sat Mar  2 07:11
>> boot time                                  Sat Mar  2 05:33
>> boot time                                  Sat Mar  2 05:09
>> boot time                                  Sat Mar  2 04:56
>> boot time                                  Sat Mar  2 04:19
>> boot time                                  Sat Mar  2 04:13
>> boot time                                  Sat Mar  2 04:04
>> boot time                                  Sat Mar  2 03:27
>> boot time                                  Sat Mar  2 03:20
>> boot time                                  Sat Mar  2 02:51
>> boot time                                  Sat Mar  2 02:40
>>
>> []'s
>> Gondim
> Pode soar esquisito, mas vc já deu uma revisada nas configurações de BIOS
> do servidor? Já vi algo parecido com isso em um velho itautec e era uma
> configuração de watchdog na BIOS.
Boa Ricardo,

Como vou hoje lá trocar o servidor, aproveito e olho isso também. O 
estranho é que começou do nada mas pode ter resetado algo na Bios que 
causou isso.

Valeu,

[]'s
Gondim


Mais detalhes sobre a lista de discussão freebsd