[FUG-BR] urucubaca 3 a revanche e reboots só na madrugada

Ricardo Carlini Sperandio rcarlini em gmail.com
Quinta Março 7 08:54:12 BRT 2013


Enviado pelo Motorola Razr
Em 07/03/2013 08:06, "Marcelo Gondim" <gondim at bsdinfo.com.br> escreveu:
>
> E ae pessoal,
>
> Olha o Beast deve ter brigado com Murphy ou sei lá com quem mas essa até
> agora não descobri. Estou a semana toda tentando desvendar esse mistério
> que me assola. rsrsrsr
>
> Sexta feira foi instalar um equipamento novo para ampliar nosso clear
> channel em fibra para 2 Gbps fazendo link aggregation com 2 Intel Server
> Giga no nosso router de borda.
> Até aqui blz sendo que na madrugada seguinte ocorreram alguns reboots
> espontâneos. De sábado até hoje estou sofrendo com reboots espontâneos e
> agora é que vem o detalhe: eles só ocorrem de madrugada entre 00:00 e e
> antes das 09:00. O restante do dia fica 100% normal, sem reboots. Eu
> primeiramente achei que fosse um problema no no-break, então fui lá e
> fiz uns testes no no-break e em nenhum momento o servidor reiniciou.
> Chequei aterramento e tudo. Se removido o no-break da tomada este
> aguenta por mais de 40 minutos tranquilo.
> Parti pro sistema, como estou usando a versão 9.1-STABLE peguei a
> revisão que estou usando no meu Firewall aqui sem problemas e compilei a
> mesma revisão no router:
>
> FreeBSD xxx.xxx.xxx.xxx 9.1-STABLE FreeBSD 9.1-STABLE #14 r247497: Thu
> Feb 28 21:32:09 BRT 2013
> root at xxx.xxx.xxx.xxx:/usr/obj/usr/src/sys/XXXXX  amd64
>
> Usei a revisão 247497. Não adiantou e o mais estranho é que foi do nada
> e só ocorre de madruga. No gráfico de uso de link é um horário muito
> tranquilo de menor acesso e para tentar ver o que estava ocorrendo eu
> habilitei o dumpdev na esperança de me gerar algum core em /var/crash
> mas nada de core.
>
> Esse servidor é um Intel Dual Quad Xeon E5606  @ 2.13GHz com 8Gb de ram.
> Tem 3 interfaces de rede Intel Gigabit Server Dual Port chipset 82576 e
> 2 Intel Giga Server onboards.
> A placa mãe é a Intel Motherboard S5500BC. Um tempo atrás tive problemas
> com esse modelo mas depois de umas atualizadas no firmware o problema
sumiu.
> Atualizei para o último stable e nada como podem ver no log abaixo, hoje
> rebootou 4 vezes de madruga. Eu estou bolado mesmo é por que só de
> madrugada?
> Olhei no cron e não vi nada que explicasse também e os horários são
> muito aleatórios.
> Só me restam 2 coisas: trocar a máquina e o no-break.
>
> Abaixo os logs:
>
> boot time                                  Thu Mar  7 05:19
> boot time                                  Thu Mar  7 04:19
> boot time                                  Thu Mar  7 03:07
> boot time                                  Thu Mar  7 02:33
> boot time                                  Wed Mar  6 03:14
> boot time                                  Wed Mar  6 02:29
> boot time                                  Tue Mar  5 04:32
> boot time                                  Mon Mar  4 08:16
> boot time                                  Mon Mar  4 07:09
> boot time                                  Mon Mar  4 05:54
> boot time                                  Mon Mar  4 05:14
> boot time                                  Mon Mar  4 04:33
> boot time                                  Mon Mar  4 04:29
> boot time                                  Mon Mar  4 04:10
> boot time                                  Mon Mar  4 04:01
> boot time                                  Mon Mar  4 03:22
> boot time                                  Sun Mar  3 05:55
> boot time                                  Sat Mar  2 08:02
> boot time                                  Sat Mar  2 07:54
> boot time                                  Sat Mar  2 07:11
> boot time                                  Sat Mar  2 05:33
> boot time                                  Sat Mar  2 05:09
> boot time                                  Sat Mar  2 04:56
> boot time                                  Sat Mar  2 04:19
> boot time                                  Sat Mar  2 04:13
> boot time                                  Sat Mar  2 04:04
> boot time                                  Sat Mar  2 03:27
> boot time                                  Sat Mar  2 03:20
> boot time                                  Sat Mar  2 02:51
> boot time                                  Sat Mar  2 02:40
>
> []'s
> Gondim

Pode soar esquisito, mas vc já deu uma revisada nas configurações de BIOS
do servidor? Já vi algo parecido com isso em um velho itautec e era uma
configuração de watchdog na BIOS.
> -------------------------
> Histórico: http://www.fug.com.br/historico/html/freebsd/
> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd


Mais detalhes sobre a lista de discussão freebsd