[FUG-BR] FreeBSD desaparecendo com um núcleo na CPU

Frederico Terra Boechat fboechat em gmail.com
Sexta Novembro 9 10:36:05 BRST 2012


eu trabalhei  numa empresa muito grande, com clientes interconectados no mundo todo. Um cliente reclamava que um dos POP's dele, em Ho Chi Minh City, ficava offline todo dia as 21:00 e sempre retornava as 7:00. Mandou-se técnico averiguar, contatou-se a operadora e não tnha nada errado, e o cliente cada vez reclamando mais.

Após muita luta e stress chegou-se a tia da limpeza, que parecia ser o único técnico local (???) e perguntaram se ela não via nada diferente. E ela disse que no país raciona-se energia, então TODO o país fica sem energia das 21:00 as 7:00.

Então quando nada mais funciona, quando todos estão à beira da loucura e o cliente espumando de raiva, pense sempre no mais improvável. A experiência me mostrou que as vezes funciona!

Frederico Boechat
Em 09/11/2012, às 10:24, Marcelo Gondim <gondim em bsdinfo.com.br> escreveu:

> Em 09/11/12 08:29, Eduardo Lemos de Sa escreveu:
>> Caríssimos
>> 
>> Incialmente, desculpe-me o subject estranho deste email: escolhi-o para
>> chamar a atenção porque o caso é realmente muito estranho.
>> 
>> Há tempos (mais de 1 ano) tenho rodado o FreeBSD/amd64 (iniciei com o 8.0 e
>> agora estou no 8.3) em uma máquina com placa-mãe Asus M4a88t-v evo/usb3 e
>> processador amd 1075t-6x sem qualquer problema ou ocorrênciaa estranha. Há
>> pouco mais de um mês, notei que a máquina travava (teclado, mouse ou
>> placa-rede estavam totalmente paralizados), todas as quartas-feiras, pela
>> manhã. Eu sei, estranho é (será que inventaram o virus quarta-feira 11, o
> 
> Mesmo que você desligue e ligue a máquina na terça à noite, quando chega 
> na quarta pela manhã ela trava?
> Tem horário certo também?
> Isso parece algo que esteja rodando no cron. Já verificou ele?
> 
>> sucessor do sexta-feira 13 para sistemas unix :-)?. No início, eu achei que
>> pudesse ser a faxineira (que todas as quartas-feira limpa a sala, no
> Ahahaha é mesmo, pior que isso acontece. A empresa para a qual trabalhei 
> uns anos atrás, tinha um cliente que reclamava que o sistema sempre caía 
> todos os dias por volta das 12:00 e voltava uns 15 à 20 minutos depois.
> Como o cliente era perto de onde eu morava, marquei uma visita perto das 
> 12:00, cheguei lá e fiquei sentado esperando dar o horário do problema. 
> Quando foi por voltas das 12:05 me entra um funcionário deles apressado 
> e dizendo: fome, muita fome. O dito cujo me abre a geladeira, cata uma 
> marmita térmica, tira o switch principal da rede da tomada, como quem 
> desliga uma cafeteira e coloca a marmita dele pra esquentar. HAhaHAhaH
> Finalmente descobrimos o mistério!
> Haviam outros casos também que o sistema parava sempre as 17:30 e aí 
> quando fomos checar era a funcionária que queria sair mais cedo e dizia 
> para o chefe que o sistema estava fora. rsrsrs
> 
>> período da manhã), daí resolvi deixar a máquina desligada de terça à noite
>> até o momento da faxina acabar. De nada adiantou, e o micro congelava o
>> video e não aceitava mais comandos. Troquei então a placa de video (que
>> geralmente é a culpada quando a tela congela), e de nada adiantou.
>> O mais estranho é que, de uns tempos para cá (não sei precisar a data), o
>> top mostrava processamento nos núcleos de 0 a 4 (=5 núcleos, quando antes
>> funcionavam 6). Ativando o corre unlocker na bios, notei que "5 cores are
>> actived" (ou seja, o sexto núcleo está desligado).
>> A minha suspeita é que o processador ou a placa-mãe (ou ambos) estejam
>> danificados, porém, eu gostaria de ouvir a opinião dos caríssimos para
>> saber:
> Esse lance do processador pode estar influenciando mas o que me intriga 
> é: por que sempre às quartas de manhã? rsrsrs
> 
>> 1) Há algum software que me permita checar o funcionamento correto da
>> placa-mãe e do processador? Eu tenho usado o mbmon para monitar as
>> temperaturas e tensões do processador e placa-mãe, e parece estar tudo
>> normal.
> Ummm para teste de CPU não sei não. Acho que só usando algo para 
> estressar eles.
> 
>> 
>> 2) O passo seguinte é substitur a(s) peça(s), mas temo que instalar um
>> processador novo (no mercado, agora, só há cpus com 4 núcleos para o socket
>> AM3) em uma placa-mãe avariada possa danificar o novo processador e não
>> resolver o problema.
>> 
>> 3) Ao que tudo indica, as memórias estão em bom estado (estado do Paraná
>> :-)), porque não ocorreram falhas de core dump (que, suponho eu, sejam o
>> principal sintoma deste tipo de problema). Porém, não tenho certeza disto
>> porque a ausênciaa de core dumps é baseada em uma suposição de alguém que
>> não tem formação na área de informática ou eletrônica, e gostaria de ouvir
>> a opinião de pessoas mais habilitadas que eu neste assunto.
> Depende. Já tive um caso que não haviam segfaults aparentes mas a 
> máquina estava travando direto. Passei um memtest e acusou 1 banco com 
> problemas. Troquei o mesmo e tudo normalizou. Mas volto na questão.. por 
> que nas quartas pela manhã?  :)
> Parece que algo roda nesse dia. O padrão do periodic semanal é rodar aos 
> sábados. Então não deve ser ele mas é melhor checar o seu.
> 
>> Agradeço a atenção
>> 
>> 
>> Eduardo
>> 
>> Eduardo Lemos de Sa
>> Associated Professor Level 3
>> Dep. Quimica da Universidade Federal do Paraná
>> fone: +55(41)3361-3300
>> fax:   +55(41)3361-3186
>> Voip Number call to (41) 33613600 (listen to the message and type 10531185)
>> -------------------------
>> Histórico: http://www.fug.com.br/historico/html/freebsd/
>> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
>> 
> 
> 
> 
> -------------------------
> Histórico: http://www.fug.com.br/historico/html/freebsd/
> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd



Mais detalhes sobre a lista de discussão freebsd