[FUG-BR] FreeBSD desaparecendo com um núcleo na CPU

Eduardo Lemos de Sa eduardo.lemosdesa em gmail.com
Sexta Novembro 9 17:13:06 BRST 2012


Caríssimos

2012/11/9 firebits <mrpa.security em gmail.com>

> já pensou em atualizar o firmware da BIOS da placa mae?
>
>


Foi a primeira coisa que fiz para tentar resolver o problema. O danado é
que o firmware da bios já estava na última versao (segundo a Asus, trata-se
da versão 3.0.7).


Grato pela atenção

Eduardo




> @firebitsbr
> Em 09/11/2012 15:22, "Eduardo Lemos de Sa" <eduardo.lemosdesa em gmail.com>
> escreveu:
>
> > Caro Marcelo
> >
> > Obrigado pelo seu email e sua ajuda. Vou responder às suas perguntas logo
> > abaixo de seu questionamento.
> >
> > 2012/11/9 Marcelo Gondim <gondim em bsdinfo.com.br>
> >
> > > Em 09/11/12 08:29, Eduardo Lemos de Sa escreveu:
> > > > Caríssimos
> > > >
> > > > Incialmente, desculpe-me o subject estranho deste email: escolhi-o
> para
> > > > chamar a atenção porque o caso é realmente muito estranho.
> > > >
> > > > Há tempos (mais de 1 ano) tenho rodado o FreeBSD/amd64 (iniciei com o
> > > 8.0 e
> > > > agora estou no 8.3) em uma máquina com placa-mãe Asus M4a88t-v
> > evo/usb3 e
> > > > processador amd 1075t-6x sem qualquer problema ou ocorrênciaa
> estranha.
> > > Há
> > > > pouco mais de um mês, notei que a máquina travava (teclado, mouse ou
> > > > placa-rede estavam totalmente paralizados), todas as quartas-feiras,
> > pela
> > > > manhã. Eu sei, estranho é (será que inventaram o virus quarta-feira
> > 11, o
> > >
> > > Mesmo que você desligue e ligue a máquina na terça à noite, quando
> chega
> > > na quarta pela manhã ela trava?
> > > Tem horário certo também?
> > > Isso parece algo que esteja rodando no cron. Já verificou ele?
> > >
> >
> > Se eu desligar a máquina na terça à noite, e religa-la logo após a
> passagem
> > da faxineira, eu começo a trabalhar e ela para.
> > Já olhei se há crontab rodando como root e nada vi de especial. Desconfio
> > que o problema não seja de software (afinal, o FreeBSD-8.x tem rodado há
> > muito tempo, com muita estabilidade e nenhuma atualização de sistema foi
> > feita recentemente). Além disto, eu tenho outras máquinas rodando o 8.3 e
> > nenhuma delas trava.
> >
> >
> >
> > >
> > > > sucessor do sexta-feira 13 para sistemas unix :-)?. No início, eu
> achei
> > > que
> > > > pudesse ser a faxineira (que todas as quartas-feira limpa a sala, no
> > > Ahahaha é mesmo, pior que isso acontece. A empresa para a qual
> trabalhei
> > > uns anos atrás, tinha um cliente que reclamava que o sistema sempre
> caía
> > > todos os dias por volta das 12:00 e voltava uns 15 à 20 minutos depois.
> > > Como o cliente era perto de onde eu morava, marquei uma visita perto
> das
> > > 12:00, cheguei lá e fiquei sentado esperando dar o horário do problema.
> > > Quando foi por voltas das 12:05 me entra um funcionário deles apressado
> > > e dizendo: fome, muita fome. O dito cujo me abre a geladeira, cata uma
> > > marmita térmica, tira o switch principal da rede da tomada, como quem
> > > desliga uma cafeteira e coloca a marmita dele pra esquentar. HAhaHAhaH
> > > Finalmente descobrimos o mistério!
> > > Haviam outros casos também que o sistema parava sempre as 17:30 e aí
> > > quando fomos checar era a funcionária que queria sair mais cedo e dizia
> > > para o chefe que o sistema estava fora. rsrsrs
> > >
> >
> >
> >
> > É, tem de tudo no mundo da informática. Onde eu fiz pós-graduação, a rede
> > caía todos os dias entre 17:15 e 17:45. Após um tempo de procura,
> > descobrimos que um secretário, para "proteger" os dados de seu micro (que
> > ficava desligado quando ele saía) abria a rede (naquela época, usava-se
> um
> > longo cabo que percorria todo o prédio em forma de anel, onde as conexões
> > com os micros eram feitas através de um "T" que ligava o cabo à placa de
> > rede).
> >
> >
> > >
> > > > período da manhã), daí resolvi deixar a máquina desligada de terça à
> > > noite
> > > > até o momento da faxina acabar. De nada adiantou, e o micro
> congelava o
> > > > video e não aceitava mais comandos. Troquei então a placa de video
> (que
> > > > geralmente é a culpada quando a tela congela), e de nada adiantou.
> > > > O mais estranho é que, de uns tempos para cá (não sei precisar a
> > data), o
> > > > top mostrava processamento nos núcleos de 0 a 4 (=5 núcleos, quando
> > antes
> > > > funcionavam 6). Ativando o corre unlocker na bios, notei que "5 cores
> > are
> > > > actived" (ou seja, o sexto núcleo está desligado).
> > > > A minha suspeita é que o processador ou a placa-mãe (ou ambos)
> estejam
> > > > danificados, porém, eu gostaria de ouvir a opinião dos caríssimos
> para
> > > > saber:
> > > Esse lance do processador pode estar influenciando mas o que me intriga
> > > é: por que sempre às quartas de manhã? rsrsrs
> > >
> > > > 1) Há algum software que me permita checar o funcionamento correto da
> > > > placa-mãe e do processador? Eu tenho usado o mbmon para monitar as
> > > > temperaturas e tensões do processador e placa-mãe, e parece estar
> tudo
> > > > normal.
> > > Ummm para teste de CPU não sei não. Acho que só usando algo para
> > > estressar eles.
> > >
> > >
> > Vou usar um teste passado  pelo Otacílio e debugado por vários usuários e
> > ver o resultado.
> > De qualquer forma, creio que o problema seja de hardware porque o
> > desaparecimento de um núcleo de processamento não pode ser efeito de uma
> > alteração causada pelo software.
> >
> > >
> > > > 2) O passo seguinte é substitur a(s) peça(s), mas temo que instalar
> um
> > > > processador novo (no mercado, agora, só há cpus com 4 núcleos para o
> > > socket
> > > > AM3) em uma placa-mãe avariada possa danificar o novo processador e
> não
> > > > resolver o problema.
> > > >
> > > > 3) Ao que tudo indica, as memórias estão em bom estado (estado do
> > Paraná
> > > > :-)), porque não ocorreram falhas de core dump (que, suponho eu,
> sejam
> > o
> > > > principal sintoma deste tipo de problema). Porém, não tenho certeza
> > disto
> > > > porque a ausênciaa de core dumps é baseada em uma suposição de alguém
> > que
> > > > não tem formação na área de informática ou eletrônica, e gostaria de
> > > ouvir
> > > > a opinião de pessoas mais habilitadas que eu neste assunto.
> > > Depende. Já tive um caso que não haviam segfaults aparentes mas a
> > > máquina estava travando direto. Passei um memtest e acusou 1 banco com
> > > problemas. Troquei o mesmo e tudo normalizou. Mas volto na questão..
> por
> > > que nas quartas pela manhã?  :)
> >
> > Parece que algo roda nesse dia. O padrão do periodic semanal é rodar aos
> > > sábados. Então não deve ser ele mas é melhor checar o seu.
> > >
> >
> > Como eu disse, não há crontab rodando neste horário.
> > Eu tentei ver se não era problema do S.O. então aproveitei uma instalação
> > do win7 (que estava quase esquecida em uma partição do HD). Bootei pelo
> > win7 e tudo (exceto o core faltante) estava rodando. O difícil é confiar
> no
> > resultado de um teste de hardware quando se usa um win7 como s.o. (que
> vai
> > dar problema, isto é certo, mas como garantir que o problema não foi
> > causado por um bug no sistema operacional e não no hardware). Pode
> parecer
> > estranho, mas há pessoas que juram que as máquinas rodando s.o. da
> > Microsoft estão sujeitas a travamentos :-).
> >
> >
> > Agradeço novamente a atenção
> >
> > Edu
> >
> >
> > >
> > > > Agradeço a atenção
> > > >
> > > >
> > > > Eduardo
> > > >
> > > > Eduardo Lemos de Sa
> > > > Associated Professor Level 3
> > > > Dep. Quimica da Universidade Federal do Paraná
> > > > fone: +55(41)3361-3300
> > > > fax:   +55(41)3361-3186
> > > > Voip Number call to (41) 33613600 (listen to the message and type
> > > 10531185)
> > > > -------------------------
> > > > Histórico: http://www.fug.com.br/historico/html/freebsd/
> > > > Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
> > > >
> > >
> > >
> > >
> > > -------------------------
> > > Histórico: http://www.fug.com.br/historico/html/freebsd/
> > > Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
> > >
> >
> >
> >
> > --
> > Eduardo Lemos de Sa
> > Associated Professor Level 3
> > Dep. Quimica da Universidade Federal do Paraná
> > fone: +55(41)3361-3300
> > fax:   +55(41)3361-3186
> > Voip Number call to (41) 33613600 (listen to the message and type
> > 10531185)
> > -------------------------
> > Histórico: http://www.fug.com.br/historico/html/freebsd/
> > Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
> >
> -------------------------
> Histórico: http://www.fug.com.br/historico/html/freebsd/
> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
>



-- 
Eduardo Lemos de Sa
Associated Professor Level 3
Dep. Quimica da Universidade Federal do Paraná
fone: +55(41)3361-3300
fax:   +55(41)3361-3186
Voip Number call to (41) 33613600 (listen to the message and type 10531185)


Mais detalhes sobre a lista de discussão freebsd