[FUG-BR] Recomendações e opiniões quanto a Linguagem e Codificação do sistema

Paulo Henrique - BSDs Brasil paulo.rddck em bsd.com.br
Terça Outubro 28 22:44:21 BRST 2014



Enviado do meu smartphone Sony Xperia™

---- Paulo Olivier Cavalcanti escreveu ----

> On 28/10/2014 18:40, Paulo Henrique - BSDs wrote:
> > Saudações,
> >
> > Estou padronizando a codificação e a linguagem dos servidores da 
> > empresa e ocorreu algumas dúvidas.
> > Atualmente estou padronizando tudo em pt_BR.ISO8859-1 e charset em 
> > iso-8859-1 devido ser a codificação que está no meu servidor de 
> > arquivos, não me recordo por que dessa codificação na época contudo 
> > gostaria de saber.
> >
> > Se eu alterar as configurações do charset para UTF-8 e da linguagem 
> > para pt_BR.UTF-8 os caracteres especiais com "ç" e "~" serão 
> > convertidos automaticamente ou ficaram como caracteres truncados ?
> > O Que o Srs. recomenda ou utilizam quanto a codificação, utilizam a 
> > UTF-8 ou a ISO-8859-1 ?
> > A codificação é levado em consideração durante a criação de um file 
> > system ou o file system se comporta conforme a locale do sistema.
> > Até o momento utilizava o padrão do sistema contudo estou tendo vários 
> > erros quanto tento usar o tar em servidores de locale diferente e é 
> > devido a isso que estou padronizando.
> > Qualquer informação e opnião será sempre bem vinda.
> >
> > Atenciosamente Paulo Henrique.
> >
> 
> Fala, xará.
> 
> Na empresa utilizamos pt_BR.UTF-8 nos 3 servidores, mas em casa eu já 
> fiz testes de conversão ISO8859-1 para UTF-8 e os caracteres acentuados 
> foram convertidos normalmente. Portanto a codificação não é na criação 
> do filesystem, e sim pelo locale através da libiconv.
> 
> Ah, eu estou usando aquela sua solução de substituir o tar.gz pelo 
> tar.bz2 em nossos backups MySQL e a acentuação funciona perfeitamente! 
> Valeu pela dica! :)
> 

Fala xará, o problema de pontuação do tar é no path-name e não no interior do arquivo em si.
Por exemplo, se criar uma pasta com chamada "/home/usuario/ação" e dentro dela estiver um arquivo mesmo com nome normal durante a criação do tar o tar vai retornar um warning informando que não foi possível fazer a conversão daquele path-name.
Isso acontece quando se copia entre servidor com o locale diferente por exemplo em um esta em charset=iso-8859-1 e no destino esta o charset default do sistema. 

No caso do GZ, o lance é mais na hora de recuperar o arquivo e ele estiver corrompido,  no gz não se consegue pegar as demais informações apos o ponto corrompido do arquivo enquanto que com bzip2 ele só ignorá o pedaço do arquivo corrompido. 

Efetuei alguns testes em dois servidores aqui na empresa para ver o lance de alterar a codificação para UTF-8 e realmente não tive problemas na conversão entre a iso88
Att.59-1 e utf-8, acho que o problema só ocorre quando usa o padrão do sistema sobre um arquivo ou pathname com caracteres não reconhecidos por locale C.

Att. Paulo Henrique.
> -- 
> http://about.me/paulocavalcanti
> 
> -------------------------
> Histórico: http://www.fug.com.br/historico/html/freebsd/
> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd


Mais detalhes sobre a lista de discussão freebsd