http://www.zago.eti.br/idioma.txt FAQ com mensagens sobre idioma na configuração do teclado e do Linux. Pra configurar o teclado veja em: http://www.zago.eti.br/teclado.txt Use CTRL+F para refinar a pesquisa. Linha de: **************** separa mensagens ou tópicos. ******************************************************** Zago http://www.zago.eti.br/menu.html FAQ e artigos sobre Linux LANG é uma variável de ambiente, pra ver o idioma em uso, digite no terminal: echo $LANG Faça as alterações no arquivo: /etc/sysconfig/i18n Pra visualizar o conteúdo deste arquivo, execute: cat /etc/sysconfig/i18n Comando pra pegar o idioma em uso: locale | grep LANG | cut -d "=" -f 2 retorna somente o idioma, ex.: pt_BR Ou o resultado completo, exemplo: [zago@faqcl10 guiaz]$ locale LANG=pt_BR LC_CTYPE="pt_BR" LC_NUMERIC="pt_BR" LC_TIME="pt_BR" LC_COLLATE=POSIX LC_MONETARY="pt_BR" LC_MESSAGES="pt_BR" LC_PAPER="pt_BR" LC_NAME="pt_BR" LC_ADDRESS="pt_BR" LC_TELEPHONE="pt_BR" LC_MEASUREMENT="pt_BR" LC_IDENTIFICATION="pt_BR" LC_ALL= Para mudar o idioma, tente: export LANG=pt_BR iconv --help Usage: iconv [OPTION...] [FILE...] Convert encoding of given files from one encoding to another. ******************************************************** Converter resultados de ls para outro idioma. Quando resultado de ls apresentar caracteres estranhos em lugar de acentos, principalmente arquivos copiados de instalações windows ou acesso a diretórios Samba. Tente exibir em outro idioma como nestas opções. LC_ALL=pt_BR.ISO-8859-1 ls LC_ALL=pt_BR.utf8 ls LC_ALL=pt_BR.UTF-8 ls Não altera no sistema, faça testes com exemplo acima e somente com ls para ver se muda o resultado, exibe corrretamente arquivos com acentos no nome. ******************************************************** Editor kate no SUSE 10 x86_64. Problemas ao migrar do CL10 para SUSE 10 Não lembro dos detalhes, acho que deu problema também com OpenSUSE 10, ou em outra instalação de testes, ao abrir os documentos texto no kate, truncava todas as palavras acentuadas, (c cedilha a til o ção), fica (instala�o), em outra instalação isto não ocorreu, deve ser algo relacionado ao idioma selecionado na instalação. Nestes testes, os arquivos texto é a copia do FAQ do CL10 para SUSE10. Nesta versão não achei kedit nem kwrite, muito estranho, achei o "kate", então resolvi tentar com ele, até gostei dele no inicio, leve, tem contador de linhas e colunas, tudo ia muito bem até que ao responder uma mensagem da lista, precisei copiar parte de um texto do FAQ, ao abrir o documento com kate, copiar o texto e colar no Evolution, truncou todo o texto, veja imagem (tela capturada) após copiar este mesmo texto para o corpo da mensagem no evolution; http://www.zago.eti.br/figuras/evolution-idioma.jpg Este erro ocorre somente quando tem palavras acentuadas como (ção) e somente quando copiar do editor kate para Evolution, copiando este mesmo texto problemático a partir do OOffice ou do firefox, pode colar no Evolution sem problema, também a copia deste texto direto do kate mas sem as palavras acentuadas não dá problema, concluindo, o problema está no editor "kate", especificamente no tratamento de palavras acentuadas, só não descobri a solução, já tentei varias.... Alguns dados sobre a configuração e alterações que tentei. Na instalação do SUSE vem com esta configuração. suse64:~ # echo $LANG POSIX suse64:/tmp # locale LANG=POSIX LC_CTYPE=pt_BR LC_NUMERIC="POSIX" LC_TIME="POSIX" LC_COLLATE="POSIX" LC_MONETARY="POSIX" LC_MESSAGES="POSIX" LC_PAPER="POSIX" LC_NAME="POSIX" LC_ADDRESS="POSIX" LC_TELEPHONE="POSIX" LC_MEASUREMENT="POSIX" LC_IDENTIFICATION="POSIX" LC_ALL= Alterações efetuadas no sistema. Editar /etc/profile e acrescentar esta linha no final export LANG=pt_BR Depois da alteração acima, reiniciei o micro e voltou com este resultado; zago@suse64:~/guiaz> locale LANG=pt_BR LC_CTYPE="pt_BR" LC_NUMERIC="pt_BR" LC_TIME="pt_BR" LC_COLLATE="pt_BR" LC_MONETARY="pt_BR" LC_MESSAGES="pt_BR" LC_PAPER="pt_BR" LC_NAME="pt_BR" LC_ADDRESS="pt_BR" LC_TELEPHONE="pt_BR" LC_MEASUREMENT="pt_BR" LC_IDENTIFICATION="pt_BR" LC_ALL= Mesmo assim continua truncando a copia do kate para Evolution. Estou executando o Evolution a partir do KDE, meu pefir de instalação foi selecionado o KDE, no evolution não tem opção para utf-8, tem algo estranho, então simplifiquei mudando tudo para 8859-1, kate aceita UTF mas deixa os documentos sem acentos e c cedilha, remove todos os caracteres acentuados, quando configurado para usar acentos passa a falhar a copia para evolution mas recebe a copia do Evolution sem problemas, não tem este mesmo problema com outros editores, "vi", OpenOffice e etc... Não acertei ou não está casando o uso do kate com Evolution. Estou partindo para outro editor..... Mais algumas tentativas a tentar. Instalar o Gnome e configurar o idioma, instalei somente o Evolution, não está permitindo algumas configurações de idioma nem uso de dicionario em português, tentar inverter a ordem, usar o kate a partir do Gnome. Outro teste, alterei /etc/profile para; export LANG=pt_BR.UTF-8 No konsole ou console aberto a partir de CTRL+ALT+F1, a variável LANG exibe resultado diferente para root e usuário comum, acentuação funciona normal nos dois, mas veja os dois resultados; suse64:~ # echo $LANG pt_BR.UTF-8 zago@suse64:~> echo $LANG pt_BR ******************************************************** De:  Syndson Responder-a:  Syndson Para:  guerreiro-graciano Cc:  linux-br@bazar.conectiva.com.br Assunto:  Re: (linux-br)X-WinCommander on line. Mudou a página. Data:  Thu, 14 Aug 2003 11:28:04 -0200 Olá! O i18n (suporte a internacionalização) é o que permite aos programas Linux mostrar os menus, legendas, etc., na sua língua natal (no nosso caso, português). O Kde, Gnome, Linuxconf, X-Cd-Roast são exemplos de programas que usam i18n.  Se não usassem, você seria obrigado a lidar com os menus em inglês. O XWC só tinha legendas em inglês, o que impedia de ser usado por quem não sabe a língua.  Agora, com o suporte a internacionalização incluso, não só temos a versão em português, como a em espanhol, em francês e até em búlgaro!  E a tendência é ter até em chinês. Espero ter esclarecido. Syndson Silva. --------- Mensagem Original -------- De: "guerreiro-graciano" O que vem a ser a i18n que voce fala no texto abaixo... > Para quem não conhece, X-WinCommander é um gerenciador de arquivos mais simples,(... corta...) Agora já há, a um bom tempo, no sourceforge, uma versão com suporte a i18n (traduções). ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br) /* Acentuação no linux Data:  Wed, 5 May 2004 13:35:11 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Wils wrote: >Pessoal, > >Recentemente instalei o Fedora, já havia percebido q as palavras > acentuadas estavam sendo mostradas de forma errada, >daí ignorei, pensei q fosse bobeira... Qual é o seu $LANG? E de onde vêm as palavras acentuadas que aparecem erradas? Do próprio sistema ou de algum arquivo que você abriu? Está claro para mim que você está tendo problemas de codificação. O Red Hat e o Fedora usam codificação Unicode, ao passo que o padrão anterior era o Latin 1 (ISO-8859-1). - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint: ******************************************************** De:  Thiago Macieira Para:  Wils Cc:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)/* UFT8 ? <<Qndo eu abria uma pagina ele não reconhecia a acentuação, o apache > estava enviando a pagina como padrao em UTF8, >eu comentei a linha do UTF8 no http.conf e agora esta funcionando > normal, Sintoma de que você não tinha escrito a página em UTF-8 como deveria. > porém tenho outros problemas 1 deles >é q quando dou um "ls" em por exemplo /home/arquivos ele mostra "josé" > como "jos?" ou seja, não está reconhecendo a acentuação. Ainda preciso de mais informações. Em especial, preciso saber exatamente qual é esse byte do acento. (Como: echo jos | od -tx1) Você falou de ls. Em qual terminal? Qual é a codificação desse terminal? Você a configurou para ser a mesma do seu shell? Se não sabe, diga que não sabe, mas não deixe de responder. >declare -x LANG="en_US" Língua americana, com codificação ISO-8859-1 ou ASCII. Não lembro qual das duas. Se for ASCII, isso explica a falta de acentos. Use "pt_BR". Ou "pt_BR.UTF-8" (que é o que eu estou usando e sem problemas). >[root@server root]# testparm >[global] [corta] Não estou vendo o parâmetro "unix charset" no seu smb.conf. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint: De:  Thiago Macieira Para:  Wils Cc:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)/* UFT8 ? << dados q a pagina puxa >do bco de dados (MySQL), ou seja, a pagina esta codificada em UTF8 ( >dreamweaver ja faz isso =) ) porem os dados no >MySQL não são convertidos em UTF8. >Nunca converti e tb não conheço quem faça isso, simplesmente damos um: > INSERT INTO tabela(id, nome) VALUES (1, 'josé maria') Não, MySQL não sabe nada de UTF-8. Quem tem que converter é você. >R: Po manero, gostei desse lance do echo =) Cool, aí vai o resultado >brother: >[root@server ]# echo Projeto\ B sico_aeronautica.doc | od -tx1 >0000000 50 72 6f 6a 65 74 6f 20 42 a0 73 69 63 6f 5f 61 >0000020 65 72 6f 6e 61 75 74 69 63 61 2e 64 6f 63 0a >0000037 >[root@server ]# Temos um á (U+00E1) formatado como 0xA0. Veja: $ echo -n á | iconv -t cp850 | od -tx1 0000000 a0 Ou seja: foi gravado com CodePage 850. >R: Rapaz, isso acontece tanto no putty quanto diretamente no Shell... >Eu não sei a codificação, onde vejo? No /etc/bashrc ? No console, depende se você ativou com um comando especial. Num terminal X, geralmente vai depender do LANG com o qual o programa foi iniciado (konsole e xterm), mas pode ser configurável pelos menus. No caso do PuTTY, está nas configurações dele em algum lugar, antes de abrir a conexão. Depois que abriu, não tem como mudar. >R: Hummm, onde posso mudar no /etc/sysconfig/i18n ? >Se sim, olha como ele está: > >[root@server ]# cat /etc/sysconfig/i18n >LANG="en_US.UTF-8" >SUPPORTED="en_US.UTF-8" >SYSFONT="lat1-16" >[root@server ]# Estranho. Veja seus outros scripts de login para certificar-se de que nenhum deles muda o LANG. >        unix charset = iso-8859-1 Agora parece certo para Latin 1. Apenas decida qual deles usar (Latin 1 ou UTF-8), porque seu sistema aparentemente está indeciso ainda. Veja agora o que acontece para um arquivo novo acentuado. Creio que todos os nomes de arquivos acentuados terão que ser convertidos. Um script simples que tenta fazer isso é o seguinte (cuidado!):         for f in *; do                 new=`echo $f | iconv -f cp850`                 if [ "$f" != "$new" ]; then                         mv "$f" "$new"                 fi         done Cuidado para não executá-lo duas vezes num mesmo arquivo porque aí ele estragaria de vez os acentos. No meu sistema, eu tenho LANG=pt_BR.UTF-8 e unix charset = UTF-8. Funciona sem problemas. No MySQL, eu estoco os dados em UTF-8 diretamente, mesmo sabendo que ele não tem suporte para isso. O único problema que isso pode dar é na busca e comparação de caracteres não-ASCII, porque ele tenta e não consegue não diferenciar maiúsculas de minúsculas. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint: ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)/* Ainda - Caracteres invalidos.... Data:  Fri, 14 May 2004 10:59:55 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Wils wrote: >bash-2.05b$ service httpd restart >Parando o httpd: /etc/init.d/httpd: line 196: kill: (2549) - > Operação não permitida >/etc/init.d/httpd: line 201: kill: (2549) - Operação não permitida >rm: imposível remover `/var/run/httpd.pid': Permissão negadaLHOU] Aposto que seu LANG estava em UTF-8 mas seu terminal não. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint: ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)Problemas com codificação no slackware Data:  Mon, 17 May 2004 08:45:54 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 "Ederson L. Corrêa" wrote: >%%%%%%%%%%%%%%%%%%%%%%%%%%%%% >Um exemplo: > >O arquivo "Testando codificação.txt" aparece assim: > >konqueror -> Testando codificação.txt > >shell (e konsole tb) -> Testando\ codifica\303\247\303\243o.txt > >%%%%%%%%%%%%%%%%%%%%%%%%%%%%% > >Aparentemente, ele esta usando iso8859-1 ao invés de usar UTF-8 (q é o > q o winxp usa). É o contrário: ele está usando UTF-8 quando deveria estar usando ISO-8859-1. >mount -t vfat /dev/hdb2 /mnt/backup -o iocharset=utf-8 Aqui está o culpado. >Usando esse mesmo comando, eu monto essa partição com a codificação >correta no Fedora (onde a $LANG=en_US.UTF-8). Nesse caso está correto porque o seu LANG é UTF-8. Com LANG=C, você deve não deve usar acentos. Com LANG=en_US, use ISO-8859-1. (Isto é, LANG=C não é o mesmo que LANG=en_US) >Bom, minha dúvida é: Como faço para o Slackware (9.1 - current) usar a >codificação correta e montar esse volume corretamente ?? - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint: ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)Acentuacao no console do kernel 2.6.X errada Data:  Tue, 18 May 2004 12:39:37 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 José Colzani wrote: >Salve pessoal.... > >Ja estou usando o kernel 2.6.X aqui faz um tempinho, e esta tudo ok, >porem a unicao coisa que ainda nao consegui resolver sao os caracteres >acentuados e ate os simbolos de grau por exemplo que aparecem tudo >esquisito aqui. Por favor, defina "esquisito". O que era para aparecer e o que aparece? Qual é o seu $LANG? Se possível, passe também a string com acentos estranhos pelo od -tx1c  para sabermos quais caracteres são esses. (echo "string-estranha" | od - -tx1c) - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint: ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br) Desconfiguração de Letras no Samba Data:  Wed, 19 May 2004 21:16:36 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Herbert de Carvalho wrote: >Criei um servidor de arquivos no meu trabalho com o MDK 10 e samba. O Mandrake 10 usa UTF-8 por padrão, não? ># Definindo padrão de Caracteres >   character set = iso8859-1 Use UTF-8 aqui que todos os caracteres serão válidos. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint:     E067 918B B660 DBD1 105C  966C 33F5 F005 6EF4 5358 ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)[suse] configurar teclado us_international c/ acentuacao. Data:  Mon, 31 May 2004 21:23:34 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Hamacker wrote: >Oi gente, > >Instalei recentemente o SUSE Linux no meu notebook, e percebi que essa >distro tem um BUG, ele possui a opcao teclado layout ingles c/ >acentuacao brasil (Portugues Brasil - Acentuacao US) onde gera >caracteres tais como "a til" vira "a tremado", "cedilha" vira "c com >agudo", muito louca essa internacionalizacao. > >Caros colegas há como consertar isso : acentuac'ão ? Não é bug. O acento agudo com um C deve fazer o quê? C com acento agudo! Nada mais óbvio certo? Certo, exceto para nós brasileiros que estamos acostumados com ç. Quem escreveu o mapa de composição obviamente não sabia disso. Abra o seu mapa de composição (um arquivo chamado Compose no seu sistema - -- ache-o) e troque a combinação. Mais informações, consulte o histórico. Eu acho que já respondi umas cinco vezes. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint:     E067 918B B660 DBD1 105C  966C 33F5 F005 6EF4 5358 ******************************************************** De:  Thiago Macieira Para:  Tales Pinheiro de Andrade Cc:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)Problemas com codificação noKDE Data:  Mon, 28 Jun 2004 13:40:11 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Tales Pinheiro de Andrade wrote: >Pode ver nesse snapshot que tirei. >http://www.talesp.inf.br/~tales/snapshot.jpg >No icone do "Dispositivo de Gravação de CD", a sequencia "çã" não é > exibida corretamente. E no Konqueror, la no canto, o nome da pasta > "Aniversário Dácio" exibe um espaço no lugar dos caracteres > acentuados. Era de se esperar. Os acentos estão todos errados nesses arquivos. Renomeie-os. > Mas estranhamente nos menus do KDE e na pasta > "Escritório", além de diversos outros locais, os acentos são exibidos > corretamente. Aí eles estão corretos. > Se eu renomear o arquivo e colocar acentos, funciona > normalmente. Mas ter que renomear manualmente todos os lugares onde > aparece o problema vai dar um trabalho que eu não estou disposto a > encarar :-) Renomeie. É a solução. Você está usando UTF-8 no seu sistema, mas os nomes dos arquivos estão codificados em ISO-8859-1. Não vai funcionar mesmo. O pessoal vai lhe dizer para passar para ISO-8859-1. Não acho uma boa idéia. Vá de uma vez por todas para UTF-8. Fazer um script para renomear é fácil e rápido. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint: ******************************************************** De:  Chanderlie Freire de Santiago Cc:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)gdm e KDE - idioma Data:  Wed, 21 Jul 2004 14:49:42 -0300 Thiago Macieira wrote: Crie seu ~/.xsession, coloque lá: > > export LANG=pt_BR > exec /usr/bin/startkde "$@" > > Obviamente alterando a língua que deseja e acertando o caminho para o > startkde. Certifique-se que você está usando a sessão "default" ao > invés da "kde" no seu gdm. (Pelo menos é assim que funciona no kdm) > >   >    Dei ma olhada em xsession e acabei achando uma solução semelhante. Criar o arquivo ~/.profile e incluir "export LANG=pt_BR". Daí, as aplicações gtk ficaram em portugues e bastou mudar o idioma do KDE no kcontrol.   Obrigado pela dica do xsession. ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)gdm e KDE - idioma Data:  Mon, 19 Jul 2004 23:59:24 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Chanderlie Freire de Santiago wrote: > O problema ocorre quando inicio o > KDE a partir do gdm ou kdm. Aí a sessão de usuario segue o idioma do > sistema, independente do idioma configurado em "~/.bash_profile". Porque o ~/.bash_profile não é executado quando você faz o login gráfico. > Tem como mudar isso? A opcao para escolher o idioma no gdm nao > funciona com o KDE, nem mesmo nas aplicacoes GTK rodadas de dentro do > KDE. Crie seu ~/.xsession, coloque lá: export LANG=pt_BR exec /usr/bin/startkde "$@" Obviamente alterando a língua que deseja e acertando o caminho para o startkde. Certifique-se que você está usando a sessão "default" ao invés da "kde" no seu gdm. (Pelo menos é assim que funciona no kdm) - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint: ******************************************************** De:  Carlos Para:  Eddy Martins , linux-br@bazar2.conectiva.com.br Assunto:  RE: (linux-br)Mudando a linguagem do webalizer Data:  Wed, 28 Jul 2004 19:34:50 +0000    '>'instalei um pacote rpm no meu conectiva 9.0  '>'  '>'quero saber aonde esta o arquivo para eu mudar de en para pt_br ??  '>'  '>'alguem sabe e pode me ajudar, Obrigado  '>'  '>'--  Voce esta falando exatamente do que?   Existe um arquivo de linguagem do sistema: # cat /etc/sysconfig/i18n LANG=pt_BR LINGUAS=pt_BR LC_CTYPE=ISO-8859-1 LC_ALL=pt_BR SYSFONT=lat1u-16 SYSTERM=linux-lat   E outro que funciona no ambiente X que eh esse /etc/X11/XF86Config:          #Option      "XkbLayout" "us"          Option     "XkbLayout" "br" Isso permite acentuacao no X. Era isso que voce queria saber ? Nao entendi bem sua pergunta. ******************************************************** De:  Thiago Macieira Para:  Tales Pinheiro de Andrade Cc:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)Problemas com codificação noKDE Data:  Mon, 28 Jun 2004 20:00:14 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Tales Pinheiro de Andrade wrote: >Ah, se uso utf-8, emais que recebo vem errado na acentuação. Se uso > automatico também. Alguma idéia? Os _meus_ e-mails -- como provavelmente este aqui -- estão vindo errado com acentuação por causa de um bug na versão do KMail que vem com o KDE 3.3 beta1. Já foi corrigido hoje e vou providenciar uma atualização logo para esse problema sumir. Agora, o KMail funciona normalmente 100% com a codificação. Se você está vendo algo de estranho, pode apostar que a pessoa que mandou o e-mail não o mandou corretamente. Por exemplo, tem gente que manda e-mail acentuado sem que o cabeçalho diga qual é o charset. Pelas RFCs que regulam o MIME e os e-mails, se não está explícito, então é US-ASCII e, portanto, não pode ter acento. (É exatamente o problema deste e-mail que você está lendo agora. Veja os cabeçalhos!) Muitas dessas pessoas usam webmails conhecidos por aí... - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint: ******************************************************** De:  Rafael de Pauli Baptista Para:  linux-br@bazar2.conectiva.com.br Assunto:  (linux-br)Linguagem Gnome Data:  Sun, 23 May 2004 10:26:29 -0300 As palavras com acentuação quando uso o Gnome estão aparecendo tudo errado. Para tentar arrumar isso editei o arquivo /etc/sysconfig/i18n, segue as configurações que eu fiz: LANG="pt_BR.ISO-8859-1" SUPPORTED="en_US.UTF-8:en_US:en:pt_BR.UTF-8:pt_BR:pt:pt_BR.ISO-8859-1" SYSFONT="latarcyrheb-sun16" Para verificar se as modificações surtiram efeito, executei o comando set | grep LANG, e aí que eu achei estranho, se eu não uso o Gnome as seguintes linhas são exibidas: LANG=pt_BR.ISO-8859-1 Mas quando uso o Gnome as seguintes linhas são exibidas: GDM_LANG=pt_BR.UTF-8 LANG=pt_BR.UTF-8 Oque eu preciso fazer para que as palavras com acentuação sejam exibidas corretamente no meu Gnome? Minha distibuição é a RH9 e o meu gnome é o 2.2 Desde já agradeço a ajuda dos colegas De:  William da Rocha Lima Responder-a:  William da Rocha Lima Para:  Rafael de Pauli Baptista , linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)Linguagem Gnome Data:  Sun, 23 May 2004 22:50:27 -0300 Caro, Faz o seguinte:       1 - Logue-se como root.       2 - Abra o arquivo /etc/profile.       3 - Coloque os seguintes valores no arquivo:       # GNOME português-br       export LC_ALL=pt_BR       export LANG=pt_BR       export LC_CTYPE=ISO-8859-1       export LESSCHARSET=latin1       4 - Salve o /etc/profile.       5 - Recarregue o sistema com o comando:       # . /etc/profile       ou deslogando e logando novamente. :) Até, -- William da Rocha Lima wrochal@linuxit.com.br www.linuxit.com.br ******************************************************** De:  Thiago Macieira Para:  Raimundão Genmte Finah Cc:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br) localização Data:  Tue, 17 Aug 2004 21:57:46 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Raimundão Genmte Finah wrote: >Me viciei em console e gosto mais q o X (tb, com meu lerdinho....), >portanto tê-lo traduzido seria uma mão na roda. Mas ele mostra esses >caracteres. Será problema no bash, já que ele pode não suportar > unicode, como rxvt? Ok, deixe-me repetir: o problema é no rxvt. O bash não tem nada a ver com isso e seu exemplo mostrou que ele está funcionando a contento. Para ativar UTF-8 no console, rode isso:         echo -e '\033%G' Tente isso também no rxvt e veja se resolve o problema. Esse é o código que diz para o terminal "ative o modo UTF-8". Se funcionar, pode ser uma boa idéia colocar isso num script de inicialização. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint:     E067 918B B660 DBD1 105C  966C 33F5 F005 6EF4 5358 -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.2.4 (GNU/Linux) ******************************************************** De:  Thiago Macieira Para:  Raimundão Genmte Finah Cc:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br) localização Data:  Mon, 23 Aug 2004 20:25:49 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Raimundão Genmte Finah wrote: >>Os ? estão aí porque a locale em questão não foi bem construída com o >>comando localedef. Você precisa rodá-lo novamente. > >Acho q vc já tinha me dito isso antes. Como eu procedo? Quais arquivos >deve refazer, pois o comando sozinho não faz nada e nem encontrei man ou >info sobre ele? Estou indo agora procurar no google, mas gostaria de >algumas dicas. Só procurando no Google mesmo. Dê uma procurada por localedef de_DE.UTF-8 ou en_US.UTF-8 para encontrar algo semelhante. Lembre-se de rodar como root. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info     ICQ UIN: 1967141   PGP/GPG: 0x6EF45358; fingerprint:     E067 918B B660 DBD1 105C  966C 33F5 F005 6EF4 5358 ******************************************************** De:  Manoel Pinho Para:  Ruben Carlo Benante Cc:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br) Codificação UTF-8 ouISO-8859-1 Data:  Fri, 05 Nov 2004 16:54:24 -0200 Ruben Carlo Benante escreveu: Estou usando o SuSE 9.1, que vem por default com idioma > UTF-8. > Quando selecionei lingua portuguesa, mudou para > LANG=pt_BR.UTF-8 > > O LaTeX e 100% dos arquivos textos meus estão em ISO-8859-1, > então resolvi alterar a linguagem para > LANG=pt_BR.ISO-8859-1,  o que é bem mais fácil para mim, do > que recodificar todos meus arquivos. > > Agora eu pergunto: alguém sabe por que está vindo utf-8 como > default? Vocês tem dificuldades específicas resultantes de utilizar uma > codificação ou outra? E vantagens? E sobre "portabilidade" com o windows e > outros sistemas, qual é melhor? Também aqui surgem aqueles problemas de > acentuação em programas de email, pois o email é o típico arquivo que deve > ser lido em qualquer plataforma. Outra coisa relacionada ao assunto, é a > terminação do arquivo em CR_LF, só CR ou só LF? > > Enfim, pela padronização e pela portabilidade, alguém poderia acrescentar > alguns comentários sobre essa difícil escolha? >   > Saiba tudo sobre Unicode aqui: http://br-linux.org/noticias/003710.html O Ruindows não usa UTF8. Eu particularmente uso o bom e velho iso8859-1 porque já tive dores de cabeça com os caracteres acentuados e arquivos vindos do Windows. Pode ter sido ignorância minha, mas pelo menos até um certo tempo atrás ainda havia bugs e problemas relacionados ao uso do UTF-8. Como uso o Conectiva 10 e ele suporta oficialmente o iso8859-1 resolvi não mexer nisso. ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Cc:  Ruben Carlo Benante Assunto:  Re: (linux-br) Codificação UTF-8 ou ISO-8859-1 Data:  Thu, 4 Nov 2004 23:11:33 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Ruben Carlo Benante wrote: >Estou usando o SuSE 9.1, que vem por default com idioma >UTF-8. >Quando selecionei lingua portuguesa, mudou para >LANG=pt_BR.UTF-8 Ok, tudo normal até aí. > >O LaTeX e 100% dos arquivos textos meus estão em ISO-8859-1, >então resolvi alterar a linguagem para >LANG=pt_BR.ISO-8859-1,  o que é bem mais fácil para mim, do >que recodificar todos meus arquivos. Para o futuro, vale mais a pena recodificar... >Agora eu pergunto: alguém sabe por que está vindo utf-8 como >default? Porque UTF-8 é Unicode. Suporta todas as línguas e é usado nativamente em muitos dos protocolos mais novos. >Vocês tem dificuldades específicas resultantes de utilizar uma >codificação ou outra? Como você escreve ? em ISO-8859-1? Como escreve ?? Ou ??????????? >E vantagens? E sobre "portabilidade" com o windows > e outros sistemas, qual é melhor? UTF-8 funciona em todas as línguas, em todos os operacionais modernos. > Também aqui surgem aqueles problemas > de acentuação em programas de email, pois o email é o típico arquivo > que deve ser lido em qualquer plataforma. Não, não surge. Os emails *corretos* vem com o cabeçalho: Content-Type: text/plain; charset=iso-8859-1 ou Content-Type: text/plain; charset=utf-8 Isso existe há muitos e muitos anos. Quem está usando programas de emails de mais de 7 anos atrás vai encontrar problemas e acentuação vai ser o menor deles. O problema é que tem muito webmail por aí que não manda emails corretos. Exemplo: Yahoo. Outro problema é o Mailman que estraga o Subject: das mensagens (RFC 2047). > Outra coisa relacionada ao > assunto, é a terminação do arquivo em CR_LF, só CR ou só LF? No Unix, é LF. No Windows, é CRLF. No MAC, é CR (ou era). >Enfim, pela padronização e pela portabilidade, alguém poderia > acrescentar alguns comentários sobre essa difícil escolha? Não há escolha: UTF-8. PS: este email foi enviado em UTF-8. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info ******************************************************** De:  dvissotto@ufpr.br Para:  Ruben Carlo Benante Cc:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br) Codificação UTF-8 ouISO-8859-1 Data:  Fri, 5 Nov 2004 09:00:01 -0200 (BRDT) > > Enfim, pela padronização e pela portabilidade, alguém poderia acrescentar > alguns comentários sobre essa difícil escolha? > Rubens, fiz alguns comentários bem interessantes no artigo: http://www.vivaolinux.com.br/artigos/verArtigo.php?codigo=1398 Espero que possa te ajudar. Dornelles. ******************************************************** De:  Jorge Godoy Para:  Ruben Carlo Benante Cc:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)Re: Codificação UTF-8 ouISO-8859-1 Data:  Fri, 05 Nov 2004 22:17:23 -0200 Ruben Carlo Benante writes: > Um exemplo desse problema: assim que acabei de instalar o SuSE e ele estava em > UTF-8, eu instalei os patchs para tradução de diversos aplicativos, entre > eles o vi para KDE. Qual não foi minha surpresa quando vi que os próprios > menus estavam com a acentuação toda errada! Cheguei a editar o arquivo e > alterar alguns itens, mas desisti quando vi o tamanho do problema. Após eu > converter meu sistema para ISO-8859-1, eu entrei no VI e estavam todos os > menus corretos! (Ou seja, nem os tradutores oficiais do sistema linux > utilizam o UTF-8, mas preferem o ISO-8859-1). Duas perguntas:      - que tradutores oficiais do Linux?  O projeto LDP-BR, IIRC, não        tem uma tradução destas liberada e é o que eu chamaria de mais        oficial em termos de tradução e documentação no Brasil...        (Isso para não entrar no mérito de que vi roda em dezenas de        plataformas e é um projeto separado do Linux.  O Linux é apenas        mais uma plataforma suportada)      - quais as regras para tradução no projeto do vi?  Se as mesmas não        ditam o uso de UTF-8, então...  O KDE dita e, IIRC, o Gnome        também. O erro pode, também, estar no próprio vi.  No Emacs basta eu indicar qual a codificação usada no arquivo e pronto.  Posso usar virtualmente qualquer sistema de codificação (incluindo UTF-16 LE e BE). Sds, -- Godoy.     ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Cc:  Ruben Carlo Benante Assunto:  Re: (linux-br) Codificação UTF-8 ouISO-8859-1 Data:  Fri, 5 Nov 2004 23:15:46 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Manoel Pinho wrote: >>Enfim, pela padronização e pela portabilidade, alguém poderia >> acrescentar alguns comentários sobre essa difícil escolha? > >O Ruindows não usa UTF8. Usa sim. Até o Notepad usa UTF-8. Se você colocar algum caracter que não caiba no seu ISO-8859 padrão, o Notepad automaticamente (e sem lhe perguntar) salva como UTF-8. E ele detecta como tal pela presença do Byte Order Mark no começo do arquivo. O problema é que os arquivos do Linux e outros Unix não têm e nem vão ter Byte Order Mark. Imagine se fosse um script: os primeiros dois caracteres não seriam "#!". Outro exemplo são os nomes de arquivo: todos eles são gravados em Unicode (UTF-16) no disco. Já no Linux, tudo fica como 8-bit e o seu locale determina qual é a codificação padrão a ser usada. Eu estou com UTF-8 no meu sistema há um bom tempo e tenho quase nenhum problema. De vez em quando ainda dá alguma coisa errada com o MySQL (4.0 não tem suporte a charsets multi-byte) ou até o PHP. Ou então quando alguém me envia um arquivo texto por email. LaTeX funciona bem, meus programas funcionam bem, minhas páginas web também e por aí vai. O problema mais comum é o caso de pessoas que usam clientes de mail quebrados e não indicam o charset corretamente. (Eu ignoro esses emails) >Eu particularmente uso o bom e velho iso8859-1 porque já tive dores de >cabeça com os caracteres acentuados e arquivos vindos do Windows. Pode >ter sido ignorância minha, mas pelo menos até um certo tempo atrás ainda >havia bugs e problemas relacionados ao uso do UTF-8. Como uso o >Conectiva 10 e ele suporta oficialmente o iso8859-1 resolvi não mexer > nisso. A única coisa que eu não consegui fazer funcionar até hoje foi fazer a tecla seqüência virar " no X. Por isso minha tecla " é direto . (E o trema está quase abolido da Língua Portuguesa) - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Cc:  Ruben Carlo Benante Assunto:  Re: (linux-br)Re: Codificação UTF-8 ou ISO-8859-1 Data:  Fri, 5 Nov 2004 23:41:30 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Ruben Carlo Benante wrote: >ISO-8859-1: 10 pessoas >Win-1252: 2 pessoas O Win-1252 é um ISO-8859-1 (ou era o ISO-8859-15?) com alguns caracteres extras colocados no lugar de uns caracteres de controle que ninguém usa (entre 0x80 e 0x9F). Se não me engano, um deles era o próprio símbolo do Euro (?). >Mas outra coisa me chamou a atenção... Digam-me se estou errado: um > sistema configurado como ISO-8859-1 mas que tem instalado o utf-8 não > tem problemas nenhum de leitura de alfabetos diferentes. "Ter UTF-8 instalado" não faz sentido. Se você se refere a ter fontes com caracteres além do seu alfabeto, aí sim. > Tanto é que > acessei a página do UNICODE, e lá tem um documento com traduções em > tantas línguas quantas se queiram, árabe, chinês, etc... E eu consegui > ler todas. Você verá os caracteres se sua fonte os possuir. Mas eu nunca vi uma fonte 100% completa. Mesmo as mais completas (FreeSans, Arial Unicode, etc.) ainda faltam alguns caracteres. >Então a única limitação da máquina com ISO-8859-1 é que eu não vou > conseguir escrever em chinês. É isso? Não. Se você for no kcharselect, por exemplo, pode escolher a dedo os caracteres e colar no seu texto. Foi assim que eu escrevi "Kalashnikov" no alfabeto cirílico no outro email. >Outra impossibilidade de se trocar de ISO-8859-1 para UTF-8 em uma > máquina já rodando é que TODOS os arquivos, inclusive os de > configuração, teriam que ser recodificados. Errado. Apenas os arquivos de texto que estejam acentuados. Se o arquivo não estiver acentuado, então ele é ASCII e não há problemas. Você coloca acentos nos seus arquivos de configuração? Se põe, verifique que o programa em questão sabe lê-los. Se o arquivo não é de texto, não importa. Por exemplo, documentos do OpenOffice.org ou do KOffice vêm com a codificação marcada -- e acho que é UTF-8 mesmo. >Um exemplo desse problema: assim que acabei de instalar o SuSE e ele > estava em UTF-8, eu instalei os patchs para tradução de diversos > aplicativos, entre eles o vi para KDE. Que patches? Não se instala patches para a tradução. Basta instalar os pacotes que tragam os arquivos de mensagens e acertar o $LANG do sistema. (vi para KDE?) > Qual não foi minha surpresa > quando vi que os próprios menus estavam com a acentuação toda errada! E reparou que no resto do KDE estavam todas certas? E o interessante é que todo o código fonte do KDE é UTF-8 e todos os arquivos de tradução são UTF-8. Além disso, o seu sistema está cheio de arquivos .desktop que são UTF-8 (seu menu é composto de vários deles). Ainda assim, mesmo você tendo configurado seu sistema para ISO-8859-1, aparece certo. > Cheguei a editar o arquivo e alterar alguns itens, mas desisti quando > vi o tamanho do problema. Após eu converter meu sistema para > ISO-8859-1, eu entrei no VI e estavam todos os menus corretos! (Ou > seja, nem os tradutores oficiais do sistema linux utilizam o UTF-8, mas > preferem o ISO-8859-1). Hmm... como eu disse, todos os tradutores do KDE usam UTF-8, porque é obrigatório. No caso de outros projetos, deve ser semelhante. O seu problema deve estar no vi. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info ******************************************************** De:  Ricardo Igarashi Para:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)Re: Codificação UTF-8 ouISO-8859-1 Data:  Sat, 6 Nov 2004 00:10:16 -0200 On Fri, 5 Nov 2004 14:56:56 -0200 Ruben Carlo Benante wrote: > Mas outra coisa me chamou a atenção... Digam-me se estou errado: um > sistema configurado como ISO-8859-1 mas que tem instalado o utf-8 não > tem problemas nenhum de leitura de alfabetos diferentes. Tanto é que > acessei a página do UNICODE, e lá tem um documento com traduções em > tantas línguas quantas se queiram, árabe, chinês, etc... E eu consegui > ler todas. O navegador Web normalmente tem suporte próprio para várias línguas (você não precisa instalar os locales do japonês para ler páginas em japonês, apenas os fontes). > Então a única limitação da máquina com ISO-8859-1 é que eu não vou > conseguir escrever em chinês. É isso? Pois se for somente isso, acho > que mudar para UTF-8 não vai resolver o problema, pois vou continuar > sem conseguir escrever em chinês assim mesmo, que eu não sei P* > nenhuma de chinês! Você consegue escrever em chinês sem o Unicode, basta usar o locale da China. Idem para japonês, russo, etc. Só que você precisa ficar mudando o locale para cada língua. O que o Unicode permite é usar todas (humm, há controvérsias) as línguas sem nenhuma mudança, e ainda misturar várias línguas _num mesmo texto_, o que não é possível com o sistema atual (a não ser que o programa tenha um suporte multilíngua próprio). -- Ricardo Yassuo Igarashi E-mail: linux@tempestl.eng.br Linux HP: http://www.tempestl.eng.br/linux/ ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br)Re: Codificação UTF-8 ou ISO-8859-1 Data:  Sun, 7 Nov 2004 09:56:26 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Ricardo Igarashi wrote: >> Não. Se você for no kcharselect, por exemplo, pode escolher a dedo os >> caracteres e colar no seu texto. >> >> Foi assim que eu escrevi "Kalashnikov" no alfabeto cirílico no outro >> email. > >Isso porque o KDE usa o Unicode internamente, certo? Certo. >Um programa "normal" ("antigo", se preferir) não conseguiria mostrar >caracteres que não sejam do Locale usado. Hmm... certo também. Um programa normal de modo texto é restrito ao Locale. Há exceções, mas são poucas. Menos ainda são os programas que ativam UTF-8 no terminal para mostrar caracteres de fora do Locale. Um programa normal de modo gráfico é Unicode e pode mostrar caracteres de qualquer língua. Um programa Qt irá, ainda por cima, aceitar a entrada de qualquer caracter, mesmo de fora do Locale. O mesmo não ocorre com GTK (da última vez que eu testei) ou programas que usem X11 diretamente. Há exceções e esses eu chamo de "antigos". Esses não são Unicode internamente e, imagino eu, tenham problema com qualquer locale de caracteres multibyte. Nesse caso, não adianta LANG=pt_BR.UTF-8. PS: caracter multibyte = um mesmo caracter pode ocupar mais de um byte. Com UTF-8, pode ir de 1 a 4 bytes (em teoria 6, mas não existem caracteres com mais de 4). Existem outros, principalmente asiáticos, que usam essa característica. caracter largo (wide character - wchar_t) = todos os caracteres são do mesmo tamanho e ocupam mais de um byte. O exemplo é o UTF-32. UTF-16 é os dois: multibyte e largo, porque pode ocupar 2 ou 4 bytes. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info ******************************************************** De:  Thiago Macieira Para:  linux-br@bazar2.conectiva.com.br Cc:  Ruben Carlo Benante Assunto:  Re: (linux-br) CodificaçãoUTF-8 ouISO-8859-1 Data:  Sun, 7 Nov 2004 15:40:37 -0300 -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Ruben Carlo Benante wrote: >Tiago, veja um exemplo de problema:  a sua mensagem com a palavra >"Kalashnikov" veio para mim como cópia e também pela lista do linux-br. >Na mensagem diretamente para mim eu consegui ver os caracteres numa boa. Ok. > Na mensagem através da linux-br, que veio junto com o arquivamento de > diversas mensagens para o caso de quem assina em digest, veio toda > errada a acentuação! Problema no mailman ou no seu leitor de email. Mande a mensagem para mim, por favor, para que eu possa analisar. Se for um erro no KMail, é necessário corrigir. Se for no mailman, melhor desistir. Tem outros bugs feios que ninguém corrige, como o Subject desta mensagem (ele tira os espaços). >Outra coisa: perguntei a um amigo meu japonês, o cientista da computação >Shin-Ichi Maeda (quem consegue ler o nome dele em japonês? ????), como Aparece normal! > anda a coisa por lá. Ele disse que as pessoas usam o > charset=ISO-2022-jp. E que o UTF-8 é pouco conhecido. E quando querem > escrever para outras pessoas, em inglês, usam o charset=us-ascii. Em alguns casos, em outras línguas, a única opção é UTF-8. Quem escreve em inglês, não tem problema, porque o inglês só usa os caracteres do ASCII. Logo, tanto faz a codificação: a representação é a mesma. Por fim, mesmo que eu receba uma mensagem em ISO-2022-jp, meu KMail está configurado apenas para iso-8859-1, iso-8859-15 e utf-8. Então, se eu responder, sairá como UTF-8. >É bem por aí. O interessante é que com a divulgação de tantos charsets, > hoje os programas foram adaptados para tentar "adivinhar" o charset que > está recebendo, seja pelo comando charset=??? ou seja olhando pelos > códigos enviados. Às vezes eles se confundem, mas na grande maioria das > vezes fica tudo bem. Depois inventaram o UTF-8, que apesar de tentar > ser o último e único charset, por enquanto ele é apenas mais um, e > também pode ser reconhecido. Portanto o próprio UTF-8 se aproveita > dessa propriedade. Exato. - --   Thiago Macieira  -  Registered Linux user #65028    thiago (AT) macieira (DOT) info ******************************************************** De:  Ricardo Igarashi Para:  linux-br@bazar2.conectiva.com.br Assunto:  Re: (linux-br) CodificaçãoUTF-8 ouISO-8859-1 Data:  Sun, 7 Nov 2004 17:46:05 -0200 On Sun, 7 Nov 2004 12:12:41 -0200 Ruben Carlo Benante wrote: [corta]   > Outra coisa: perguntei a um amigo meu japonês, o cientista da > computação Shin-Ichi Maeda (quem consegue ler o nome dele em japonês? > ____________), como anda a coisa por lá. Ele disse que as pessoas usam > o charset=ISO-2022-jp. E que o UTF-8 é pouco conhecido. E quando > querem escrever para outras pessoas, em inglês, usam o > charset=us-ascii. O Japão é um caso especial :) Lá se usam 3 charsets: - Shift-JIS (ou MS-JIS): Usado no DOS/Win e Mac - EUC: Usado nos Unices, normalmente é usado no Linux também - JIS (ou ISO-2022-jp): Usado nos e-mails, porque é um charset de 7 bits. Pelo que sei, antigamente os MTAs só aceitavam caracteres de 7 bits, e por isso esse charset virou o padrão para e-mails. O Unicode, que seria o quarto charset, ainda não é muito usado para e-mails (embora o Outlook adore usá-lo). Aliás, os especialistas em língua japonesa detestam o Unicode porque fizeram umas simplificações que são inaceitáveis para eles... mas isso é uma outro história :) Portanto, assim como aqui no Brasil a maioria usa o ISO-8859-1 e nos EUA todos usam o ASCII, no Japão continuam a usar o JIS-2022-jp. Creio que vá mudar daqui para a frente, mas a inércia é grande :) > > Um programa "normal" ("antigo", se preferir) não conseguiria mostrar > > caracteres que não sejam do Locale usado. > > Ricardo, > > É bem por aí. O interessante é que com a divulgação de tantos > charsets, hoje os programas foram adaptados para tentar "adivinhar" o > charset que está recebendo, seja pelo comando charset=??? ou seja > olhando pelos códigos enviados. Às vezes eles se confundem, mas na > grande maioria das vezes fica tudo bem. Depois inventaram o UTF-8, que > apesar de tentar ser o último e único charset, por enquanto ele é > apenas mais um, e também pode ser reconhecido. Portanto o próprio > UTF-8 se aproveita dessa propriedade. Os programas de e-mail e de Web realmente "adivinham" o charset, mas acho que os demais não. -- Ricardo Yassuo Igarashi E-mail: linux@tempestl.eng.br Linux HP: http://www.tempestl.eng.br/linux/ ******************************************************** De: Dr.Beco Para: Lista Linux - BR Assunto: (linux-br)iso-8859-1 para utf-8 Data: Mon, 7 Mar 2005 14:18:52 -0300 Oi pessoal, Consegui a solução para esse problema. Estou repassando para ficar registrado aí na lista. Tente o comando: #recode -f iso88591/CRLF..utf8 * Abraços, Beco. > --------------- > Date: Wed, 2 Mar 2005 20:48:59 -0300 > Subject: (linux-br)iso-8859-1 para utf-8 > > Oi pessoal, > > Estou com um problema com o comando recode. > Por exemplo: > Imagine um arquivo texto.txt codificado como iso-8859-1, com conteúdo a > palavra "informática". > -- Dr. Beco "HUMANS do it better!" ******************************************************** De: Thiago Macieira Para: linux-br@bazar2.conectiva.com.br Assunto: Re: (linux-br)caracters no suse 9.1 Data: Thu, 3 Mar 2005 23:54:43 -0300 Fernando Novaes wrote: >Assim no como no Redhat estou com problemas com caracters e acentuação > no Suse 9.1. No lugar dos caracters e acentos ele exibe um pequeno > quadrado. Alguem sabe como faço para resolver este problema? Se puderem > me ajudar eu agradeço Grato. Fernando Mais informações! Isso acontece quando você digita? Ou quando você lê um arquivo já existente? Se é quando você digita, onde está digitando? Num terminal, num editor de textos, num navegador? GNOME, KDE, ou o quê? Se é num arquivo pré-existente, qual é a codificação que você usou no arquivo? E qual é a codificação do seu sistema (qual é o seu $LANG)? -- Thiago Macieira - thiago (AT) macieira (DOT) info ******************************************************** De: Thiago Macieira Para: linux-br@bazar2.conectiva.com.br Assunto: Re: (linux-br)Senha no ThunderBird e Acentos Windows Data: Wed, 23 Mar 2005 20:48:14 -0300 Gustavo Vasconcelos wrote: >> 2 -- Ao Acessar a partição FAT do meu Win através do KDE do Slack >> 10.1, as pastas cujos nomes levam acentos (â á ã ...) e "ç", são >> "quebrados", e isso acarreta erro em alguns aplicativos. Ao Utilizar o >> GQview, ele me fala sobre acertar o locale que atualmente está pt_BR >> para um outro de nome estranho.... Como fazer para acertar os nomes >> que levan acentos ? > >Você não citou que distribuição você usa, então eu só posso adivinhar >aqui. Provavelmente seu Linux utiliza codificação de caracteres UNICODE >(UTF-8), que o sistema de arquivos VFAT não suporta. Muito pelo contrário: a codificação nativa do VFAT é UTF-16. Mais Unicode que isso não tem. >Você deve modificar >seu Linux para usar a codificação ISO-8859-1 (Europa Ocidental), >editando o arquivo /etc/sysconfig/i18n e modificando a linha: > >LANG="pt_BR.UTF-8" Ou então ele deve simplesmente mudar o iocharset do ponto de montagem dele no /etc/fstab, para ser o mesmo que ele usa no ambiente: UTF-8 em ambos, ou ISO-8859-1 em ambos. Como ele não deu exemplo do que é "ser quebrado", não dá para adivinhar o que está acontecendo. -- Thiago Macieira - thiago (AT) macieira (DOT) info ******************************************************** De: dr.beco Para: Lista Linux-BR Assunto: (linux-br)Help: Problemas com cedilha no Linux Data: Sat, 9 Apr 2005 23:10:12 -0300 Olá Fausto, Rapaz, estou com o mesmo problema! Já tentei de tudo que eu sabia (que não é muito...) Escrevi para uma lista específica do suse mas até agora o problema não foi solucionado... Tenho que ficar teclando: alt+vírgula+c para conseguir a letra. Que horror! Não sei de quem foi a idéia obscura de fazer com que o agudo+C virasse um c-acentuado: ?! Veja só o que já fiz e não tive solução: Já procurei nos arquivos: /etc/defkeymap.map /etc/sysconfig/keyboard /usr/share/kbd/keymaps/include/compose.latin /usr/share/kbd/keymaps/include/compose.latin1 /usr/share/kbd/keymaps/include/compose.latin1.add /usr/share/kbd/keymaps/include/compose.latin1.cedilla /usr/share/kbd/keymaps/include/compose.utf8 /usr/share/kbd/keymaps/i386/qwerty/us-acentos.map.gz /usr/share/kbd/keymaps/i386/qwerty/br-latin1-us.map.gz mas apesar de editar esses arquivos e tentar lê-los com os comandos #loadkeys mapa #/etc/init.d/kbd restart nada acontece! Sempre ficam as mesmas teclas! Tentei até ler um mapa russo para ver se desconfigurava tudo de vez, mas nada acontece! Adicionei as linhas: compose '\'' 'c' to 'ç' em vários arquivos e tentei reiniciar o serviço ou reler os mapas, mas nada acontece! Alguém pode nos ajudar? Ah... Para constar: o problema é no Suse 9.2 num notebook toshiba A60, teclado americano. No suse 9.1, num desktop, teclado ABNT, tudo funciona beleza, inclusive o agudo+C é um c-cedilha. Obrigado, Beco. De: Thiago Macieira Para: linux-br@bazar2.conectiva.com.br Cc: dr.beco Assunto: Re: (linux-br)Help: Problemas com cedilha no Linux Data: Sun, 10 Apr 2005 00:42:33 -0300 dr.beco wrote: >Já procurei nos arquivos: >/etc/defkeymap.map >/etc/sysconfig/keyboard >/usr/share/kbd/keymaps/include/compose.latin >/usr/share/kbd/keymaps/include/compose.latin1 >/usr/share/kbd/keymaps/include/compose.latin1.add >/usr/share/kbd/keymaps/include/compose.latin1.cedilla >/usr/share/kbd/keymaps/include/compose.utf8 >/usr/share/kbd/keymaps/i386/qwerty/us-acentos.map.gz >/usr/share/kbd/keymaps/i386/qwerty/br-latin1-us.map.gz > >mas apesar de editar esses arquivos e tentar lê-los com >os comandos >#loadkeys mapa >#/etc/init.d/kbd restart >nada acontece! Esses são os arquivos do console! No X, é este: /usr/X11R6/lib/X11/locale/en_US.UTF-8/Compose No Conectiva, vem um /usr/X11R6/lib/X11/locale/pt_BR.UTF-8/Compose que é idêntico ao primeiro, exceto pela combinação . As vantagens de ter uma distro brasileira :-) -- Thiago Macieira - thiago (AT) macieira (DOT) info PGP/GPG: 0x6EF45358; fingerprint: De: Ricardo Igarashi Para: linux-br@bazar2.conectiva.com.br Assunto: Re: (linux-br)Help: Problemas com cedilha no Linux Data: Sun, 10 Apr 2005 00:29:18 -0300 On Sat, 9 Apr 2005 23:10:12 -0300 "dr.beco" wrote: > Olá Fausto, > > Rapaz, estou com o mesmo problema! > Já tentei de tudo que eu sabia (que não é muito...) > > Escrevi para uma lista específica do suse mas até agora o problema > não foi solucionado... [cut] Tente: http://www.tempestl.eng.br/linux/doc/redhat.html http://www.tempestl.eng.br/linux/doc/gtk2.html Ah sim, o "c com agudo" é usado em algumas línguas européias. Quando você usa o Unicode, que tem que funcionar com todas as línguas (teoricamente :)), o padrão vira "c com agudo" e não o ce-cedilhado. -- Ricardo Yassuo Igarashi E-mail: linux@tempestl.eng.br Linux HP: http://www.tempestl.eng.br/linux/ ******************************************************** De: Dr.Beco Para: Lista Linux - BR Assunto: (linux-br)Help: Problemas com cedilha no Linux Data: Sun, 10 Apr 2005 10:53:01 -0300 Caros(as) Thiago, Fausto, lista, Resolvi o problema seguindo a dica dada pelo Thiago: Edite o arquivo: file:/usr/X11R6/lib/X11/locale/en_US.UTF-8/Compose comente as linhas: # : "?" U0106 # LATIN CAPITAL LETTER C WITH ACUTE # : "?" U0107 # LATIN SMALL LETTER C WITH ACUTE e acrescente as linhas: : "Ç" U00C7 # LATIN CAPITAL LETTER C WITH CEDILLA : "ç" U00E7 # LATIN SMALL LETTER C WITH CEDILLA Depois disso, fui no YAST e selecionei novamente o tipo de teclado (o mesmo que estava antes, só para dar um tipo de restart). Tudo funciona agora com o ç usando o acento agudo. Vc precisa reiniciar todos os programas para que o efeito seja sentido. Ainda não testei o boot com o console apenas. Obrigado! Beco. -- Ruben Carlo Benante UFPE - Universidade Federal de Pernambuco ******************************************************** De: Dr.Beco Para: Lista Linux - BR Assunto: (linux-br)Ver a codificação do arquivo (UTF8, ISO ou outra) Data: Wed, 4 May 2005 01:09:54 -0300 Pessoas, Sei que parece muito simples, mas é interessante; Tempo atrás precisei ver qual a codificação de um arquivo latex (se era ISO8859-1 ou UTF8) e me recomendaram: * apagar o preâmbulo do arquivo e depois usar #file arquivo.tex * Se vc usar diretamente #file -i arquivo.tex então não precisa apagar o preâmbulo do arquivo! Abraços, Ruben. -- Ruben Carlo Benante UFPE - Universidade Federal de Pernambuco ******************************************************** ********************************************************