flysmog.pages.dev

Como lidar com encoding UTF-8 em arquivos CSV no Windows?

Se você já se deparou com caracteres estranhos ou "lixo" ao abrir um arquivo CSV no Windows, o problema provavelmente está no encoding. O UTF-8 é o padrão mais usado para garantir que acentos e caracteres especiais sejam exibidos corretamente, mas o Windows nem sempre reconhece isso automaticamente. Felizmente, com alguns passos simples, você pode garantir que seus dados sejam lidos e salvos sem problemas.

Usando o Bloco de Notas para salvar em UTF-8

O Bloco de Notas, presente em todas as versões do Windows, permite salvar arquivos em UTF-8. Abra o arquivo CSV no Bloco de Notas, vá em Arquivo > Salvar como, escolha UTF-8 no menu suspenso Encoding, e salve com a extensão .csv.

Usando o Excel para abrir arquivos CSV em UTF-8

O Excel nem sempre detecta o encoding UTF-8 automaticamente. Para garantir que os caracteres sejam exibidos corretamente, siga estes passos:

  1. Abra o Excel e vá em Dados > Obter Dados > De Texto/CSV.
  2. Selecione seu arquivo CSV e clique em Importar.
  3. Na janela que aparecer, escolha 65001: Unicode (UTF-8) no menu Arquivo Original.
  4. Clique em Carregar para importar os dados para uma nova planilha.

Convertendo arquivos CSV para UTF-8 via PowerShell

Se você precisa processar vários arquivos ou automatizar a tarefa, o PowerShell é uma ótima opção. Use o seguinte script para converter um arquivo CSV para UTF-8:

# Carrega o conteúdo do arquivo original
$conteudo = Get-Content -Path "caminho\para\arquivo.csv" -Encoding Default

# Salva o conteúdo em UTF-8
$conteudo | Out-File -FilePath "caminho\para\arquivo_utf8.csv" -Encoding UTF8

Substitua "caminho\para\arquivo.csv" pelo caminho do seu arquivo original e "caminho\para\arquivo_utf8.csv" pelo caminho desejado para o novo arquivo.

Exemplo Prático

Veja como os dados aparecem antes e depois da conversão para UTF-8:

Conteúdo Original (Encoding Incorreto) Conteúdo Após Conversão (UTF-8)
Nome;País Nome;País
João;Porto Alegre João;Porto Alegre
María;Madrid María;Madrid

Conclusão

Com estas técnicas, você garante que seus arquivos CSV sejam lidos e salvos corretamente em UTF-8, evitando problemas com acentos e caracteres especiais. Seja usando o Bloco de Notas, o Excel ou o PowerShell, a solução é simples e eficaz para qualquer situação no Windows.