{"id":94,"date":"2013-07-17T22:36:29","date_gmt":"2013-07-17T22:36:29","guid":{"rendered":"https:\/\/dev.cardume.art.br\/toolkit\/?p=94"},"modified":"2014-11-14T18:50:46","modified_gmt":"2014-11-14T18:50:46","slug":"cleaning-data-with-refine","status":"publish","type":"post","link":"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/","title":{"rendered":"Limpeza de Dados com o Refine"},"content":{"rendered":"<!DOCTYPE html PUBLIC \"-\/\/W3C\/\/DTD HTML 4.0 Transitional\/\/EN\" \"http:\/\/www.w3.org\/TR\/REC-html40\/loose.dtd\">\n<html><body><p><\/p>\n<p><\/p><p>O Open Refine (previamente Google Refine) &eacute; um programa de limpeza de dados que utiliza o seu navegador de internet como interface. Isso significa que parece que ele atua na internet, mas todos os seus dados permanecem na sua m&aacute;quina e voc&ecirc; n&atilde;o precisa de uma conex&atilde;o de internet para trabalhar com eles.<\/p>\n<p><!--more--><\/p>\n<p>O maior objetivo do Refine &eacute; ajudar voc&ecirc; a explorar e limpar os seus dados antes de utiliz&aacute;-los. Foi constru&iacute;do para grandes conjuntos de dados &ndash; ent&atilde;o n&atilde;o se preocupe, desde que as suas planilhas possam armazenar as informa&ccedil;&otilde;es, o Refine tamb&eacute;m pode.<\/p>\n<h2 id=\"criar-um-novo-projeto\" class=\"summary-item\"><a href=\"#criar-um-novo-projeto\">Criar um novo Projeto<\/a><\/h2>\n<p>Para trabalhar com seus dados no Refine, voc&ecirc; precisa come&ccedil;ar um novo projeto.<\/p>\n<p><strong>Passo a passo: Criar um projeto Refine<\/strong><br> \r\n\t\t\t<div class='et-tabs-container et_sliderfx_fade et_sliderauto_false et_sliderauto_speed_5000 et_slidertype_top_tabs'>\r\n\t\t\t\t<ul class='et-tabs-control'>\r\n\t\t\t<li><a href='#'>\r\n\t\t\tPasso 1\r\n\t\t<\/a><\/li> \r\n\t\t<li><a href='#'>\r\n\t\t\tPasso 2\r\n\t\t<\/a><\/li> \r\n\t\t<li><a href='#'>\r\n\t\t\tPasso 3\r\n\t\t<\/a><\/li>\r\n\t\t<\/ul> <!-- .et-tabs-control --> \r\n\t\t<div class='et-tabs-content'>\r\n\t\t\t<div class='et-tabs-content-wrapper'>\r\n\t\t\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>D&ecirc; in&iacute;cio ao Refine: uma janela ser&aacute; aberta no navegador indicando <a href=\"https:\/\/127.0.0.1:3333\" target=\"_blank\">https:\/\/127.0.0.1:3333<\/a>. Se isso n&atilde;o acontecer, abra o link diretamente em uma janela nova<\/li>\n<li>Crie um novo projeto: na aba esquerda, selecione &ldquo;Create Project&rdquo;:<img loading=\"lazy\" decoding=\"async\" style=\"margin: 15px 610px 0px 0px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png\" width=\"170\" height=\"183\"><\/li>\n<\/ol>\r\n\t\t<\/div>\r\n\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>Clique em &ldquo;Choose Files&rdquo; para escolher o arquivo que voc&ecirc; baixou e clique em &ldquo;next&rdquo; &ndash; voc&ecirc; tamb&eacute;m pode utilizar o URL para o CSV direto, se os seus dados estiverem armazenados na rede.<\/li>\n<li>Voc&ecirc; ter&aacute; uma pr&eacute;via em como a limpeza vai interferir nos seus dados. Se selecionou um CSV bem formatado ou outro arquivo, isso deve acontecer automaticamente.<\/li>\n<li>Fa&ccedil;a uma revis&atilde;o da pr&eacute;via com aten&ccedil;&atilde;o para ter certeza que os dados est&atilde;o corretos. Verifique duas vezes os c&oacute;digos de caracteres. Muitos dados, mesmo que n&atilde;o todos, utilizam UTF-8 nos dias de hoje, mas tenha certeza que voc&ecirc; n&atilde;o est&aacute; visualizando nenhum caractere esquisito na sua revis&atilde;o.<\/li>\n<li>No nosso caso, nenhuma coluna tem t&iacute;tulo &ndash; a primeira fileira do arquivo est&aacute; em branco.<img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-278 aligncenter\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia03.png\" width=\"531\" height=\"255\" srcset=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia03.png 531w, https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia03-300x144.png 300w\" sizes=\"auto, (max-width: 531px) 100vw, 531px\" \/><\/li>\n<\/ol>\r\n\t\t<\/div>\r\n\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>Se voc&ecirc; verificar mais para baixo, ver&aacute; que os t&iacute;tulos das colunas para os dados est&atilde;o nas fileiras 5 e 6.<\/li>\n<li>Vamos contar ao Refine onde encontrar as informa&ccedil;&otilde;es das colunas: na parte de baixo, voc&ecirc; encontra informa&ccedil;&otilde;es sobre como a limpeza ter&aacute; efeito sobre as informa&ccedil;&otilde;es das colunas.<\/li>\n<li>Dizemos para ignorar as cinco primeiras linhas, considere as duas pr&oacute;ximas linhas como etiquetas para as colunas e ignore o restante:<\/li>\n<\/ol>\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-279 aligncenter\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia04.png\" width=\"485\" height=\"99\" srcset=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia04.png 485w, https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia04-300x61.png 300w\" sizes=\"auto, (max-width: 485px) 100vw, 485px\" \/><\/p>\n<ol>\n<li>&Oacute;timo &ndash; agora a visualiza&ccedil;&atilde;o pr&eacute;via est&aacute; bem melhor.<\/li>\n<li>D&ecirc; um nome ao seu projeto na caixa no lado superior direito e clique em &ldquo;Create Project&rdquo;.<\/li>\n<li>O projeto vai abrir no visualizador de projetos, esta &eacute; a interface b&aacute;sica em que voc&ecirc; vai trabalhar: por padr&atilde;o, o Refine mostra apenas 10 linhas de dados. Voc&ecirc; pode modificar isso na barra acima das linhas de dados. Voc&ecirc; tamb&eacute;m pode utilizar a navega&ccedil;&atilde;o &agrave; direita para ver as linhas pr&eacute;vias e anteriores.<\/li>\n<\/ol>\r\n\t\t<\/div>\r\n\t\t\t<\/div>\r\n\t\t<\/div>\r\n\t\t\t<\/div> <!-- .et-tabs-container --><\/p>\n<p>Agora voc&ecirc; criou com sucesso o seu primeiro projeto Refine. Lembre-se: apesar dele ser executado em um navegador de internet, o servidor do Refine est&aacute; na sua m&aacute;quina, todos os dados est&atilde;o ali (ent&atilde;o, nada de preocupa&ccedil;&atilde;o se voc&ecirc; est&aacute; lidando com informa&ccedil;&otilde;es confidenciais).<\/p>\n<h2 id=\"classificar-e-filtrar\" class=\"summary-item\"><a href=\"#classificar-e-filtrar\">Classificar e Filtrar<\/a><\/h2>\n<p>Uma vez que criamos o nosso projeto, vamos seguir e explorar um pouco os dados e a interface do Refine. Utilizar o Refine pode intimidar no come&ccedil;o, j&aacute; que parece t&atilde;o diferente de planilhas, mas assim que voc&ecirc; se habituar, vai perceber qu&atilde;o f&aacute;cil &eacute; us&aacute;-lo.<\/p>\n<p>Uma das fun&ccedil;&otilde;es geralmente usadas nas planilhas &eacute; classificar e filtrar dados &ndash; para descobrir m&iacute;nimos, m&aacute;ximos ou caracter&iacute;sticas de certas categorias. O Refine pode fazer o mesmo.<\/p>\n<p><strong>Passo a passo: Classificar linhas<\/strong><br> \r\n\t\t\t<div class='et-tabs-container et_sliderfx_fade et_sliderauto_false et_sliderauto_speed_5000 et_slidertype_top_tabs'>\r\n\t\t\t\t<ul class='et-tabs-control'>\r\n\t\t\t<li><a href='#'>\r\n\t\t\tPasso 1\r\n\t\t<\/a><\/li> \r\n\t\t<li><a href='#'>\r\n\t\t\tPasso 2\r\n\t\t<\/a><\/li> \r\n\t\t<li><a href='#'>\r\n\t\t\tPasso 3\r\n\t\t<\/a><\/li>\r\n\t\t<\/ul> <!-- .et-tabs-control --> \r\n\t\t<div class='et-tabs-content'>\r\n\t\t\t<div class='et-tabs-content-wrapper'>\r\n\t\t\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<ol>\n<li>O Refine lida com os dados de maneira semelhante &agrave; da planilha: voc&ecirc; tem linhas, colunas e c&eacute;lulas &ndash; uma c&eacute;lula &eacute; o campo definido por uma linha e uma coluna.<\/li>\n<li>Para disponibilizar as suas linhas baseado em uma coluna espec&iacute;fica, clique no pequeno tri&acirc;ngulo voltado para baixo pr&oacute;ximo &agrave; coluna.<img loading=\"lazy\" decoding=\"async\" style=\"margin: 15px 610px 0 0;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia05-154x300.png\" width=\"154\" height=\"300\"><\/li>\n<\/ol>\n<\/ol>\r\n\t\t<\/div>\r\n\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>Selecione &ldquo;Sort&hellip;&rdquo; para abrir o di&aacute;logo de classifica&ccedil;&atilde;o.<\/li>\n<li>Voc&ecirc; pode selecionar como vai classificar os valores e, depois, em qual ordem vai organiz&aacute;-los. (N&oacute;s vamos organiz&aacute;-los em texto, j&aacute; que por ora temos somente colunas de texto).\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-281\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia06.png\" width=\"424\" height=\"359\" srcset=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia06.png 424w, https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia06-300x254.png 300w\" sizes=\"auto, (max-width: 424px) 100vw, 424px\" \/><\/p>\n<\/li>\n<\/ol>\r\n\t\t<\/div>\r\n\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>Clique em &ldquo;OK&rdquo; e suas linhas v&atilde;o estar organizadas conforme a coluna.<\/li>\n<li>Para desfazer essa organiza&ccedil;&atilde;o, clique nas op&ccedil;&otilde;es de coluna novamente, selecione &ldquo;sort&rdquo; e depois &ldquo;remove sort&rdquo;<\/li>\n<\/ol>\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-282\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia07.png\" width=\"410\" height=\"319\" srcset=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia07.png 410w, https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia07-300x233.png 300w\" sizes=\"auto, (max-width: 410px) 100vw, 410px\" \/><\/p>\r\n\t\t<\/div>\r\n\t\t\t<\/div>\r\n\t\t<\/div>\r\n\t\t\t<\/div> <!-- .et-tabs-container --><\/p>\n<p>Outra fun&ccedil;&atilde;o usada frequentemente em planilhas &eacute; o filtro &ndash; no Refine, ela &eacute; chamada de polimento. O polimento no Refine &eacute; bem poderoso &ndash; voc&ecirc; ver&aacute; que na maior parte do restante do texto, vamos utilizar esses filtros.<\/p>\n<p><strong>Passo a passo: Filtrar linhas baseado em uma coluna<\/strong><br> \r\n\t\t\t<div class='et-tabs-container et_sliderfx_fade et_sliderauto_false et_sliderauto_speed_5000 et_slidertype_top_tabs'>\r\n\t\t\t\t<ul class='et-tabs-control'>\r\n\t\t\t<li><a href='#'>\r\n\t\t\tPasso 1\r\n\t\t<\/a><\/li> \r\n\t\t<li><a href='#'>\r\n\t\t\tPasso 2\r\n\t\t<\/a><\/li> \r\n\t\t<li><a href='#'>\r\n\t\t\tPasso 3\r\n\t\t<\/a><\/li> \r\n\t\t<li><a href='#'>\r\n\t\t\tPasso 4\r\n\t\t<\/a><\/li>\r\n\t\t<\/ul> <!-- .et-tabs-control --> \r\n\t\t<div class='et-tabs-content'>\r\n\t\t\t<div class='et-tabs-content-wrapper'>\r\n\t\t\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>Selecione as op&ccedil;&otilde;es da coluna com as quais voc&ecirc; quer filtrar a coluna.<\/li>\n<li>Selecione &ldquo;Facet&rdquo;<img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-283\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia08.png\" width=\"333\" height=\"300\" srcset=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia08.png 333w, https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia08-300x270.png 300w\" sizes=\"auto, (max-width: 333px) 100vw, 333px\" \/><\/li>\n<\/ol>\r\n\t\t<\/div>\r\n\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>Voc&ecirc; pode filtrar textos, n&uacute;meros ou datas de maneira diferente. Vamos experimentar com texto: clique em &ldquo;Text facet&rdquo;<\/li>\n<li>Isso vai abrir um novo filtro na barra da esquerda<img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-284\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia09.png\" width=\"301\" height=\"385\" srcset=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia09.png 301w, https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia09-234x300.png 234w\" sizes=\"auto, (max-width: 301px) 100vw, 301px\" \/><\/li>\n<\/ol>\r\n\t\t<\/div>\r\n\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>Agora selecione um ou mais crit&eacute;rios e voc&ecirc; ver&aacute; como as suas linhas de dados est&atilde;o limitadas apenas &agrave;quelas selecionadas.<\/li>\n<li>Claro que voc&ecirc; pode adicionar mais de um filtro e desse modo filtrar mais de uma vez.<\/li>\n<li>Vamos adicionar outro filtro: repare que uma das colunas cont&eacute;m datas: podemos colocar um filtro de linha do tempo que nos permita selecionar um intervalo de datas.\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-285\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia10.png\" width=\"342\" height=\"300\" srcset=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia10.png 342w, https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia10-300x263.png 300w\" sizes=\"auto, (max-width: 342px) 100vw, 342px\" \/><\/p>\n<\/li>\n<\/ol>\r\n\t\t<\/div>\r\n\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>Isso abrir&aacute; um novo filtro parecido com este:\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-286\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia11.png\" width=\"302\" height=\"173\" srcset=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia11.png 302w, https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia11-300x171.png 300w\" sizes=\"auto, (max-width: 302px) 100vw, 302px\" \/><\/p>\n<\/li>\n<\/ol>\n<ol>\n<li>Voc&ecirc; pode escolher um intervalo de datas movimentando os indicadores para esquerda ou direita.<\/li>\n<\/ol>\r\n\t\t<\/div> \r\n\t\t<div class='et_slidecontent'>\r\n\t\t\t\r\n\t\t<\/div>\r\n\t\t\t<\/div>\r\n\t\t<\/div>\r\n\t\t\t<\/div> <!-- .et-tabs-container --><\/p>\n<h2 id=\"conciliar-colunas\" class=\"summary-item\"><a href=\"#conciliar-colunas\">Conciliar Colunas<\/a><\/h2>\n<p>&Agrave;s vezes, as pessoas cometem erros ao inserir dados &ndash; digitam errado nome de cidades ou inserem caracteres que n&atilde;o podem ver, mas que o computador percebe. (Por exemplo, voc&ecirc; pode colocar um simples espa&ccedil;o ao final de um nome e o programa vai considerar um nome diferente). Por isso, vamos criar um filtro de texto para as cidades:<\/p>\n<p><strong>Passo a passo: Conciliar Colunas<\/strong><br> \r\n\t\t\t<div class='et-tabs-container et_sliderfx_fade et_sliderauto_false et_sliderauto_speed_5000 et_slidertype_top_tabs'>\r\n\t\t\t\t<ul class='et-tabs-control'>\r\n\t\t\t<li><a href='#'>\r\n\t\t\tPasso 1\r\n\t\t<\/a><\/li> \r\n\t\t<li><a href='#'>\r\n\t\t\tPasso 2\r\n\t\t<\/a><\/li>\r\n\t\t<\/ul> <!-- .et-tabs-control --> \r\n\t\t<div class='et-tabs-content'>\r\n\t\t\t<div class='et-tabs-content-wrapper'>\r\n\t\t\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>Crie um filtro de texto para a coluna &ldquo;Cidade&rdquo;<\/li>\n<li>Siga para baixo at&eacute; encontrar &ldquo;La Paz&rdquo;: percebe quantas maneiras diferentes de grafia h&aacute; para escrever &ldquo;la paz&rdquo;?<img loading=\"lazy\" decoding=\"async\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia12.png\" width=\"297\" height=\"181\"><\/li>\n<\/ol>\r\n\t\t<\/div>\r\n\t\t<div class='et_slidecontent'>\r\n\t\t\t<ol>\n<li>Vamos arrumar isso! Esse tipo de coisa &eacute; t&atilde;o comum que o Refine construiu um mecanismo para detectar essas diferen&ccedil;as.<\/li>\n<li>Clique no bot&atilde;o &ldquo;Cluster&rdquo; no canto superior direito no filtro.\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter  wp-image-288\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia13.png\" width=\"591\" height=\"367\" srcset=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia13.png 739w, https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia13-300x186.png 300w\" sizes=\"auto, (max-width: 591px) 100vw, 591px\" \/><\/p>\n<\/li>\n<\/ol>\n<ol>\n<li>Agora verifique tudo que o Refine filtrou corretamente como similares.<\/li>\n<li>Clique no bot&atilde;o &ldquo;Merge Selected &amp; Re-Cluster&rdquo;. Brinque com a fun&ccedil;&atilde;o de afinamento e os m&eacute;todos no topo para identificar poss&iacute;veis caracter&iacute;sticas que podem ser colocadas juntas.<\/li>\n<\/ol>\r\n\t\t<\/div>\r\n\t\t\t<\/div>\r\n\t\t<\/div>\r\n\t\t\t<\/div> <!-- .et-tabs-container --><\/p>\n<h2 id=\"melhorar-a-aparencia-do-nome-de-cidades\" class=\"summary-item\"><a href=\"#melhorar-a-aparencia-do-nome-de-cidades\">Melhorar a apar&ecirc;ncia do nome de cidades<\/a><\/h2>\n<p>Voc&ecirc; percebeu como a maioria das cidades est&atilde;o com todas as letras em mai&uacute;scula? &Eacute; estranho ler algo assim. E talvez voc&ecirc; queira ter nomes com melhor apar&ecirc;ncia para leitura: sem problemas. O Refine pode fazer isso.<\/p>\n<p><strong>Passo a passo: Mudar a Letra no Refine<\/strong><\/p>\n<ol>\n<li>Vamos modificar a letra na nossa coluna de cidade de tudo em caixa alta para somente as primeiras letras em mai&uacute;scula<\/li>\n<li>Para fazer isso, abra as op&ccedil;&otilde;es da coluna, v&aacute; para &ldquo;Edit cells&rdquo;, depois &ldquo;Common transforms&rdquo;, depois &ldquo;To titlecase&rdquo;.\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-289\" style=\"margin-top: 15px;\" alt=\"Cleaning Data with Refine\" src=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia14.png\" width=\"516\" height=\"475\" srcset=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia14.png 516w, https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia14-300x276.png 300w\" sizes=\"auto, (max-width: 516px) 100vw, 516px\" \/><\/p>\n<\/li>\n<\/ol>\n<ol>\n<li>Pronto &ndash; como m&aacute;gica, todos os seus nomes foram modificados.<\/li>\n<\/ol>\n<p><strong>Parab&eacute;ns!<\/strong> Voc&ecirc; limpou com sucesso um grupo de dados usando o Refine!<\/p>\n\r\n\t\t<div class='author-shortcodes'>\r\n\t\t\t<div class='author-inner'>\r\n\t\t\t\t<div class='author-image'>\r\n\t\t\t<img src='https:\/\/farm9.staticflickr.com\/8321\/7937480904_6f29810da7.jpg' alt='' \/>\r\n\t\t\t<div class='author-overlay'><\/div>\r\n\t\t<\/div> <!-- .author-image --> \r\n\t\t<div class='author-info'>\r\n\t\t\t<strong>Michael<\/strong>&nbsp;vive em Viena e trabalha como argumentador de dados junto ao Open Knowledge Foundation, majoritariamente com o School of Data. Depois de um breve desvio que realizou em dire&ccedil;&atilde;o a pesquisas biom&eacute;dicas, quando aprendeu a adorar argumenta&ccedil;&atilde;o de dados, dedicou algum tempo &agrave; sua paix&atilde;o: liberdade na idade digital. Uniu-se &agrave; Open Knowledge Foundation para satisfazer sua curiosidade. Contente da vida, ele vai explorar qualquer assunto que voc&ecirc; lhe indicar. Veja mais em <a href=\"https:\/\/okfn.org\/about\/team\/#Michael_Bauer_8212_Data_Wrangler_School_of_Data\" target=\"_blank\">https:\/\/okfn.org\/about\/team\/#Michael_Bauer_8212_Data_Wrangler_School_of_Data<\/a>\r\n\t\t<\/div> <!-- .author-info -->\r\n\t\t\t<\/div> <!-- .author-inner -->\r\n\t\t<\/div> <!-- .author-shortcodes -->\n\n<p><\/p>\n<meta http-equiv=\"Content-Type\" content=\"text\/html; charset=UTF-8\"><\/body><\/html>","protected":false},"excerpt":{"rendered":"<p>O Open Refine (previamente Google Refine) &eacute; um programa de limpeza de dados que utiliza o seu navegador de internet como interface. Isso significa que parece que ele atua na internet, mas todos os seus dados permanecem na sua m&aacute;quina e voc&ecirc; n&atilde;o precisa de uma conex&atilde;o de internet para trabalhar com eles.<\/p>\n","protected":false},"author":11,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","jetpack_post_was_ever_published":false},"categories":[10],"tags":[45,21],"class_list":["post-94","post","type-post","status-publish","format-standard","hentry","category-data","tag-data-wrangling","tag-environmental-data","skill-data-cleaning","skill-filtering"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.2 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Limpeza de Dados com o Refine<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/\" \/>\n<meta property=\"og:locale\" content=\"pt_BR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Limpeza de Dados com o Refine\" \/>\n<meta property=\"og:description\" content=\"O Open Refine (previamente Google Refine) &eacute; um programa de limpeza de dados que utiliza o seu navegador de internet como interface. Isso significa que parece que ele atua na internet, mas todos os seus dados permanecem na sua m&aacute;quina e voc&ecirc; n&atilde;o precisa de uma conex&atilde;o de internet para trabalhar com eles.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/\" \/>\n<meta property=\"og:site_name\" content=\"geojournalism.org\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/geojournalism\/\" \/>\n<meta property=\"article:published_time\" content=\"2013-07-17T22:36:29+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2014-11-14T18:50:46+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png\" \/>\n<meta name=\"author\" content=\"Michael Bauer\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@geojournalism\" \/>\n<meta name=\"twitter:site\" content=\"@geojournalism\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Michael Bauer\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. tempo de leitura\" \/>\n\t<meta name=\"twitter:data2\" content=\"13 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/geojournalism.org\/2013\/07\/cleaning-data-with-refine\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/geojournalism.org\/2013\/07\/cleaning-data-with-refine\/\"},\"author\":{\"name\":\"Michael Bauer\",\"@id\":\"https:\/\/geojournalism.org\/#\/schema\/person\/9c80f51d2a03e806fb4abb8d4a2a1ab1\"},\"headline\":\"Limpeza de Dados com o Refine\",\"datePublished\":\"2013-07-17T22:36:29+00:00\",\"dateModified\":\"2014-11-14T18:50:46+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/geojournalism.org\/2013\/07\/cleaning-data-with-refine\/\"},\"wordCount\":2667,\"commentCount\":0,\"image\":{\"@id\":\"https:\/\/geojournalism.org\/2013\/07\/cleaning-data-with-refine\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png\",\"keywords\":[\"data wrangling\",\"environmental data\"],\"articleSection\":[\"Dados\"],\"inLanguage\":\"pt-BR\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/\",\"url\":\"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/\",\"name\":\"Cleaning Data with RefineLimpeza de Dados com o Refine\",\"isPartOf\":{\"@id\":\"https:\/\/geojournalism.org\/pt\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/geojournalism.org\/2013\/07\/cleaning-data-with-refine\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png\",\"datePublished\":\"2013-07-17T22:36:29+00:00\",\"dateModified\":\"2014-11-14T18:50:46+00:00\",\"author\":{\"@id\":\"https:\/\/geojournalism.org\/#\/schema\/person\/9c80f51d2a03e806fb4abb8d4a2a1ab1\"},\"breadcrumb\":{\"@id\":\"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/#breadcrumb\"},\"inLanguage\":\"pt-BR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[[\"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/\"]]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/#primaryimage\",\"url\":\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png\",\"contentUrl\":\"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/geojournalism.org\/pt\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Dados\",\"item\":\"https:\/\/geojournalism.org\/pt\/category\/data\/\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Cleaning Data with Refine\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/geojournalism.org\/pt\/#website\",\"url\":\"https:\/\/geojournalism.org\/pt\/\",\"name\":\"geojournalism.org\",\"description\":\"As melhores ferramentas para reportagem multim\u00eddia\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/geojournalism.org\/pt\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pt-BR\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/geojournalism.org\/#\/schema\/person\/9c80f51d2a03e806fb4abb8d4a2a1ab1\",\"name\":\"Michael Bauer\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/secure.gravatar.com\/avatar\/c3c0fbbe531d1c86b54b8553e93220085c17c7bf5178467a7e011c75dbe47ffc?s=96&d=mm&r=g\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/c3c0fbbe531d1c86b54b8553e93220085c17c7bf5178467a7e011c75dbe47ffc?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/c3c0fbbe531d1c86b54b8553e93220085c17c7bf5178467a7e011c75dbe47ffc?s=96&d=mm&r=g\",\"caption\":\"Michael Bauer\"},\"sameAs\":[\"https:\/\/twitter.com\/mihi_tr\"],\"url\":\"https:\/\/geojournalism.org\/pt\/author\/michael-bauer\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Limpeza de Dados com o Refine","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/","og_locale":"pt_BR","og_type":"article","og_title":"Limpeza de Dados com o Refine","og_description":"O Open Refine (previamente Google Refine) &eacute; um programa de limpeza de dados que utiliza o seu navegador de internet como interface. Isso significa que parece que ele atua na internet, mas todos os seus dados permanecem na sua m&aacute;quina e voc&ecirc; n&atilde;o precisa de uma conex&atilde;o de internet para trabalhar com eles.","og_url":"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/","og_site_name":"geojournalism.org","article_publisher":"https:\/\/www.facebook.com\/geojournalism\/","article_published_time":"2013-07-17T22:36:29+00:00","article_modified_time":"2014-11-14T18:50:46+00:00","og_image":[{"url":"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png","type":"","width":"","height":""}],"author":"Michael Bauer","twitter_card":"summary_large_image","twitter_creator":"@geojournalism","twitter_site":"@geojournalism","twitter_misc":{"Escrito por":"Michael Bauer","Est. tempo de leitura":"13 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/geojournalism.org\/2013\/07\/cleaning-data-with-refine\/#article","isPartOf":{"@id":"https:\/\/geojournalism.org\/2013\/07\/cleaning-data-with-refine\/"},"author":{"name":"Michael Bauer","@id":"https:\/\/geojournalism.org\/#\/schema\/person\/9c80f51d2a03e806fb4abb8d4a2a1ab1"},"headline":"Limpeza de Dados com o Refine","datePublished":"2013-07-17T22:36:29+00:00","dateModified":"2014-11-14T18:50:46+00:00","mainEntityOfPage":{"@id":"https:\/\/geojournalism.org\/2013\/07\/cleaning-data-with-refine\/"},"wordCount":2667,"commentCount":0,"image":{"@id":"https:\/\/geojournalism.org\/2013\/07\/cleaning-data-with-refine\/#primaryimage"},"thumbnailUrl":"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png","keywords":["data wrangling","environmental data"],"articleSection":["Dados"],"inLanguage":"pt-BR"},{"@type":"WebPage","@id":"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/","url":"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/","name":"Cleaning Data with RefineLimpeza de Dados com o Refine","isPartOf":{"@id":"https:\/\/geojournalism.org\/pt\/#website"},"primaryImageOfPage":{"@id":"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/#primaryimage"},"image":{"@id":"https:\/\/geojournalism.org\/2013\/07\/cleaning-data-with-refine\/#primaryimage"},"thumbnailUrl":"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png","datePublished":"2013-07-17T22:36:29+00:00","dateModified":"2014-11-14T18:50:46+00:00","author":{"@id":"https:\/\/geojournalism.org\/#\/schema\/person\/9c80f51d2a03e806fb4abb8d4a2a1ab1"},"breadcrumb":{"@id":"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/#breadcrumb"},"inLanguage":"pt-BR","potentialAction":[{"@type":"ReadAction","target":[["https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/"]]}]},{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/#primaryimage","url":"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png","contentUrl":"https:\/\/geojournalism.org\/wp-content\/uploads\/2013\/07\/CleaningDatawithRefine-Bolivia01.png"},{"@type":"BreadcrumbList","@id":"https:\/\/geojournalism.org\/pt\/2013\/07\/cleaning-data-with-refine\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/geojournalism.org\/pt\/"},{"@type":"ListItem","position":2,"name":"Dados","item":"https:\/\/geojournalism.org\/pt\/category\/data\/"},{"@type":"ListItem","position":3,"name":"Cleaning Data with Refine"}]},{"@type":"WebSite","@id":"https:\/\/geojournalism.org\/pt\/#website","url":"https:\/\/geojournalism.org\/pt\/","name":"geojournalism.org","description":"As melhores ferramentas para reportagem multim\u00eddia","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/geojournalism.org\/pt\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pt-BR"},{"@type":"Person","@id":"https:\/\/geojournalism.org\/#\/schema\/person\/9c80f51d2a03e806fb4abb8d4a2a1ab1","name":"Michael Bauer","image":{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/secure.gravatar.com\/avatar\/c3c0fbbe531d1c86b54b8553e93220085c17c7bf5178467a7e011c75dbe47ffc?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/c3c0fbbe531d1c86b54b8553e93220085c17c7bf5178467a7e011c75dbe47ffc?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/c3c0fbbe531d1c86b54b8553e93220085c17c7bf5178467a7e011c75dbe47ffc?s=96&d=mm&r=g","caption":"Michael Bauer"},"sameAs":["https:\/\/twitter.com\/mihi_tr"],"url":"https:\/\/geojournalism.org\/pt\/author\/michael-bauer\/"}]}},"jetpack_featured_media_url":"","_links":{"self":[{"href":"https:\/\/geojournalism.org\/pt\/wp-json\/wp\/v2\/posts\/94","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/geojournalism.org\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/geojournalism.org\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/geojournalism.org\/pt\/wp-json\/wp\/v2\/users\/11"}],"replies":[{"embeddable":true,"href":"https:\/\/geojournalism.org\/pt\/wp-json\/wp\/v2\/comments?post=94"}],"version-history":[{"count":49,"href":"https:\/\/geojournalism.org\/pt\/wp-json\/wp\/v2\/posts\/94\/revisions"}],"predecessor-version":[{"id":1171,"href":"https:\/\/geojournalism.org\/pt\/wp-json\/wp\/v2\/posts\/94\/revisions\/1171"}],"wp:attachment":[{"href":"https:\/\/geojournalism.org\/pt\/wp-json\/wp\/v2\/media?parent=94"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/geojournalism.org\/pt\/wp-json\/wp\/v2\/categories?post=94"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/geojournalism.org\/pt\/wp-json\/wp\/v2\/tags?post=94"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}