GitHub - cran/nomesbr: :exclamation: This is a read-only mirror of the CRAN R package repository. nomesbr — Limpa e Simplifica Nomes de Pessoas (Name Cleaner and Simplifier). Homepage: https://github.com/ipeadata-lab/nomesbr, https://ipeadata-lab.github.io/nomesbr/ Report bugs for this package: https://github.com/ipeadata-lab/nomesbr/issue ...

nomesbr

nomesbr é um pacote de R que limpa e simplifica nomes de pessoas para auxiliar no pareamento de banco de dados na ausência de chaves únicas não ambíguas. Detecta e corrige erros tipográficos mais comuns, simplifica opcionalmente termos sujeitos eventualmente a omissão em cadastros.

(R package for tidying and simplifying names. Created for aiding in dataset pairing in the absence of unambiguous keys. It detects and corrects common typos, optionally simplifies terms prone to omission in records.)

Instalação

A versão estável do pacote pode ser instalada com:

install.packages("nomesbr")

A versão em desenvolvimento pode ser instalada com o seguinte comando :

# install.packages("remotes")
remotes::install_github("ipeadata-lab/nomesbr")

Utilização

O pacote nomesbr torna disponíveis funções para limpar e simplificar nomes. limpar_nomes() e simplifica_PARTICULAS_AGNOMES_PATENTES(), principais funções do pacote, foram criadas para seu uso em sequência nessa ordem.

limpar_nomes() recebe como parâmetros d,um data.frame, e s, nome da coluna com os nomes a processar. A função cria uma nova coluna, com sufixo ’_clean’, e gera novas colunas com informações dos tipos de limpeza detectados como necessários e realizados.

simplifica_PARTICULAS_AGNOMES_PATENTES() recebe também, d e s (por padrão para s, ‘nome_clean’) como parâmetros, e simplifica partículas repetidas, agnomes e alguma patentes.

A informação (novas colunas) gerada pela função limpar_nomes() servem como base para a função tabular_problemas_em_nomes() , que retorna uma tabela resumo dos problemas detectados e ações tomadas no sentido da limpeza de nomes.

Nota

nomesbr é desenvolvido por uma equipe de pesquisadores do Instituto de Pesquisa Econômica Aplicada (Ipea).

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
R		R
build		build
inst/doc		inst/doc
man		man
tests		tests
vignettes		vignettes
DESCRIPTION		DESCRIPTION
LICENSE		LICENSE
MD5		MD5
NAMESPACE		NAMESPACE
NEWS.md		NEWS.md
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

nomesbr

Instalação

Utilização

Nota

About

Uh oh!

Releases

Packages

Languages

License

cran/nomesbr

Folders and files

Latest commit

History

Repository files navigation

nomesbr

Instalação

Utilização

Nota

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages