top of page
  • Foto do escritorGabriel Quintella

Python, Mapeando datatypes de colunas de um DataFrame usando select_dtype()

Fala meu amigo, tudo bem com você? É muito bom poder contar com você em mais um post. Espero que esteja acompanhando e aprendendo junto comigo!


Hoje vou ser bem direto! Recebi a seguinte missão em meu trabalho. Gabriel preciso que você identifique nessa fonte de dados quais são números, datas e strings pois vamos precisar reorganizar nossa forma de trabalho.


Diante dessa missão, veio a primeira pergunta, como que eu faço isso?


O subconsciente falou baixinho em meu ouvido, fique calmo e respira, acessa ai o blog www.dbaassists.com.br, lá tem a resposta pra sua dúvida!


Isso mesmo pessoal, nessa postagem você irá aprender uma forma bacana de identificar os tipos de dados de cada coluna em um DataFrame.


Para exemplificar, vou criar um DataFrame simples com 4 colunas. Com a seguinte definição:


  • CodFuncionario - Inteiro

  • NomFuncionario - String

  • Peso - Decimal

  • DataNascimento - Datetime


Observe comigo!


dtypes = {'CodFuncionario':'int64'
          ,'NomFuncionario':'object'
          ,'Peso':'float64'
          ,'DataNascimento':'datetime64[ns]'}

df = pd.DataFrame([['15249','João da Silva','39.8','1981-11-18']
                       ,['13542','Alice Maria','55.2','1968-08-23']
                       ,['134950','Amado Batista','76.9','1945-02-17']
                       ,['3326','Roberto Carlos','80.5','1941-04-18']],
                      columns=['CodFuncionario','NomFuncionario','Idade','DataNascimento'])

for c in df.columns:
    df[c] = df[c].astype(dtypes[c])
    print (df[c])

Agora ficou fácil! Pegue a sua primeira missão!


1º - Selecionar todas as colunas numéricas.


Um momento de atenção! Eu quero que seja listada TODAS as colunas NUMÉRICAS!


Observe o resultado e atenção ao comentário!


df.select_dtypes(include='number').head() 

Quando especificamos include='number', ele retorna todas as colunas numéricas, sem distinção!


Caso queira algum tipo numérico especifico segue alguns exemplos.


df.select_dtypes(include='int64').head()

df.select_dtypes(include='float').head()

Você também pode usar esse método para outras situações:

  • Podemos selecionar apenas colunas do tipo object (no Pandas o tipo String é determinado como object);

df.select_dtypes(include='object')
  • Podemos selecionar vários tipos de dados;

df.select_dtypes(include=['int64', 'object'])
  • E também podemos excluir certos tipos de dados.

df.select_dtypes(exclude='datetime')

Quando falamos sobre datatypes no Python e passamos a manipular essas informações dentro de bibliotecas por exemplo, Pandas, Numpy e outros, pode ocorrer que em algumas esses tipos de dados não existam no momento que você esteja realizado a criação.



Abaixo deixo um link de um site super bacana que explica com detalhes como que funcionam os datatypes na biblioteca Pandas. Recomendo que você leia pois é bem interessante!


Isso ai meu amigo, o post de hoje é bem simples e objetivo. Espero que tenha gostado e nos encontramos no próximo em breve!





86 visualizações0 comentário

Posts recentes

Ver tudo

Comments


bottom of page