top of page
  • Foto do escritorGabriel Quintella

Fato ou Fake? Vamos Analisar as Informações Eleitorais com Python?

E ai meu amigo tudo bem com você?


Trago hoje pra você um post bem interessante! Não sei se você sabe mais no dia 16/08/2022 iniciou-se oficialmente a campanha eleitoral de 2022. Acredito que você tenha observado também que os veículos de comunicação (jornais e internet) estão divulgando diariamente estatísticas baseadas nas candidaturas.


Vamos a alguns exemplos:


1 - Existem candidatos na Eleição 2022 que possui patrimônio milionário;

2 - O número de candidatos negros na Eleição de 2022 bateu recorde quando comparado com o número de candidatos inscritos em 2014 e 2018, período que passou a ter a declaração de cor/raça;

3 - Candidatos religiosos (Pastores, Pastoras, Bispos, Bispas e outros) possuem patrimônios milionários declarado;

4 - Quase 33% dos candidatos a Governador nas Eleições 2022 não são nativos do estado;

5 - 38% dos candidatos não declaram patrimônio, 12% são milionários e 1 é bilionários.


Vamos validar se isso é Fato ou Fake?



Bora lá então....


Antes de entrar no assunto, será que você sabe de onde iremos extrair essas informações?


Os dados eleitorais podem ser encontrados no site Portal de Dados Abertos do TSE.



Iremos trabalhar especificamente com dois conjuntos de dados (datasets).



Projeto futuro: Após o termino das apurações, irei fazer um trabalho bem bacana comparando os dados das eleições de 2018 com as de 2022, porém isso será possível apenas no final do ano. Fiquem tranquilo que eu volto na sua timeline.


Seguindo aqui no nosso estudo...


Primeiro ponto, vamos conhecer o candidato Bilionário! Fico eu pensando, o que leva um cara tão rico entrar no meio político! Você pensa o mesmo? Caso sim, me conte depois kkkk....


1 - Existem candidatos na Eleição 2022 que possui patrimônio milionário;


Nessa análise vamos precisar dos dois conjuntos de dados. O conjunto de dado de Candidato tem informações pessoais sobre o candidato e o de Bens, os seus referidos bens, uma breve descrição e o seu valor!


Vamos ver como que segui aqui na análise desses dados.


No script abaixo, realizamos a importação dos arquivos de Candidato e Bens.



Após a importação, consolido por candidato e cargo e sumarizo o valor dos seus bens. Feito isso listamos os 10 mais ricos.



Obs: Notem que existe o candidato IRAJÁ REZENDE DE LACERDA com patrimônio de R$ 3921591627,13. Acredito eu que tenha ocorrido um erro de digitação pois em minhas pesquisas deveria existir apenas um candidato na casa do BILHÃO, que no caso é o MARCOS ERMÍRIO DE MORAES. Então caso surja uma nota do TSE a respeito do patrimônio do Irajá, volto aqui e faço uma correção. Porém esse é o dado que está sendo apresentado de R$ 3921591627,13 consta no arquivo de bens dele.




Esse foi FATO!


2 - Número de Candidatos Negros na Eleição de 2022 é recorde quando comparado com o número de candidatos inscritos em 2014, período que passou a ter a declaração de cor/raça;


Um outro ponto de destaque foi o aumento de candidatos que se declaram Negros (Pretos ou Pardos).


Como o dataset de Candidatos foi importado no passo anterior, a única ação que precisamos realizar nesse caso é tratar as informação aplicando um De-Para.


Após esse tratamento (De-Para), consolidamos a informação e sumarizamos o percentual pertencente a cada cor.



Por último, uma visão gráfica dos dados. Com isso conseguimos avaliar melhor o avanço que ocorreu em cada período eleitoral.


Esse foi FATO!


3 - Existem candidatos religiosos (Pastores, Pastoras, Bispos, Bispas e outros) que possuem patrimônios milionários;


Esse aqui, confesso pra vocês que fiquei um pouco surpreso, porém não vem ao caso.


Vamos voltar ao nosso desenvolvimento. De modo semelhante ao que fizemos com o anterior, não vamos precisar importar o dataset de candidato pois já realizamos no primeiro passo.


Quando olhamos a fundo a documentação que tem nos dataset, conseguimos identificar que todo candidato possui um nome real e um nome que será apresentado na urna.


Com essa informação, sobre o nome da urna, aplicamos o comando split() para separar a primeira palavra para todos os registros, no passo seguinte criamos uma nova coluna no dataframe e filtramos apenas as informações que iremos analisar.


Feito isso, agrupamos os valores e sumarizamos o valor.



E por último listamos os 10 mais ricos.



Esse também foi FATO!


4 - Quase 33% dos candidatos a Governador nas Eleições 2022 não são nativos do estado;

Nesse outro assunto, selecionei todos os candidatos que estão concorrendo a uma vaga para Governador. Listei a UF do estado e a UF de nascimento do Candidato.


Quando ocorre IGUALDADE, associo ele como NASCIDO NO ESTADO, caso contrário como FORASTEIRO.


Agregando e Sumarizando as informações, conseguimos visualizar os dados apresentados na reportagem.



Disponibilizando essa visão de uma forma gráfica, fica bem claro o que pretendemos mostrar.



Esse também foi FATO!



5 - Você sabia que 38% dos candidatos não declaram patrimônio, 12% são milionários e 1 é bilionário, que babado!!!!!


E pra finalizar esse estudo bacana, vamos verificar realmente se essa informação é consistente.


Por que será que 38% dos candidatos não declaram seus bens? Será que não querem assustar a população, ou será que realmente não possuem nada? MISTÉRIOOOOO!!!!


Com os datasets prontos, precisamos apenas definir como iremos apresentar.


Vamos analisar algumas informações que possuímos:


- Possuímos Candidatos que não declararam seus bens;

- Possuímos Candidatos milionários;

- Possuímos Candidatos bilionários (surreal isso!);

- E possuímos também os normais, aqueles possuem bens que vão de R$ 0,01 até R$ 999999,99.


Diante disso ficou fácil montar o script.


- Aquele que não possuir nenhum registro no arquivo de BENS, receberá o selo de NÃO DECLAROU BEM;

- Aquele que possuir bens nos valores que vão de R$ 1000000,00 até R$ 999999999,99, receberão o selo de MILIONÁRIO;

- Aquele que possuir bens nos valores acima de R$ 1000000000,00, receberão o selo de BILIONÁRIO;

- E os normais, bens nos valores que vão de R$ 0,01 até R$ 999999,99, receberão o selo de RICO.


Pronto! Bora então pro código....



Finalizamos apresentando um percentual de candidatos dentro das suas respectivas categorias.



Mudando agora a visão do gráfico, é possível verificar que os mais ricos estão na categoria dos milionários.



Esse também foi FATO!


Bem meu amigo, espero que tenha gostado desse post. Ele não possui nenhum cunho político, não demonstra que um candidato é melhor que o outro, nada disso!


Ele se resume em um estudo dirigido sobre algumas reportagens que foram postadas nos últimos dias e que levam em consideração dados disponíveis para consulta pública.


Se você focar bastante o seu estudo nesse notebook que disponibilizo pra você, irá constatar que tentei trazer para você como podemos aplicar o Python na análise de dados reais e com isso retirar alguns insights bem bacanas.


Observe também que nesse estudando fizemos o uso de algumas funções do Python:


pd.read_csv() - usamos para importar arquivos do tipo CSV;

replace() - substituição de valores dentro de uma string;

os.listdir() - leitura de um diretório para seleção de arquivos existentes nele;

append() - adicionar um dataframe em outro;

pd.merge() - relacionar dois dataframes;

astype() - conversão de valores;

isin() - seleção de uma lista de valores;

groupby().agg() - agrupamento e agregação;

sort_values() - ordenação de um dataframe;

fillna() - tratamento de valores nulos (NaN).


É isso ai meu amigo, espero que eu tenha consegui alcançar meu objetivo, grande abraço e até a próxima!


O notebook usado nesse estudo você encontra aqui no GitHub.

78 visualizações0 comentário

Posts recentes

Ver tudo

תגובות


bottom of page