Estatística Descritiva - Atividade 1
Afluentes: Análise de Dados e Big Data
Exemplo Lapponi 2000
Conforme nosso conteúdo de Estatística Descritiva, vejamos o exemplo de Lapponi (2000).
Código
Observe o seguinte código escrito em python mostra o histograma de frequência com informações absolutas e absolutas acumuladas dos dados apresentados no slide.
import sys
import pygame
import random
import pandas as pd
import matplotlib.pyplot as plt
pygame.init()
data = [10, 9, 9, 9, 10, 11, 8, 8, 10, 11, 12, 13, 10, 11, 12, 7]
max = max(data)
hist_x = []
hist_y = []
hist_y_sum = []
for i in range(max + 1):
hist_x.append(i)
hist_y.append(0)
hist_y_sum.append(0)
for i in range(len(data)):
hist_y[data[i]] += 1
sum = 0
for i in range(len(hist_y)):
sum += hist_y[i]
hist_y_sum[i] = sum
plt.bar(hist_x, hist_y)
plt.plot(hist_x, hist_y_sum)
plt.show()
pygame.quit()
quit()
Veja que para executar o código acima, você precisa ter instalado algumas bibliotecas do pyton. Eu uso o instalador pip, que no ubuntu basta instalar usando sudo apt install pip. Depois é só instalar as bibliotecas:
pip3 install pygame pip3 install pandas pip3 install matplotlib
Atividade
Agora vamos tentar mostrar as informações mais parecidas com o slide acima. Para isso, faça as atividades a seguir. Veja que é interessante que pesquisem e utilizem bibliotecas facilitadoras.
1. No exemplo acima, o eixo Y está mostrando o valor numérico Absoluto. Mostre em porcentagem relativa e porcentagem acumulada.
2. Encontre e mostre a média aritimética
3. Encontre e mostre a mediana
4. Mostre no formato de tabela (texto ou alguma biblioteca)
5. Encontre um conjunto de dados de um determinado problema. Mostre os dados conforme questões acima.