Estatística Descritiva - Atividade 1

De Aulas
Revisão de 22h25min de 10 de abril de 2023 por Admin (discussão | contribs)
(dif) ← Edição anterior | Revisão atual (dif) | Versão posterior → (dif)

Afluentes: Análise de Dados e Big Data

Exemplo Lapponi 2000

Conforme nosso conteúdo de Estatística Descritiva, vejamos o exemplo de Lapponi (2000).

Aed lapponi 2020.jpg

Código

Observe o seguinte código escrito em python mostra o histograma de frequência com informações absolutas e absolutas acumuladas dos dados apresentados no slide.

import sys
import pygame
import random
import pandas as pd
import matplotlib.pyplot as plt

pygame.init()

data = [10, 9, 9, 9, 10, 11, 8, 8, 10, 11, 12, 13, 10, 11, 12, 7]

max = max(data)
hist_x = []
hist_y = []
hist_y_sum = []
for i in range(max + 1):
    hist_x.append(i)
    hist_y.append(0)
    hist_y_sum.append(0)

for i in range(len(data)):
    hist_y[data[i]] += 1

sum = 0
for i in range(len(hist_y)):
    sum += hist_y[i]
    hist_y_sum[i] = sum

plt.bar(hist_x, hist_y)
plt.plot(hist_x, hist_y_sum)
plt.show()

pygame.quit()
quit()

Veja que para executar o código acima, você precisa ter instalado algumas bibliotecas do pyton. Eu uso o instalador pip, que no ubuntu basta instalar usando sudo apt install pip. Depois é só instalar as bibliotecas:

pip3 install pygame
pip3 install pandas
pip3 install matplotlib

Atividade

Agora vamos tentar mostrar as informações mais parecidas com o slide acima. Para isso, faça as atividades a seguir. Veja que é interessante que pesquisem e utilizem bibliotecas facilitadoras.

1. No exemplo acima, o eixo Y está mostrando o valor numérico Absoluto. Mostre em porcentagem relativa e porcentagem acumulada.

2. Encontre e mostre a média aritimética

3. Encontre e mostre a mediana

4. Mostre no formato de tabela (texto ou alguma biblioteca)

5. Encontre um conjunto de dados de um determinado problema. Mostre os dados conforme questões acima.