Gráfico histograma
01.Para que serve um histograma
Usamos um histograma quando queremos entender a distribuição da frequência em que algo ocorre dentro de um intervalo numérico.
Exemplo:
Quantos produtos custam entre:
0–100 reais
101–200 reais
201–300 reais
301–400 reais
401–500 reais
501–600 reais
601–700 reais
701–800 reais
801–900 reais
901–1.000 reais
02.Preparando os dados
02.a.Importando as bibliotecas necessárias
1#Importando as bibliotecas necessárias
2import pandas as pd
3import matplotlib.pyplot as plt
02.b.Criando o DataFrame
Para este grpafico usaremos uma base de dados (“olist_order_payments_dataset.xlsx”) sobre pagamentos de pedidos da empresa de varejo online Olist.
1#Criando o DataFrame
2df = pd.read_excel("/content/oilist_order_payments_dataset.xlsx")
1#Visualizandoo DataFrame
2df.head()
Este é o resultado:
1#Verificando o formato do DataFrame
2df.shape
Este é o resultado:
>>> (102698, 5)
Note
Por uma questão de didática fizemos pequenas alterações no dataset que retiramos do site da Kaggle.
03.Construindo um gráfico de histograma
1#Criar o objeto figure e axes
2fig, ax_01 = plt.subplots()
1#Escolher os dados e somá-los para plotar o gráfico
2df.payment_value.plot(kind="hist", ax=ax_01, bins = 20)
1#Customizando o Axes
2ax_01.set_title("Histograma preço dos produtos")
3ax_01.set_xlabel("Preço dos produtos.")
4ax_01.set_ylabel("Quantidade vendida.")
1#Exibindo o gráfico
2plt.show()
Este é o resultado:
Note
Usar o método e os parâmetros
figsize(altura,largura)se necessário.Usar parâmetro
binsse necessário, que serve para definir o número de intervalos que o matplotlib considera para criar as barras no histograma..