Gráfico histograma

01.Para que serve um histograma

Usamos um histograma quando queremos entender a distribuição da frequência em que algo ocorre dentro de um intervalo numérico.

Exemplo:

Quantos produtos custam entre:

  • 0–100 reais

  • 101–200 reais

  • 201–300 reais

  • 301–400 reais

  • 401–500 reais

  • 501–600 reais

  • 601–700 reais

  • 701–800 reais

  • 801–900 reais

  • 901–1.000 reais

_images/grafico_histogramah.png

02.Preparando os dados

02.a.Importando as bibliotecas necessárias

1#Importando as bibliotecas necessárias
2import pandas as pd
3import matplotlib.pyplot as plt

02.b.Criando o DataFrame

Para este grpafico usaremos uma base de dados (“olist_order_payments_dataset.xlsx”) sobre pagamentos de pedidos da empresa de varejo online Olist.

1#Criando o DataFrame
2df = pd.read_excel("/content/oilist_order_payments_dataset.xlsx")
1#Visualizandoo DataFrame
2df.head()

Este é o resultado:

_images/head_oilist.png
1#Verificando o formato do DataFrame
2df.shape

Este é o resultado:

>>> (102698, 5)

Note

Por uma questão de didática fizemos pequenas alterações no dataset que retiramos do site da Kaggle.

03.Construindo um gráfico de histograma

_images/figura_axe.png
1#Criar o objeto figure e axes
2fig, ax_01 = plt.subplots()
1#Escolher os dados e somá-los para plotar o gráfico
2df.payment_value.plot(kind="hist", ax=ax_01, bins = 20)
1#Customizando o Axes
2ax_01.set_title("Histograma preço dos produtos")
3ax_01.set_xlabel("Preço dos produtos.")
4ax_01.set_ylabel("Quantidade vendida.")
1#Exibindo o gráfico
2plt.show()

Este é o resultado:

_images/grafico_histogramah.png

Note

  1. Usar o método e os parâmetros figsize(altura,largura) se necessário.

  2. Usar parâmetro bins se necessário, que serve para definir o número de intervalos que o matplotlib considera para criar as barras no histograma..