Pesquisa de site

Análise ativa de vendas de produtos usando matplotlib em Python


Matplotlib em Python possui várias funções como read_csv,sort_values,group_by, etc. para realizar análises de dados de vendas. Cada empresa online envolvida na venda de produtos de qualquer tipo usa a análise de dados de vendas de produtos para aumentar suas vendas e conhecer melhor seus clientes. Qualquer empresa envolvida em qualquer tipo de negócio de comércio eletrônico usa seus dados de vendas e clientes para identificar tendências, padrões e insights que podem ser usados para melhorar as vendas e receitas. Os dados de vendas podem ser usados para determinar qual produto tem maior tração, qual época festiva tem maior demanda e muitas outras tendências que podem ajudar a aumentar as vendas.

Python é uma linguagem de programação popular para análise e visualização de dados. Python fornece muitas bibliotecas e ferramentas que podem ser usadas para fazer análises de vendas de produtos de maneira eficaz. Neste artigo, usaremos Matplotlib, que é uma biblioteca popular de visualização de dados em Python para fazer análises ativas de vendas de produtos.

Estaremos usando dados de vendas de amostra para análise de vendas de produtos ativos usando numpy, pandas e matplotlib. Os dados de vendas de amostra podem ser encontrados aqui.

Análise de dados de vendas StepWise

Leitura e processamento de dados

Os dados de vendas de amostra usados neste exemplo para análise têm as seguintes colunas -

Order_Number

Product_type

Quantity

Price_Each

Order_Date

Address

  • Order Number - Número exclusivo para cada pedido feito.

  • Product_Type - Categoria do produto

  • Quantidade - quantidade do produto pedido

  • Price Each - Preço por unidade

  • Order Date - Data e hora em que o pedido foi feito

  • Address - Endereço onde o produto foi entregue.

Teremos que importar pandas e numpy que podem ser usados para ler e processar os dados de vendas de amostra. Aqui está o código para ler os dados -

Os dados de vendas de amostra podem ser encontrados na plataforma Kaggle aqui.

Exemplo

import pandas as pd
import numpy as np
import io
from google.colab import files
uploaded = files.upload()

# read csv data
Sales_data = pd.read_csv(io.BytesIO(uploaded['sample_sales_data.csv']), encoding='cp1252')
Sales_data.sort_values(by=['ORDER_NUMBER'])

Saída

Depois de lermos os dados, temos que fazer o processamento dos dados. A coluna Data do pedido precisa ser convertida em um objeto DateTime e podemos extrair mês e ano da data do pedido e adicionar uma nova coluna para mês, ano e total de vendas. O código para limpeza e processamento de dados é mostrado abaixo -

Exemplo

Sales_data['ORDER_DATE'] = pd.to_datetime(Sales_data['ORDER_DATE'])
Sales_data['MONTH'] = Sales_data['ORDER_DATE'].dt.month
Sales_data['YEAR'] = Sales_data['ORDER_DATE'].dt.year
Sales_data['TOTAL_SALES'] = Sales_data['QUANTITY'] * Sales_data['PRICE_EACH']
Sales_data.sort_values(by=['ORDER_NUMBER'])

Saída

As novas colunas mês, ano e total_vendas nos ajudarão a analisar a tendência de vendas ao longo do tempo. Agora podemos usar essas colunas para traçar gráficos diferentes usando a biblioteca matplotlib para obter alguns insights de sample_sales_data.

Visualização de dados

Até agora, lemos e processamos nossos dados para usá-los para traçar diferentes gráficos usando a biblioteca matplotlib em Python. Matplotlib fornece gráficos de linhas, barras e dispersão para visualizar os dados.

Visualização do total de vendas ao longo do tempo

Para visualizar o total de vendas ao longo do tempo, podemos traçar um gráfico de linhas usando matplotlib. Para visualizar isso, temos que -

  • Agrupe os dados por ano e mês

  • Crie um gráfico de linhas usando matplotlib

  • Defina os rótulos do título e dos eixos

  • Exibir o gráfico

Exemplo

import matplotlib.pyplot as plt

# Group the data by year and month
sales_by_month = Sales_data.groupby(['YEAR', 'MONTH']).sum()['TOTAL_SALES'].reset_index()

# Create a line chart
plt.plot(sales_by_month.index, sales_by_month.values)

# Set the title and axis labels
plt.title('Total Sales by Month')
plt.xlabel('Month')
plt.ylabel('Sales ($)')

# Display the chart
plt.show()

Saída

Visualização da receita anual ao longo do tempo

Podemos visualizar a receita anual de cada ano e ver qual ano tem a maior receita e qual ano tem a menor receita até agora. Para fazer isso, temos que -

  • Agrupe os dados de vendas por ano

  • Crie um gráfico de barras usando Seaborn que usa matplotlib abaixo

  • Defina os rótulos do título e dos eixos

  • Exibir o gráfico

Exemplo

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt
import seaborn as sns

# Annual Revenue
plt.figure(figsize=(10,6))
yearly_revenue = Sales_data.groupby(['YEAR'])['TOTAL_SALES'].sum().reset_index()
sns.barplot(x="YEAR", y="TOTAL_SALES", data=yearly_revenue)

plt.title('Annual Revenue', fontsize = 20)
plt.xlabel('Year', fontsize = 16)
plt.ylabel('Revenue', fontsize = 16)

plt.show()

Saída

Conclusão

Podemos analisar e visualizar qualquer tipo de dados de vendas de produtos usando matplotlib em Python e obter insights de dados padrão que podem ser usados pela empresa para aumentar as vendas. Analisamos as vendas totais ao longo do tempo e a receita anual no artigo acima usando matplotlib, pandas e numpy em Python.

Artigos relacionados: