Análise ativa de vendas de produtos usando matplotlib em Python
Matplotlib em Python possui várias funções como read_csv,sort_values,group_by, etc. para realizar análises de dados de vendas. Cada empresa online envolvida na venda de produtos de qualquer tipo usa a análise de dados de vendas de produtos para aumentar suas vendas e conhecer melhor seus clientes. Qualquer empresa envolvida em qualquer tipo de negócio de comércio eletrônico usa seus dados de vendas e clientes para identificar tendências, padrões e insights que podem ser usados para melhorar as vendas e receitas. Os dados de vendas podem ser usados para determinar qual produto tem maior tração, qual época festiva tem maior demanda e muitas outras tendências que podem ajudar a aumentar as vendas.
Python é uma linguagem de programação popular para análise e visualização de dados. Python fornece muitas bibliotecas e ferramentas que podem ser usadas para fazer análises de vendas de produtos de maneira eficaz. Neste artigo, usaremos Matplotlib, que é uma biblioteca popular de visualização de dados em Python para fazer análises ativas de vendas de produtos.
Estaremos usando dados de vendas de amostra para análise de vendas de produtos ativos usando numpy, pandas e matplotlib. Os dados de vendas de amostra podem ser encontrados aqui.
Análise de dados de vendas StepWise
Leitura e processamento de dados
Os dados de vendas de amostra usados neste exemplo para análise têm as seguintes colunas -
Order_Number |
Product_type |
Quantity |
Price_Each |
Order_Date |
Address |
Order Number - Número exclusivo para cada pedido feito.
Product_Type - Categoria do produto
Quantidade - quantidade do produto pedido
Price Each - Preço por unidade
Order Date - Data e hora em que o pedido foi feito
-
Address - Endereço onde o produto foi entregue.
Teremos que importar pandas e numpy que podem ser usados para ler e processar os dados de vendas de amostra. Aqui está o código para ler os dados -
Os dados de vendas de amostra podem ser encontrados na plataforma Kaggle aqui.
Exemplo
import pandas as pd
import numpy as np
import io
from google.colab import files
uploaded = files.upload()
# read csv data
Sales_data = pd.read_csv(io.BytesIO(uploaded['sample_sales_data.csv']), encoding='cp1252')
Sales_data.sort_values(by=['ORDER_NUMBER'])
Saída
Depois de lermos os dados, temos que fazer o processamento dos dados. A coluna Data do pedido precisa ser convertida em um objeto DateTime e podemos extrair mês e ano da data do pedido e adicionar uma nova coluna para mês, ano e total de vendas. O código para limpeza e processamento de dados é mostrado abaixo -
Exemplo
Sales_data['ORDER_DATE'] = pd.to_datetime(Sales_data['ORDER_DATE'])
Sales_data['MONTH'] = Sales_data['ORDER_DATE'].dt.month
Sales_data['YEAR'] = Sales_data['ORDER_DATE'].dt.year
Sales_data['TOTAL_SALES'] = Sales_data['QUANTITY'] * Sales_data['PRICE_EACH']
Sales_data.sort_values(by=['ORDER_NUMBER'])
Saída
As novas colunas mês, ano e total_vendas nos ajudarão a analisar a tendência de vendas ao longo do tempo. Agora podemos usar essas colunas para traçar gráficos diferentes usando a biblioteca matplotlib para obter alguns insights de sample_sales_data.
Visualização de dados
Até agora, lemos e processamos nossos dados para usá-los para traçar diferentes gráficos usando a biblioteca matplotlib em Python. Matplotlib fornece gráficos de linhas, barras e dispersão para visualizar os dados.
Visualização do total de vendas ao longo do tempo
Para visualizar o total de vendas ao longo do tempo, podemos traçar um gráfico de linhas usando matplotlib. Para visualizar isso, temos que -
Agrupe os dados por ano e mês
-
Crie um gráfico de linhas usando matplotlib
Defina os rótulos do título e dos eixos
Exibir o gráfico
Exemplo
import matplotlib.pyplot as plt
# Group the data by year and month
sales_by_month = Sales_data.groupby(['YEAR', 'MONTH']).sum()['TOTAL_SALES'].reset_index()
# Create a line chart
plt.plot(sales_by_month.index, sales_by_month.values)
# Set the title and axis labels
plt.title('Total Sales by Month')
plt.xlabel('Month')
plt.ylabel('Sales ($)')
# Display the chart
plt.show()
Saída
Visualização da receita anual ao longo do tempo
Podemos visualizar a receita anual de cada ano e ver qual ano tem a maior receita e qual ano tem a menor receita até agora. Para fazer isso, temos que -
Agrupe os dados de vendas por ano
Crie um gráfico de barras usando Seaborn que usa matplotlib abaixo
Defina os rótulos do título e dos eixos
Exibir o gráfico
Exemplo
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# Annual Revenue
plt.figure(figsize=(10,6))
yearly_revenue = Sales_data.groupby(['YEAR'])['TOTAL_SALES'].sum().reset_index()
sns.barplot(x="YEAR", y="TOTAL_SALES", data=yearly_revenue)
plt.title('Annual Revenue', fontsize = 20)
plt.xlabel('Year', fontsize = 16)
plt.ylabel('Revenue', fontsize = 16)
plt.show()
Saída
Conclusão
Podemos analisar e visualizar qualquer tipo de dados de vendas de produtos usando matplotlib em Python e obter insights de dados padrão que podem ser usados pela empresa para aumentar as vendas. Analisamos as vendas totais ao longo do tempo e a receita anual no artigo acima usando matplotlib, pandas e numpy em Python.