Introdução ao Plotly-online usando Python
Como sabemos, Python é uma linguagem amplamente utilizada para Ciência de Dados e Análise de Dados. Ao lado de bibliotecas como NumPy e Pandas, Plotly é outra biblioteca para representar dados em tabelas e gráficos de todos os tipos. Vamos aprender mais sobre esta biblioteca!
Por que existe uma biblioteca inteira em Python apenas para fins de representação de dados?
Muitos podem pensar que representar alguns dados em um gráfico é simples, mas isso não é nada simples! Para pequenas quantidades de dados, é uma tarefa um tanto fácil traçar gráficos manualmente. Mas ao lidar com grandes quantidades de dados, torna-se impossível traçar gráficos manualmente e estudá-los. Para isso, Plotly está lá para ajudar.
Os objetos plotly são muito fáceis de usar e nos ajudam a traçar vários tipos de gráficos e tabelas, como gráficos de dispersão, gráficos de linhas, gráficos de barras, gráficos de pizza, gráficos de caixa, etc.
Instalação do Módulo
Para instalar o módulo Plotly em seu PC, vá ao terminal Python e digite ‘pip install plotly’ e ‘pip install chart-studio’. Isso levará algum tempo para ser instalado. Após a instalação, podemos passar a usar alguns dados e representá-los visualmente!
Exemplo
import numpy as np
import random
import plotly
import plotly. express as px
x = np.random.randint(low=1, high=84, size=50)
y = np.random.randint(low=51, high=80, size=50)
fig = px.scatter(x=x, y=y)
fig.show()
Este código demonstra um gráfico traçado entre inteiros aleatórios nos eixos X e Y. Manualmente, é difícil traçar esse gráfico com consistência. Primeiramente, importamos todos os módulos necessários para traçar o gráfico. X e Y são as coordenadas e usamos o módulo “aleatório” para escolher inteiros aleatórios dentro dos intervalos mencionados. Então o gráfico gerado é fornecido abaixo:
Aqui, Python gera um gráfico com todos os pontos plotados com precisão. Agora, usando o módulo 'chart_studio', podemos usar o gráfico de forma mais interativa em um site.
Conforme mencionado anteriormente, este módulo pode criar um gráfico de pizza, histograma, etc. muito bem!
Por que você deve usar o Plotly para representação de dados?
Estamos cientes do “Matplotlib”, não é? Matplotlib é usado principalmente para representar gráficos que não são tão complexos. Onde, como no Plotly, o usuário pode interagir perfeitamente com os dados representados. É muito poderoso quando se trata de explicar e explorar dados.
Ao contrário de outras bibliotecas Python, Plotly oferece controle total sobre os dados que estão sendo plotados. Plotly é baseado em Pandas, portanto, transformações complexas de dados podem ser feitas antes de realmente plotar os dados como um gráfico. A forma como os dados são representados depende totalmente do usuário!
Vários gráficos podem ser representados ao mesmo tempo, há uma série de ferramentas interativas e menus suspensos, contendo título, eixo e especificação de fonte de dados em cada menu suspenso.
Existem vários tipos de gráficos e tabelas disponíveis nesta biblioteca. Alguns deles estão listados abaixo:
Gráficos Estatísticos: É o gráfico que representa estatísticas, ou seja, um gráfico que nos mostra tendências gerais sobre algo, por exemplo: Poluição em uma determinada cidade, etc.
-
Gráficos Científicos: representa gráficos de rede em gráficos de radar.
Gráficos Financeiros: São gráficos úteis para acompanhar todos os dados financeiros e são muito úteis para análises de séries temporais, como castiçais, funis e gráficos com marcadores.
O exemplo de código fornecido acima está escrito em Python. Se você é um desenvolvedor que não usa Python, há uma lista de linguagens nas quais o Plotly pode ser usado:
R
Júlia
Javascript (ECMAscript)
ggplot2
Fá#
MATLAB
TRAÇO
Plotly não vem pré-instalado com esses idiomas. Biblioteca gráfica de código aberto dos respectivos idiomas está disponível e pode ser baixada.