Ferramenta Python
A ferramenta Python é um editor de código para usuários do Python. Recomenda-se ter proficiência em Python para utilizar essa ferramenta.
from ayx import Alteryx
Alteryx.help().
Suporte para Python
Designer aceita código Python personalizado. O Alteryx não fornece suporte para código Python personalizado.
Compatibilidade da Galeria pública do alteryx
Planejando publicar seu fluxo de trabalho para Gallery.alteryx.com? Você deve primeiro solicitar uma isenção. Essa restrição não se aplica a instâncias privadas do Alteryx Server e da galeria do Alteryx.
Guia de Introdução
A interface da janela de configuração da ferramenta Python se parece com o Jupyter Notebook. Se você não estiver familiarizado com o Jupyter Notebook, vá para Ajuda > Tour pela interface do usuário ou Ajuda > Ajuda do Notebook. Para obter assistência com código, consulte as referências adicionais disponíveis na opção Ajuda da ferramenta.
Instalar pacotes adicionais de ciência de dados, se necessário
A ferramenta Python inclui os seguintes pacotes mais comuns de ciência de dados:
- ayx: API do Alteryx
- geopandas: estende os tipos de dados usados pelo pandas para permitir operações geográficas em tipos geométricos
- jupyter: metapacote do Jupyter
- matplotlib: pacote de plotagem do Python
- numpy: NumPy, processamento de matrizes para números, cadeias de caracteres, registros e objetos
- pandas: poderosas estruturas de dados para análise de dados, séries temporais e estatísticas
- requests: Python HTTP para humanos
- scikit-learn: um conjunto de módulos do Python para aprendizado de máquina e mineração de dados
- scipy: SciPy, biblioteca científica para Python
- six: utilitários de compatibilidade do Python 2 e 3
- SQLAlchemy: biblioteca de abstração de banco de dados
- statsmodels: computações e modelos estatísticos para Python
Instalação de pacotes adicionais
Dependendo do tipo de instalação do Designer que você está utilizando, é possível instalar pacotes adicionais usando Alteryx.installPackages. O exemplo abaixo instala o keras.
from ayx import Package
Package.installPackages("keras")
- Se você está executando o Alteryx de não administrador, é possível instalar pacotes adicionais do Python sem nenhuma permissão especial.
- Se você está executando o Alteryx de administrador, é necessário executar o Alteryx como administrador para instalar pacotes adicionais do Python. Se você não puder executar o Alteryx como administrador, não será possível instalar pacotes adicionais do Python.
Conectar entradas
A ferramenta Python aceita múltiplas entradas. Uma vez que as entradas estejam conectadas, é necessário executar o fluxo de trabalho para armazenar em cache os fluxos de dados de entrada.
Para acessar uma conexão de dados de entrada:
- Importe a biblioteca do Alteryx: from ayx import Alteryx
- Acesse a conexão e forneça uma variável para usar uma referência de dados:
- Utilize o nome da conexão: Alteryx.read("<nome da conexão>")
- Leia todas as conexões e faça referência à matriz de índice zero retornada: Alteryx.read(Alteryx.getIncomingConnectionNames()[<número de índice>])
-
Execute o fluxo de trabalho antes de começar a trabalhar com a ferramenta Python. A execução do fluxo de trabalho armazena seus dados em cache e os torna acessíveis à ferramenta Python. Seus dados são então tratados como um quadro de dados do pandas. Mais informações sobre quadros de dados do pandas podem ser encontradas em pandas.pydata.org.
from ayx import Alteryx
data1 = Alteryx.read("#1")
from ayx import Alteryx
data2 = Alteryx.read(Alteryx.getIncomingConnectionNames()[1])
Configurar a ferramenta
Execute o fluxo de trabalho antes de começar a trabalhar com a ferramenta Python.
Definir o modo de execução do fluxo de trabalho
Inicie o desenvolvimento usando o modo Interativo. Dessa forma, todos os erros, avisos e comandos de impressão serão exibidos no Jupyter Notebook. Utilize o modo de Produção para melhorar a velocidade quando tiver concluído o desenvolvimento e quiser executar seu código por meio de um interpretador padrão de Python.
Precisa imprimir conjuntos de caracteres multibyte (MBCS)? Consulte a Solução de problemas para imprimir conjuntos de caracteres multibyte (MBCS) no modo de Produção.
Definir o formato de armazenamento dos dados
O formato de armazenamento de back-end padrão e recomendado é YXDB. Como alternativa, você pode selecionar SQLite.
SQLite | YXDB | |
Blob | Não compatível | Compatível |
Objetos geográficos | Não compatível |
Oferece suporte para a passagem de objetos geográficos entre a ferramenta Python e outras ferramentas. É útil para usar as marcações de metadados ao criar saídas de objetos geográficos na ferramenta Python. As colunas de objetos geográficos são carregadas no DataFrame do pandas como cadeias de caracteres contendo geojson. Para enviar uma coluna de dados geográficos (representada como cadeias de caracteres geojson) de volta para a saída da ferramenta Python, o terceiro parâmetro opcional de 'Alteryx.write()' deve ser incluído, especificando o tipo como SpatialObj (objeto geográfico). (por exemplo, "Alteryx.write(df, 1, {'coluna_de_dados_geográficos': {'type': 'SpatialObj'}})") Além disso, vários pacotes como o "geopandas" e suas dependências estão incluídos e podem ser importados para a ferramenta Python para uso adicional de dados geográficos. |
Limitação de coluna | O limite é 2000 | Sem limites |
Valores nulos | Colunas numéricas/byte contendo valores nulos são convertidas para dados do tipo float64 - float de precisão dupla. | YXDB oferece suporte para valores nulos em float64 usando numpy.NaN e em tipos de números inteiros (integer) usando integers do pandas que permitem valor nulo. |
Se você não estiver alterando a organização das linhas ou usando o python geoespacial, a Alteryx recomenda que você corte os dados geoespaciais do conjunto de dados e os adicione novamente depois da ferramenta Python. A razão para isso é que a conversão para e de Alteryx Binary para GeoSpatial não é rápida.
Importar um arquivo ou diretório
Dependendo de quanto controle você deseja ter sobre caminhos relativos, é possível utilizar a função de importação no menu Alteryx ou usar o comando import. É possível importar um script Python ou Jupyter Notebook existente utilizando a função de importação do Alteryx. Caso deseje gerenciar caminhos relativos, utilize o comando import na célula. Exemplos de importação incluem o uso do comando import para importar um diretório e o uso da função de importação do Alteryx para importar um único script.
Para importar um script Python ou Jupyter Notebook
- Clique no menu Alteryx e selecione Importar Script.
- Clique em Escolher arquivo e navegue até um arquivo
.py
ou.ipynb
. - Clique em Importar.
O Alteryx importa o arquivo.
Utilizar o menu Kernel
- Interromper o processamento: clique no menu Kernel e selecione Interromper para parar o processamento.
- Reiniciar o processamento: clique no menu Kernel e selecione a opção Reiniciar para reiniciar o processamento do ambiente interativo.
- Reiniciar o processamento: clique no menu Kernel e selecione a opção Reconectar para limpar a pasta de trabalho de resultados intermediários.
- Alterar kernel não fornece funcionalidade.
- Recomenda-se não selecionar Desligar.
Fazer a saída dos dados da ferramenta
Use Alteryx.write para gerar a saída de dados da ferramenta.
- Para enviar dados para outras ferramentas na tela, use Alteryx.write (<quadro de dados do pandas>, <número da âncora de saída>).
Alteryx.write(df,1)
- Alteryx.write só aceita quadros de dados do pandas. Se seus dados estiverem em outro formato, utilize a biblioteca do pandas para convertê-los em um quadro de dados do pandas. A biblioteca do pandas vem pré-instalada com o Designer e pode ser acessada no Jupyter Notebook usando import pandas.
- É possível enviar até cinco quadros de dados às âncoras de saída.
Práticas recomendadas
As práticas recomendadas a seguir o ajudarão a usar a ferramenta Python com sucesso.