Ferramenta Criar Amostras
Fluxo de trabalho de exemplo
A ferramenta Criar Amostras tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.
Use a ferramenta Criar Amostras para dividir os registros de entrada em duas ou três amostras aleatórias. Na ferramenta, você pode especificar a porcentagem de registros desejada nas amostras de treinamento e de validação. Se o total for inferior a 100%, os registros restantes serão colocados na amostra de teste (holdout).
Configurar a ferramenta
Porcentagem para a amostra de treinamento : a porcentagem dos dados a ser colocada na amostra de treinamento (entre 1% e 99%).
Porcentagem para a amostra de validação : a porcentagem dos dados a ser colocada na amostra de validação (entre 1% e 99%).
Semente aleatória : um valor inteiro entre 1 e 1.000. A alteração desse valor modifica a amostra na qual uma linha individual de dados é colocada. A menos que haja um motivo específico para alterá-lo, o valor padrão recomendado é 1.
Visualizar a saída
Há três âncoras que saem da ferramenta Criar Amostras:
Âncora E : o fluxo de saída de treinamento contém uma amostra aleatória dos registros da entrada. A contagem de registros neste fluxo é igual à porcentagem do total de registros especificada na configuração da amostra de treinamento acima.
Âncora V : o fluxo de validação contém uma amostra aleatória dos registros da entrada. A contagem de registros neste fluxo é igual à porcentagem do total de registros especificada na configuração da amostra de validação acima.
Âncora H : o fluxo de teste (holdout) inclui todos os registros que não foram colocados nas amostras de treinamento e de validação.
Se houver um número ímpar de registros e as configurações para as amostras de treinamento e validação estiverem definidas como 50%, o fluxo de saída de treinamento terá um registro a mais do que o de validação.