Skip to main content

Three partially full beakers Ferramenta Amostra

Fluxo de trabalho de exemplo

A ferramenta Amostra tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.

Use a ferramenta Amostra para limitar o fluxo de dados para um número, porcentagem ou conjunto aleatório de linhas especificado. Além disso, a ferramenta Amostra aplica a configuração escolhida às colunas selecionadas para agrupamento.

Configurar a ferramenta

  1. Selecione o tipo de amostra. As opções são...

    • Primeiras N linhas : retorna todas as linhas nos dados, desde o início até a linha N.

    • Últimas N linhas : começando a partir da linha que está a N linhas do final dos dados, retorna todas as linhas até o final dos dados.

    • Ignorar as 1ªs N linhas : retorna todas as linhas nos dados, começando depois da linha N.

    • 1 de cada N linhas : retorna a primeira linha de cada grupo de N linhas.

    • 1 em N chances de incluir cada linha : determina aleatoriamente se cada linha será incluída na amostra, de maneira independente da inclusão de quaisquer outras linhas. Esse método de seleção resulta em N sendo uma aproximação.

      Nota

      Se você tiver 1.000 linhas, selecionar uma amostra aleatória e especificar N como 10, talvez você espere obter 100 linhas retornadas. No entanto, você pode obter entre 75 e 150 registros retornados.

    • Primeiros N% de linhas : retorna N por cento das linhas. A seleção dessa opção requer que os dados passem pela ferramenta duas vezes: a primeira para contar as linhas e a segunda para retornar a porcentagem de linhas especificada.

  2. Digite um número na caixa N= para especificar o valor de N.

  3. Agrupar por coluna (opcional) : se um ou mais grupos forem especificados, N linhas serão retornadas para cada grupo.

    Nota

    Se você escolher agrupar por uma coluna denominada "Cidades", especificar N como 2 e selecionar "Primeiras N linhas", o Alteryx retornará as duas primeiras linhas para cada cidade nos dados.