Skip to main content

Ferramenta Amostra

Use a ferramenta Amostra para limitar o fluxo de dados para um número, porcentagem ou conjunto aleatório de linhas especificado. Além disso, a ferramenta Amostra aplica a configuração escolhida às colunas selecionadas para agrupamento.

Dica

Esta ferramenta tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente no Designer Cloud.

Componentes da ferramenta

Sample Data anchors.png

Imagem: ferramenta Amostra com âncoras.

A ferramenta Amostra tem duas âncoras.

  • Âncora de entrada: use a âncora de entrada para selecionar os dados que deseja usar para criar a amostra.

  • Âncora de saída: faz a saída da amostra dos dados.

Configurar a ferramenta

  1. Selecione um modo de amostragem. O valor de N é selecionado usando a caixa de texto depois dos métodos de amostragem e está limitado a 16 caracteres. As opções são...

    • Primeiras N linhas : retorna todas as linhas nos dados desde o início até a linha N.

    • Últimas N linhas : começando a partir da linha que está a N linhas do final dos dados, retorna todas as linhas até o final dos dados.

    • Skip 1st N Rows: Returns all rows in the data starting after row N.

    • 1 de cada N linhas : retorna a primeira linha de cada grupo de N linhas.

    • Primeiros N% de linhas : retorna N por cento das linhas. A seleção dessa opção requer que os dados passem pela ferramenta duas vezes: a primeira para contar as linhas e a segunda para retornar a porcentagem de linhas especificada.

    • 1 em N chances de incluir cada linha : determina aleatoriamente se cada linha será incluída na amostra, de maneira independente da inclusão de quaisquer outras linhas.

      Nota

      A opção 1 em N chances de incluir cada linha retorna uma aproximação. Por exemplo, se você tiver 1.000 linhas, selecionar essa opção de amostra aleatória e especificar N como 10, pode ser que você espere que a ferramenta retorne 100 linhas. No entanto, ela pode retornar entre 75 e 150 linhas.

  2. Digite um número na caixa N= para especificar o valor de N.

  3. Agrupar para agrupamento : se grupos forem especificados, N linhas serão retornadas para cada grupo. Esta opção não está disponível para o método de amostragem 1 em N chances de incluir cada linha .

    Nota

    Se você escolher agrupar por uma coluna denominada [Cidades], especificar N como 2 e selecionar "Primeiras N linhas", o Designer Cloud retornará as duas primeiras linhas para cada cidade nos dados.