Ferramenta Amostra
Use a ferramenta Amostra para limitar o fluxo de dados para um número, porcentagem ou conjunto aleatório de linhas especificado. Além disso, a ferramenta Amostra aplica a configuração escolhida às colunas selecionadas para agrupamento.
Componentes da ferramenta
![]() |
Imagem: ferramenta Amostra com âncoras.
A ferramenta Amostra tem duas âncoras.
Âncora de entrada: use a âncora de entrada para selecionar os dados que deseja usar para criar a amostra.
Âncora de saída: faz a saída da amostra dos dados.
Configurar a ferramenta
Selecione um modo de amostragem. O valor de N é selecionado usando a caixa de texto depois dos métodos de amostragem e está limitado a 16 caracteres. As opções são...
Primeiras N linhas: retorna todas as linhas nos dados desde o início até a linha N.
Últimas N linhas: começando a partir da linha que está a N linhas do final dos dados, retorna todas as linhas até o final dos dados.
Ignorar as 1ªs N linhas: retorna todas as linhas nos dados, começando depois da linha N.
1 de cada N linhas: retorna a primeira linha de cada grupo de N linhas.
Primeiros N% de linhas: retorna N por cento das linhas. A seleção dessa opção requer que os dados passem pela ferramenta duas vezes: a primeira para contar as linhas e a segunda para retornar a porcentagem de linhas especificada.
1 em N chances de incluir cada linha: determina aleatoriamente se cada linha será incluída na amostra, de maneira independente da inclusão de quaisquer outras linhas.
Nota
A opção 1 em N chances de incluir cada linha retorna uma aproximação. Por exemplo, se você tiver 1.000 linhas, selecionar essa opção de amostra aleatória e especificar N como 10, pode ser que você espere que a ferramenta retorne 100 linhas. No entanto, ela pode retornar entre 75 e 150 linhas.
Digite um número na caixa N= para especificar o valor de N.
Colunas para agrupamento (opcional): se grupos forem especificados, N linhas serão retornadas para cada grupo. Esta opção não está disponível para o método de amostragem 1 em N chances de incluir cada linha.
Nota
Se você escolher agrupar por uma coluna denominada [Cidades], especificar N como 2 e selecionar "Primeiras N linhas", o Designer Cloud retornará as duas primeiras linhas para cada cidade nos dados.
