
Ferramenta De Amostragem De Simulação
Versão:
2023.1
Last modified: November 02, 2021
A ferramenta de amostra de simulação mostra os dados paramétricos de uma distribuição, de dados de entrada ou como uma combinação melhor adequada a uma distribuição. Os dados também podem ser "desenhados" se você não tiver certeza dos parâmetros de uma distribuição e falta de dados.
Esta ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela Ferramenta R. Consulte Baixar e utilizar ferramentas preditivas.
Conectar entradas
- D âncora: opcional. Dados de exemplo. Essa entrada é necessária se você estiver amostragem de dados RAW ou Binned.
- S âncora: opcional. Dados de simulação. Se as ferramentas de simulação anteriores tiverem sido usadas, os dados deles poderão ser conectados a esta entrada para anexar os dados e obter uma contagem de iteração e semente.
Configuração de ferramentas
- Selecione o mecanismo de amostragem: Monte Carlo/amostragem simples ou hipercubo latino/amostragem estratificada. Para a amostragem estratificada de dados, o tamanho máximo dos estratos é determinado pela escolha do tamanho do bloco.
- Tamanho do pedaço: O tamanho máximo de dados para avaliar de cada vez. Isso pode ser usado para evitar a limitação de processamento de R na memória. Para a amostragem estratificada dos dados, este é igualmente o tamanho máximo dos estratos.
- Semente: A semente aleatória usada para amostragem. Essa opção não estará disponível se um DataSet contendo um campo de semente estiver conectado à entrada S, pois essa semente será incrementada e usada em vez disso.
- Número de iterações: O número de amostras para selecionar. Esta opção não estará disponível se um DataSet estiver conectado à entrada S, como o tamanho desse DataSet determina o número de iterações.
- Selecione o modo de amostragem:
- Amostrar parametricamente
- Para amostragem paramétrica, não conecte um fluxo de dados à entrada D.
- Insira o nome para os dados de saída: Especifique um nome de campo para o campo de saída.
- Selecione a distribuição: Selecione na lista de distribuições suportadas. Junto com os parâmetros, isso determina o enredo da função de densidade/massa retratada cumulativa.
- Insira parâmetros e limites: Para definir os parâmetros para a distribuição, use os controles deslizantes ou as setas para cima/para baixo para ajustar os valores ou inserir valores manualmente. Junto com a distribuição selecionada, isso determina o enredo da função de densidade/massa retratada cumulativa. Opcionalmente, você pode especificar limites para a distribuição. Se os limites forem especificados, a amostragem de rejeição é usada para garantir que as amostras desenhadas estejam entre os limites inferiores e superiores. Limites são inclusivos.
- Para amostragem paramétrica, não conecte um fluxo de dados à entrada D.
- Amostra de dados
- Conecte um fluxo de dados à entrada D ou à amostra via entrada manual.
- Amostra com substituição: Selecione esta opção para amostrá-lo com substituição.
- Especifique o tipo de dados: Selecione uma das opções de dados.
- Dados brutos (não Binned): Selecione os campos a serem amostrados e, em seguida, uma estratégia de amostragem (veja abaixo).
- Dados Binned: Requer um campo de ID e um campo de valor com compartimentos igualmente espaçados. (IDs são números igualmente espaçados.) Especifique um nome para os dados de saída (nome do campo de resultado), estratégia de amostragem (veja abaixo), campo ID para os dados Binned e o campo valor para os dados Binned.
- Entrada manual: Insira dados manualmente através de um widget de roleta. Insira um nome para os dados de saída (nome do campo de produção) e os parâmetros da roleta widget. Use as opções inferior, superior, Height e num escaninhos para configurar o tamanho da grade. Clique na grade para fornecer a altura das lixeiras.
- Selecione os campos a serem amostrados: Selecione colunas para dados de amostra.
- Selecione a estratégia de amostragem: Escolha como provar seus dados. Exemplo linhas inteiras, cada coluna independentemente, ou a partir da distribuição de melhor encaixe. Se você optar por amostra da distribuição de melhor ajuste, selecione as distribuições para as quais cabem os dados.
- Conecte um fluxo de dados à entrada D ou à amostra via entrada manual.
- Amostrar parametricamente
Visualizar a saída
Conecte uma ferramenta de procura à âncora de saída para exibir os resultados.
- D âncora: a saída de dados. Este é o resultado da simulação.