Skip to main content

Strumento Campionatore

Campionatore consente di suddividere le righe di input in 2 o 3 campioni casuali. Lo strumento consente di specificare la percentuale di righe da inserire in ogni campione. Se il totale è inferiore al 100%, le righe rimanenti vengono inserite nel campione di holdout, ovvero nell'ancoraggio H.

Configurazione dello strumento

  1. Seleziona Allocazione righe. La somma delle percentuali di Campione 1 e Campione 2deve essere minore o uguale al 100%. Se il totale è inferiore al 100%, la percentuale residua viene inviata in output all'ancoraggio H:

    • Campione 1: viene inviato in output all'ancoraggio E. Indica la percentuale dei dati da inserire nel campione di stima (valore compreso fra l'1% e il 99%).

    • Campione 2: viene inviato in output all'ancoraggio V. Indica la percentuale dei dati da inserire nel campione di convalida (valore compreso fra l'1% e il 99%).

  2. Inserisci un Valore iniziale casuale, costituito da un numero intero compreso fra 1 e 1000, che fornisce il punto di partenza per la generazione dei numeri casuali. Se modifichi questo valore, il campione in cui viene inserita una determinata riga di dati cambia. A meno che non vi sia un motivo specifico per modificarlo, è consigliabile utilizzare 1, l'impostazione predefinita.

Visualizzazione dell'output

Lo strumento Campionatore genera 3 output:

  • Ancoraggio E: il flusso di output di stima contiene un campione casuale di righe di input. Il numero delle righe presenti in questo flusso è uguale alla percentuale delle righe totali specificata in Campione 1.

  • Ancoraggio V: il flusso di convalida contiene un campione casuale di righe di input. Il numero delle righe presenti in questo flusso è uguale alla percentuale delle righe totali specificata in Campione 2.

  • Ancoraggio H: il flusso di holdout include tutte le righe rimanenti, che non sono state inserite nel campione di stima o in quello di convalida.

Se il numero delle righe è dispari, e sia il campione di stima che quello di convalida sono impostati sul 50%, il flusso di output inviato all'ancoraggio E contiene 1 riga in più, rispetto al flusso inviato all'ancoraggio V.