Analisi predittive
Designer include una suite di strumenti predittivi che utilizzano R, una base di codice open source utile per l'analisi statistica e predittiva.
La suite include strumenti per l'esplorazione dei dati, elementi specializzati della preparazione dei dati per l'analisi predittiva, la modellazione predittiva, strumenti per confrontare e valutare l'efficacia di diversi modelli, strumenti per raggruppare record e campi in modo sistematico e strumenti per implementare soluzioni di analisi predittiva.
Gli strumenti predittivi utilizzano il linguaggio di programmazione R. Vai a Opzioni > Scarica Strumenti predittivi e accedi al portale Download e licenze di Alteryx per installare R e i pacchetti utilizzati dallo strumento R .
Supporto In-Database
Sono disponibili sei strumenti predittivi nel supporto In-Database.
Quando uno strumento predittivo con supporto In-Database viene posizionato sull'area di disegno con un altro strumento In-DB, passa automaticamente alla versione In-DB. Per modificare la versione dello strumento, fai clic con il pulsante destro del mouse sullo strumento, seleziona Scegli versione strumento e seleziona una versione diversa dello strumento. Per ulteriori informazioni sul supporto In-Database e sugli strumenti, consulta la sezione Panoramica di In-Database .
Microsoft SQL Server 2016 | Oracle | Teradata | |
---|---|---|---|
Sì | |||
Sì | |||
Sì | |||
Sì | Sì | Sì | |
Sì | Sì | Sì | |
Sì | Sì | Sì |
Strumenti di analisi predittiva
Questa categoria contiene strumenti per una migliore comprensione dei dati da utilizzare in un progetto di analisi predittiva e strumenti per eseguire attività specializzate di campionamento dei dati per l'analisi predittiva. Gli strumenti per comprendere meglio i dati utilizzati in un progetto di analisi predittiva includono strumenti di visualizzazione e strumenti che forniscono tabelle di statistiche descrittive.
Gli strumenti che aiutano un utente a comprendere meglio i dati da analizzare utilizzando metodi visivi sono:
Gli strumenti che forniscono statistiche di riepilogo utili per aiutare l'utente a comprendere meglio i dati analizzati sono:
Questa categoria include strumenti per la modellazione predittiva generale sia per i modelli di classificazione (campo target categorico) che di regressione (campo target numerico), nonché strumenti per il confronto dei modelli e per il test dell'ipotesi rilevanti per la modellazione predittiva. L'insieme di strumenti per la modellazione predittiva generale può essere ulteriormente suddiviso in modelli statistici tradizionali e metodi di apprendimento statistico più moderni. Un singolo strumento Punteggio fornisce un meccanismo per ottenere previsioni di modello da entrambi i tipi di strumenti di modellazione predittiva generale.
Un'importante distinzione tra i modelli statistici tradizionali e i più moderni metodi di apprendimento statistico è il livello di intervento diretto dell'utente nel processo di modellazione. I modelli statistici tradizionali richiedono un livello molto maggiore di intervento e competenza degli utenti per sviluppare un modello con un adeguato grado di efficacia predittiva. In particolare, l'utente deve pre-selezionare i campi predittivi importanti e probabilmente dovrà applicare trasformazioni appropriate ai campi numerici per determinare gli effetti non lineari tra il campo target e i predittori continui. La selezione dei predittori importanti (ignorando possibili problemi dovuti a relazioni non lineari) può essere assistita attraverso l'uso di regressione graduale per i modelli tradizionali. Al contrario, i moderni metodi di apprendimento statistico fanno uso di algoritmi che internamente eseguono la selezione del predittore e si occupano di possibili relazioni non lineari tra i predittori target e quelli numerici.
I modelli statici tradizionali differiscono l'uno dall'altro in base alla natura del campo target di cui viene eseguita la stima. Tutti questi modelli sono basati sulla stima (generalizzata) di modelli lineari. Anche se tutti gli algoritmi di apprendimento statistico hanno la stessa proprietà di gestire internamente la selezione del predittore e gli effetti non lineari, differiscono nei rispettivi approcci. Di conseguenza, nessun singolo metodo offre risultati migliori rispetto ad altri se si considera l'insieme di problemi che un utente potrebbe riscontrare.
Strumenti per i modelli statistici tradizionali
Strumenti per il metodo di apprendimento statistico moderno
Strumenti per il confronto dei modelli predittivi e il test dell'ipotesi
Strumento per la previsione dei valori di tutti gli strumenti di modellazione predittiva generale
Strumento per la creazione di visualizzazioni di rete interattive e statistiche di riepilogo chiave
Strumenti per la generazione di modelli di sopravvivenza e per la stima del rischio relativo e del tempo di sopravvivenza medio limitato
Gli strumenti Test AB assistono l'utente nell'esecuzione di prove Test A/B (noti anche come prove di test e apprendimento), come l'esame dell'effetto di una nuova campagna di comunicazione di marketing sulle vendite o dell'effetto del cambiamento dei livelli di personale del negozio. Gli strumenti possono aiutare a determinare le aree di mercato per un test (di solito per un test che preveda la pubblicità tramite mass media in modo che tutti residenti in quella area possano potenzialmente essere esposti alla pubblicità), abbinando una o più unità di controllo a ciascuna unità di trattamento, sviluppando misure di stagionalità e tendenza su cui si basa spesso l'abbinamento dei controlli ai trattamenti ed eseguendo l'analisi effettiva dei risultati sperimentali. Gli strumenti associati a questa sottocategoria sono:
Questa categoria contiene diversi strumenti di tracciamento e previsione di serie temporali invariate, regolari (in termini di intervallo di tempo dei dati, ad esempio mensile). Fondamentali tra questi sono gli strumenti per la creazione di modelli ARIMA e di modelli di previsione del livellamento esponenziale estesi che possono essere utilizzati per creare elementi quali un modello di previsione delle vendite settimanali. Entrambi questi metodi sviluppano previsioni basate su elementi sistematici, relativi al tempo nei valori della variabile target. In particolare, rilevano elementi di tendenza (movimento a lungo termine, abbastanza coerente verso l'alto o verso il basso nella variabile target) e stagionalità (pattern ciclici che si ripetono nel tempo).
Per fornire un esempio concreto di tali elementi, un modello di serie temporale di vendite di tablet rivelerebbe probabilmente una tendenza positiva nelle vendite insieme a un forte pattern stagionale di vendite più alte intorno a Natale e prima dell'inizio dell'anno scolastico. Se nella variabile target non sono presenti né tendenza né stagionalità, è probabile che i valori di previsione della variabile target cadano su una linea retta in base al valore medio ponderato del target per i valori più recenti del target. Questo è probabilmente un risultato insoddisfacente per un utente, ma indica che non vi è alcuna struttura reale nei dati rispetto agli elementi solo relativi al tempo (tendenza e stagionalità). In questi casi, metodi di modellazione predittiva più generale possono essere più utili nello sviluppo delle previsioni rispetto agli strumenti delle serie temporali.
Oltre agli strumenti per la creazione di previsioni, sono disponibili strumenti che consentono all'utente di confrontare l'efficacia relativa dei diversi modelli di previsione delle serie temporali. Il set completo di strumenti di serie temporali include:
Questa categoria contiene gli strumenti per raggruppare record o campi in un minor numero di gruppi. Le comuni applicazioni per il raggruppamento dei record consentono di creare segmenti di clienti in base ai pattern di acquisto o alla creazione di un insieme di gruppi di negozi. L'obiettivo ultimo del raggruppamento in queste due aree è quello di creare un numero minore di gruppi che consenta la personalizzazione di programmi e attività in modo fattibile dal punto di vista aziendale.
Ad esempio, per un rivenditore che dispone di 500 punti vendita nella propria rete potrebbe essere difficoltoso sviluppare un programma di commercializzazione e prezzi specifico per ciascun punto vendita. Tuttavia, se i punti vendita rientrano in un gruppo più piccolo di negozi (ad esempio 10) in base alla somiglianza dei punti vendita rispetto ai loro pattern di vendita, la creazione di 10 diversi programmi di commercializzazione e prezzi è un'operazione che il rivenditore può implementare con successo. Analogamente, molte organizzazioni hanno tabelle di database da analizzare molto ampie, con molti campi strettamente correlati tra loro. In questi casi, gestire un gran numero di misure fortemente correlate complica notevolmente le analisi effettuate con questi dati. Di conseguenza, può avere senso ridurre l'insieme originale di campi in un insieme più piccolo di campi compositi che si prestano più facilmente all'analisi. In entrambi questi casi, è necessario ridurre la dimensione dei dati in modo da renderli utilizzabili.
Il metodo più comune utilizzato per raggruppare i record è l'analisi dei cluster. Esistono in realtà svariati tipi di analisi dei cluster, ma i metodi di clustering in assoluto più utilizzati nelle applicazioni aziendali sono basati su algoritmi dei centroidi K. Alteryx fornisce strumenti che consentono di determinare il numero appropriato di cluster (gruppi) da formare, creando l'insieme finale di cluster e aggiungendo ai dati il cluster a cui appartiene un particolare record (indipendentemente dal fatto che il record sia stato utilizzato per determinare l'insieme di cluster). Uno strumento correlato (Trova i vicini più prossimi) consente all'utente di formare gruppi ad hoc di una data dimensione intorno a uno o più record specifici. Ad esempio, gli strumenti offrono all'utente la possibilità di trovare i cinque clienti più simili al cliente "X" in base ai comportamenti di acquisto passati. Il metodo disponibile per il raggruppamento dei campi è costituito dai componenti principali.
Gli strumenti di Market Basket Analysis consentono di determinare quali elementi vanno insieme nei dati relativi ai punti vendita oppure la combinazione di problemi che tende a verificarsi nei sistemi di segnalazione dei difetti e degli ordini di lavoro. Gli strumenti della categoria determinano l'insieme di "regole" nei dati (ad esempio, "il difetto A del prodotto è più probabile che sia presente quando si osservano anche i difetti B e C dello stesso prodotto") e forniscono opzioni di filtro per restringere l'elenco delle possibili regole in base a una serie di criteri associati a regole che con maggiore probabilità le rendono praticamente più importanti.
Gli strumenti di questa categoria includono:
Questa categoria include strumenti che possono aiutare a determinare la migliore linea d'azione o risultato per una particolare situazione o serie di scenari. Può contribuire ad aumentare l'output dei modelli predittivi prescrivendo un'azione ottimale.