Esempio di uno strumento
Lo strumento Punteggio presenta l'opzione Esempio di uno strumento. Visita Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.
Lo strumento Punteggio crea una stima di una variabile target applicando un modello R a un set di variabili predittive fornite. Se la variabile target è categorica, indica le probabilità che un record (basato sulla variabile predittiva) appartenga a ciascuna categoria. Se la variabile target è continua, indica una stima del valore della variabile target. Lo strumento può essere utilizzato per valutare le prestazioni del modello, ma non opera da solo.
Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Download e licenze di Alteryx per installare R e i pacchetti utilizzati dallo strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.
Lo strumento Punteggio è in grado di valutare i modelli da una serie di posizioni:
Modello locale: il modello viene inserito nel flusso di lavoro da un computer locale o è accessibile all'interno di un database.
Modello Promote: il modello è memorizzato nel sistema di gestione dei modelli Promote.
Lo strumento Punteggio può essere configurato per i modelli a cui si accede tramite un flusso di lavoro standard o per quelli a cui si accede tramite la suite In-DB.
Lo strumento Punteggio richiede due input:
L'oggetto modello prodotto in uno strumento predittivo basato su R.
Un flusso di dati che contiene i campi predittivi selezionati nella configurazione del modello. Può trattarsi di un flusso di dati Alteryx standard o di un flusso di metadati XDF.
Collega questi input all'input dello strumento Punteggio per iniziare la configurazione.
Lo strumento Punteggio può utilizzare un flusso di dati di un modello predittivo, anche se è stato stimato utilizzando una funzione RevoScaleR. Lo strumento Punteggio può utilizzare un flusso di metadati XDF solo se l'input per lo strumento di modellazione proveniva da uno strumento Output XDF o Input XDF e se il modello era stato stimato utilizzando una funzione RevoScaleR.
I modelli stimati da Oracle R Enterprise utilizzando uno strumento predittivo In-DB collegato a un'origine dati Oracle non possono essere utilizzati per assegnare un punteggio a un flusso di dati Alteryx standard, sebbene i modelli stimati con un flusso di dati Alteryx standard possano essere utilizzati per assegnare punteggi alle origini dati Oracle.
Le modifiche eseguite tramite questa opzione sono valide solo se il target è una variabile categorica binaria.
Il nuovo nome (target continuo) o prefisso (target categorico) del campo: il nome o il prefisso del campo deve iniziare con una lettera e può contenere lettere, numeri e i caratteri speciali "." (punto) e "_" (sottolineatura). R fa distinzione tra maiuscole e minuscole.
Il campo target ha un valore sovracampionato: questi campi vengono utilizzati per correggere le probabilità previste allineandole alle percentuali reali del campione. Seleziona per fornire:
Il valore del campo target sovracampionato: il nome del campo sovracampionato.
La percentuale del valore sovracampionato nei dati originali prima del sovracampionamento: la percentuale di valori ripetuti durante il sovracampionamento.
Opzioni di sola regressione lineare non regolarizzata:
Modelli creati da ORE
Se utilizzi un modello creato da ORE, la tabella di stima originale deve essere presente nel database per calcolare gli intervalli di confidenza.
Il campo target è stato trasformato utilizzando il logaritmo naturale: seleziona per applicare una trasformazione che riporti i valori alla scala originale e utilizza uno Smearing estimator per tenere conto del bias introdotto dalla trasformazione.
Includi un intervallo di confidenza della previsione: seleziona per specificare il valore utilizzato per calcolare gli intervalli di confidenza.
Opzioni specifiche di Input XDF:
Aggiungi punteggi al file XDF di input: seleziona per aggiungere punteggi al file XDF di input anziché inserirli in un flusso di dati Alteryx.
Numero di record contemporanei a cui assegnare un punteggio: seleziona il numero di record in un gruppo. I dati di input vengono valutati per singoli gruppi per evitare la limitazione dell'elaborazione in memoria di R.
Lo strumento Punteggio supporta l'elaborazione In-Database Oracle, Microsoft SQL Server 2016 e Teradata. Consulta la sezione Panoramica In-Database per ulteriori informazioni sul supporto In-Database e sugli strumenti.
Per accedere alla versione In-DB dello strumento Punteggio:
Inserisci uno strumento In-Db nell'area di disegno. Lo strumento Punteggio passa automaticamente alla versione In-DB.
Fai clic con il pulsante destro del mouse sullo strumento Punteggio, seleziona Scegli versione strumento e scegli la versione In-DB.
Per ulteriori informazioni sul supporto In-Database predittivo, consulta la sezione Analisi predittiva.
Lo strumento Punteggio richiede due input:
L'oggetto modello prodotto in uno strumento predittivo basato su R.
Un flusso di dati che contiene i campi predittivi selezionati nella configurazione del modello. Può trattarsi di un flusso di dati Alteryx standard o di un flusso di metadati XDF.
Collega questi input all'input dello strumento Punteggio per iniziare la configurazione.
Modelli supportati
Lo strumento Punteggio può utilizzare un flusso di dati di un modello predittivo, anche se è stato stimato utilizzando una funzione RevoScaleR. Lo strumento Punteggio può utilizzare un flusso di metadati XDF solo se l'input per lo strumento di modellazione proveniva da uno strumento Output XDF o Input XDF e se il modello era stato stimato utilizzando una funzione RevoScaleR.
I modelli stimati da ORE utilizzando uno strumento predittivo In-DB collegato a un'origine dati Oracle non possono essere utilizzati per assegnare un punteggio a un flusso di dati Alteryx standard, sebbene i modelli stimati con un flusso di dati Alteryx standard possano essere utilizzati per assegnare un punteggio alle origini dati Oracle.
Non sono consentiti altri caratteri speciali e lo strumento R fa distinzione tra maiuscole e minuscole.
Nome tabella di output: digita il nome della tabella in cui vengono salvati i risultati nel database.
Il nuovo nome (target continuo) o prefisso (target categorico) del campo: il nome o il prefisso del campo deve iniziare con una lettera e può contenere lettere, numeri e i caratteri speciali "." (punto) e "_" (sottolineatura).
Il campo target ha un valore sovracampionato: questi campi vengono utilizzati per correggere le probabilità previste allineandole alle percentuali reali del campione. Le modifiche eseguite tramite questa opzione sono valide solo se il target è una variabile categorica binaria. Seleziona per fornire:
Il valore del campo target sovracampionato: il nome del campo sovracampionato.
La percentuale del valore sovracampionato nei dati originali prima del sovracampionamento: la percentuale di valori ripetuti durante il sovracampionamento.
Opzioni solo di regressione lineare:
Modelli creati da ORE
Se utilizzi un modello creato da ORE, la tabella di stima originale deve essere presente nel database per calcolare gli intervalli di confidenza.
Il campo target è stato trasformato utilizzando il logaritmo naturale: seleziona per applicare una trasformazione che riporti i valori alla scala originale e utilizza uno Smearing estimator per tenere conto del bias introdotto dalla trasformazione.
Includi un intervallo di confidenza della previsione: seleziona per specificare il valore utilizzato per calcolare gli intervalli di confidenza.
Configurazione specifica di Teradata: Microsoft Machine Learning Server richiede ulteriori informazioni di configurazione in merito alla piattaforma Teradata da utilizzare. Queste informazioni vengono generalmente fornite da un amministratore locale di Teradata.
I percorsi del server Teradata agli eseguibili binari di R.
La posizione temporanea in cui vengono scritti i file utilizzati da Microsoft Machine Learning Server.
Origine modello: seleziona l'origine dell'oggetto modello che viene trasferito all'input (M) dello strumento Punteggio. Può essere:
Nel database, identificato dal valore nel campo "Nome" del flusso di dati.
Contenuto nel campo "Oggetto" del flusso di dati.
L'output include i flussi di dati originali con i valori previsti del modello. Nel caso di un modello che utilizza un target categorico, una probabilità prevista per ogni livello della variabile target è fornita in un nome di campo composto dal prefisso fornito dall'utente e dal suffisso del campo che corrisponde al livello possibile della variabile target.
Promote è una piattaforma per l'implementazione, la gestione e la scalabilità di modelli predittivi. Alteryx può connettersi alla piattaforma Promote per accedere ai modelli memorizzati per valutarli.
Stabilisci una connessione a Alteryx Promote.
Connessione Alteryx Promote: menu a discesa utilizzato per selezionare una delle connessioni Promote salvate.
Aggiungi connessione: un'opzione da aggiungere all'elenco delle connessioni Promote disponibili. Il Connection Manager di Promote funziona indipendentemente dai flussi di lavoro.
Fai clic su Aggiungi connessione.
Nella finestra Aggiungi connessione, inserisci un URL Alteryx Promote che punta alla posizione in cui è memorizzato il modello.
Seleziona Avanti.
Nella finestra Credenziali Alteryx Promote, immetti Nome utente e Chiave API.
Seleziona Connetti.
Se l'operazione ha esito positivo, nella finestra Connessione stabilita, seleziona Fine. La nuova connessione viene selezionata e appare nel menu a discesa.
Seleziona una connessione esistente.
Seleziona Rimuovi connessione.
Nella finestra Conferma, verifica che l'URL e il nome utente siano associati alla connessione che desideri rimuovere.
Seleziona OK. La connessione non è più disponibile nel menu a discesa.
Se non si è sicuri di avere accesso alla funzione Promote o si necessita di assistenza per trovare le credenziali richieste, contatta l'amministratore locale o il rappresentante dell'assistenza.
Viene generato un elenco dei modelli a cui puoi accedere. Scorri l'elenco o utilizza la funzione di ricerca per trovare il modello a cui assegnare il punteggio e selezionare il relativo percorso.
Una volta selezionato il percorso di un modello, le informazioni relative al modello vengono compilate.
Nome: il nome del modello.
Proprietario: il proprietario del modello.
Stato: lo stato attuale del modello, che ne riflette l'accessibilità.
Online: il modello è aggiornato e pronto per l'elaborazione dei dati.
In definizione: il modello è in fase di aggiornamento e non è in grado di elaborare i dati.
Test unità non riuscito: la definizione del modello è terminata ma i componenti non sono stati creati correttamente. Il modello non è in grado di elaborare i dati.
Non riuscito: il modello non è stato definito correttamente e non è in grado di elaborare i dati.
Offline: il modello non è stato definito e non è in grado di elaborare i dati.
Ultimo aggiornamento: la data e l'ora dell'ultima definizione del modello.
Verifica che il modello sia disponibile per l'elaborazione dei dati e seleziona Fine.
Riepilogo configurazione fornisce un riassunto delle credenziali utilizzate e il riepilogo del modello selezionato.