Utilizza lo strumento RegEx per sfruttare la sintassi delle espressioni regolari per analizzare, trovare corrispondenze o sostituire dati.
Suggerimento
Lo strumento presenta l'opzione Esempio di uno strumento. Visita Accesso ai flussi di lavoro di esempio per scoprire come accedere a questo e a molti altri esempi direttamente in Designer Cloud.
Sebbene Designer Cloud supporti le espressioni regolari, gli utenti sono responsabili delle proprie espressioni e del modo in cui queste influiscono sui relativi dati.
Per ulteriori risorse su come scrivere espressioni regolari, consulta https://regex101.com/ , un sito non affiliato ad Alteryx, o RegEx Coach , un'applicazione grafica per Windows non affiliata che può essere utilizzata per prendere dimestichezza in modo interattivo con le espressioni regolari (compatibili con Perl).
Per ulteriori informazioni su Boost RegEx, consulta le risorse seguenti:
Seleziona Colonna da analizzare .
Inserisci la tua Espressione regolare . Utilizza il pulsante con il segno più per visualizzare le espressioni regolari comuni. Per ulteriori informazioni, consulta Sintassi delle espressioni regolari Perl .
Seleziona Distinzione tra maiuscole e minuscole per fare in modo che le ricerche distinguano tra lettere maiuscole e minuscole.
Seleziona il metodo di output da utilizzare durante l'analisi e configura le proprietà correlate.
Corrispondenza : consente di aggiungere una colonna contenente un numero: 1 se l'espressione corrisponde, 0 se non corrisponde.
Nome colonna per stato abbinato : consente di fornire un nome per la colonna aggiunta.
Analizza : consente di separare l'espressione in nuove colonne e di impostare Nome e Tipo delle nuove colonne. Viene creata una nuova colonna nella tabella Colonne di output con i seguenti parametri:
Nome : consente di selezionare il nome della colonna per immettere un nuovo nome.
Tipo : utilizza il menu a discesa per selezionare il nuovo tipo di dati.
Espressione : compilata automaticamente.
Sostituisci : consente di sostituire l'espressione cercata con una seconda espressione.
Sostituisci con : consente di inserire un'espressione da sostituire all'espressione regolare originale identificando il gruppo contrassegnato con cui sostituire l'espressione. Utilizza il pulsante con il segno più per visualizzare le espressioni regolari comuni.
Seleziona Copia testo senza corrispondenza nell'output per copiare il testo senza corrispondenza nell'output.
Tokenizza : consente di suddividere i dati in ingresso utilizzando un'espressione regolare. Questa opzione funziona in modo simile allo strumento Testo in colonne ma anziché abbinare e rimuovere gli elementi indesiderati, abbina gli elementi da conservare. È necessario avere una corrispondenza all'intero token e se disponi di un gruppo contrassegnato, viene restituita solo quella parte. Consulta Esempi di metodo Tokenizza di seguito.
Suddividi in colonne : consente di dividere in più colonne una singola colonna di dati a ogni istanza del delimitatore specificato.
Numero di colonne di output : consente di impostare il numero di colonne create.
Intestazione colonna di output : consente di inserire il nome su cui si dovrebbero basare le nuove colonne generate. Le nuove colonne vengono denominate come nome della radice con un numero intero crescente seriale aggiunto.
Se sono presenti colonne supplementari nell'output : consente di selezionare il comportamento applicato alle colonne supplementari.
Non includere : i dati che si estendono oltre la divisione vengono esclusi e non viene generato alcun avviso.
Non includere e mostra avviso : i dati che si estendono oltre la divisione vengono esclusi e viene generato un avviso che comunica la presenza di informazioni in eccesso.
Errore (interrompi elaborazione dati) : i dati che si estendono oltre la divisione causano un errore e l'elaborazione del flusso di lavoro si interrompe.
Suddividi in righe : consente di dividere in più righe una singola colonna di dati a ogni istanza del delimitatore specificato. Utilizza una colonna chiave nel proprio record in modo da non perdere traccia di quale valore proviene da quale riga.
Questi casi d'uso si basano sul metodo Tokenizza dello strumento Regex.
Analizza una stringa di 9 caratteri
123456789
in 3 campi. L'espressione regolare è...
.Analizza una stringa di 9 caratteri in 3 campi, restituendo solo il secondo carattere. L'espressione regolare è
.(.).
.Analizza un campo con il delimitatore Ctrl-A . L'espressione regolare per la tokenizzazione di una stringa delimitata con Ctrl-A è
[^\cA]+
.[^...]
Le parentesi specificano una corrispondenza a un singolo carattere in un insieme di caratteri. Se l'insieme inizia con^
, significa che la corrispondenza deve essere con un qualsiasi carattere non contenuto nell'insieme.\cA
corrisponde semplicemente al carattere Ctrl-A .+
significa una corrispondenza con 1 o più elementi precedenti.
Consenti ai token vuoti di conservare le voci:
abc, ,def
. L'espressione regolare è([^,]*) (?:,|$)
.(...)
Le parentesi creano un gruppo contrassegnato dell'espressione. La modalità Tokenizza consente di trovare una corrispondenza con una parte più ampia del campo di input, ma restituisce solo un sottoinsieme contrassegnato. In questo modo si evita la restituzione del delimitatore. È possibile avere una sola espressione contrassegnata.[^,]
Se l'insieme inizia con^
significa che la corrispondenza deve essere con un qualsiasi carattere non contenuto nell'insieme, in questo caso una,
.*
corrisponde a 0 o più elementi precedenti, consentendo un insieme vuoto. Non è possibile terminare qui perché l'engine regex non può avere una corrispondenza di 0 caratteri, in quanto esiste un numero infinito di corrispondenze. È necessario quindi terminare la corrispondenza in modo diverso.(?:....)
è un gruppo non contrassegnato. È necessario peror
per il quale si utilizza|
.|
corrisponde all'elemento precedente o successivo, ma non a entrambi. Va utilizzato quasi sempre con un gruppo contrassegnato o non contrassegnato.$
corrisponde alla fine della stringa. Ad esempio,(?:,|$)
trova una corrispondenza fino a una,
o alla fine della stringa.
Analizza i collegamenti HTML da una pagina iniziale. L'espressione regolare è
<a .*?>.*?</a>
. In questo modo, ogni collegamento di un documento HTML di grandi dimensioni viene inserito in una serie di righe.<a
indica una corrispondenza letterale per il testo "<a.".*?.
è un qualsiasi carattere,*
è 0 o più. Mentre?
modifica*
in modo che corrisponda alla corrispondenza più breve possibile. Se non presente, l'espressione potrebbe trovare un singolo token dall'inizio del primo collegamento alla fine dell'ultimo.>
Indica una corrispondenza letterale per il testo " > "..*?
indica la corrispondenza più breve possibile di qualsiasi carattere che soddisfa comunque l'intera espressione regolare.</a>
indica una corrispondenza letterale per il testo " </a> ". Rappresenta la fine della corrispondenza.