Utilisez l'outil RegEx pour appliquer une syntaxe d'expression régulière afin d'analyser, mettre en correspondance ou remplacer des données.
Astuce
Cet outil dispose d'un exemple d'outil unique. Consultez la page Accéder aux exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Designer Cloud.
Bien que les expressions régulières soient prises en charge dans Designer Cloud, les utilisateurs sont responsables de leurs propres expressions et de l'impact qu'elles ont sur leurs données.
Pour obtenir plus de ressources sur la rédaction des expressions régulières, consultez https://regex101.com/, un site non affilié à Alteryx, ou RegEx Coach, une application graphique pour Windows, également non affiliée, que vous pouvez utiliser pour effectuer des tests interactifs avec des expressions régulières (compatibles Perl).
Pour plus d'informations sur Boost RegEx, reportez-vous aux ressources suivantes :
Sélectionnez Colonne à analyser.
Saisissez votre expression régulière. Utilisez le bouton « signe plus » pour afficher les expressions régulières courantes. Retrouvez plus d'informations sur le site Web Perl Regular Expression Syntax.
Cochez Sensibilité à la casse pour que les recherches distinguent les majuscules des minuscules.
Sélectionnez la méthode de sortie à utiliser lors de l'analyse, puis configurez les propriétés associées.
Correspondre : ajoutez une colonne contenant un nombre : 1 si l'expression correspond, 0 si ce n'est pas le cas.
Nom de la colonne pour le statut de correspondance : indiquez un nom pour la colonne ajoutée.
Analyser : séparez l'expression en nouvelles colonnes et définissez le nom et le type des nouvelles colonnes. Une nouvelle colonne est créée dans la table Colonnes de sortie avec les paramètres suivants :
Nom : sélectionnez le nom de la colonne pour saisir un nouveau nom.
Type : utilisez la liste déroulante pour sélectionner le nouveau type de données.
Expression : renseignée automatiquement.
Remplacer : remplacez l'expression recherchée par une seconde expression.
Remplacer par : saisissez une expression pour remplacer l'expression régulière originale en identifiant le groupe marqué qui la remplacera. Utilisez le bouton « signe plus » pour afficher les expressions régulières courantes.
Cochez la case Copier le texte qui ne concorde pas dans la sortie pour copier le texte sans correspondance vers la sortie.
Marquer avec un jeton : divisez les données entrantes à l'aide d'une expression régulière. Cette option fonctionne de la même manière que l'outil Texte en colonnes, mais au lieu de faire correspondre et de supprimer ce que vous ne souhaitez pas garder, vous faites correspondre ce que vous voulez conserver. Vous devez effectuer une correspondance sur le jeton entier, et si vous disposez d'un groupe marqué, seule cette partie est renvoyée. Accédez aux exemples de méthodes de marquage avec un jeton ci-dessous.
Fractionner en colonnes : fractionnez une seule colonne de données à chaque instance du délimiteur spécifié en plusieurs colonnes.
Nombre de colonnes de sortie : définissez le nombre de colonnes créées.
En-tête de colonne de sortie : saisissez le nom à partir duquel les colonnes nouvellement générées doivent être nommées. Les nouvelles colonnes sont nommées avec le nom de la racine plus un nombre entier ajouté par ordre croissant.
En cas de colonnes supplémentaires dans la sortie : sélectionnez le comportement appliqué aux colonnes supplémentaires.
Ne pas inclure : les données qui s'étendent au-delà de la scission sont supprimées et aucun avertissement n'est généré.
Ne pas inclure et afficher un avertissement : les données qui s'étendent au-delà de la scission sont supprimées et un avertissement est généré indiquant qu'il y avait un excès d'informations.
Erreur (Arrêter le traitement des données) : les données qui s'étendent au-delà de la scission provoquent une erreur et le workflow arrête le traitement.
Diviser en lignes : fractionner une seule colonne de données à chaque instance du délimiteur spécifié en plusieurs lignes. Utilisez une colonne clé dans votre enregistrement afin de toujours savoir quelle valeur provient de quelle ligne.
Ces cas d'usage reposent sur la méthode de marquage avec un jeton de l'outil RegEx.
Analysez une chaîne de neuf caractères
123456789
en trois champs. L'expression régulière est la suivante :...
.Analysez une chaîne de neuf caractères en trois champs en ne renvoyant que le deuxième caractère. L'expression régulière est la suivante :
.(.).
.Analysez un champ avec le délimiteur Ctrl-A. L'expression régulière permettant de marquer avec un jeton une chaîne délimitée par Ctrl-A est la suivante :
[^\cA]+
.[^...]
Les crochets indiquent une correspondance avec un seul caractère au sein d'un jeu de caractères. Si le jeu commence par^
, il est modifié pour une correspondance avec n'importe quel caractère qui n'appartient pas au jeu.\cA
Concordance avec le caractère Ctrl-A.+
Cela signifie une correspondance avec un ou plusieurs éléments précédents.
Autoriser les jetons vides à conserver les entrées :
abc, ,def
. L'expression régulière est la suivante :([^,]*) (?:,|$)
.(...)
Les parenthèses créent un groupe marqué de l'expression. Le mode de marquage avec un jeton permet d'obtenir une concordance sur une plus grande partie du champ d'entrée, mais vous ne renvoyez qu'un sous-ensemble marqué. Vous évitez ainsi de renvoyer le délimiteur. Vous ne pouvez avoir qu'une seule expression marquée.[^,]
Si le jeu commence par^
, il est modifié pour une correspondance avec tout caractère qui n'appartient pas au jeu, dans ce cas, le caractère,
.*
Correspondance avec aucun ou plusieurs des éléments précédents, ce qui permet un ensemble vide. Il est impossible de terminer ici, car le moteur RegEx n'accepte pas de concordance de 0 caractère étant donné qu'il y a un nombre infini de concordances. Nous devons dès lors terminer la concordance autrement.(?:....)
est un groupe non marqué. Nous en avons besoin pour la clauseou
pour laquelle nous utilisons le caractère|
.|
correspond à l'élément précédent ou suivant, mais pas aux deux. Ce cas s'utilise presque toujours avec un groupe marqué ou non marqué.$
correspond à la fin de la chaîne. Par exemple,(?:,|$)
correspond à,
ou à la fin de la chaîne.
Analyser les liens HTML à partir d'une page d'accueil. L'expression régulière est la suivante :
<a .*?>.*?</a>
. Cela extrait tous les liens d'un document HTML et les place dans une série de lignes.<a
est une correspondance littérale avec le texte « <a »..*?.
correspond à n'importe quel caractère et*
correspond à 0 ou plus. Le caractère?
modifie le caractère*
pour qu'il corresponde à la correspondance la plus petite possible. Sans ce caractère, l'expression pourrait trouver un seul jeton depuis le début du premier lien jusqu'à la fin du dernier lien.>
Il s'agit d'une correspondance littérale avec le texte « > »..*?
Concordance la plus petite possible avec n’importe quel caractère correspondant à toute l’expression régulière.</a>
est une correspondance littérale pour le texte « </a> ». Cela met fin à la correspondance.