Green hexagon containing a left parenthesis, period, asterisk and right parenthesis.

Outil RegEx

Version:
2022.3
Last modified: December 21, 2020

L’outil RegEx utilise une syntaxe d’expression régulière pour analyser, mettre en correspondance ou remplacer des données.

Assistance RegEx

Bien que les expressions régulières soient prises en charge dans Designer, les utilisateurs sont responsables de leurs propres expressions et de l'impact qu'elles ont sur leurs données.

Pour obtenir plus de ressources sur la rédaction des expressions régulières, consultez www.regexlib.com, un site non affilié à Alteryx, ou RegEx Coach, une application graphique pour Windows, également non affiliée, qui peut être utilisée pour effectuer des tests interactifs avec des expressions régulières (compatibles Perl).

Pour plus d'informations sur Boost RegEx, reportez-vous aux sections suivantes :

Configurer l'outil

  1. Sélectionnez la colonne à analyser.
  2. Dans format à convertir...
    • Saisissez votre expression régulière. Utilisez le bouton « + » pour accéder aux expressions régulières courantes dont vous pouvez avoir besoin lors de la création de votre expression. Retrouvez plus d'informations sur le site Perl Regular Expression Syntax.
    • Insensible à la casse : option sélectionnée par défaut. Les recherches traitent indistinctement les majuscules et les minuscules.
  3. Dans Sortie, sélectionnez la méthode de sortie à utiliser lors de l'analyse. Configurez ensuite les propriétés associées.
    • Remplacer : remplacez l'expression recherchée par une seconde expression.
      • Texte de remplacement : saisissez une expression pour remplacer l'expression régulière originale en identifiant le groupe marqué qui la remplacera. Utilisez le bouton « + » pour accéder aux expressions régulières courantes dont vous pouvez avoir besoin lors de la création de votre expression.
      • Copier le texte qui ne correspond pas dans la sortie
    • Marquer avec un jeton : divisez les données entrantes à l'aide d'une expression régulière. Cette option fonctionne de la même manière que l'outil Texte en colonnes, mais au lieu de faire correspondre et de supprimer ce que vous ne souhaitez pas, vous faites correspondre ce que vous voulez conserver. Vous devez effectuer une correspondance sur le jeton entier, et si vous disposez d'un groupe marqué, seule cette partie est renvoyée. Consultez les exemples de méthodes de marquage avec un jeton ci-dessous.
      • Fractionner en colonnes : fractionnez une seule colonne de données à chaque instance du délimiteur spécifié en plusieurs colonnes.
        • Nombre de colonnes : définissez le nombre de colonnes créées.
        • Colonnes supplémentaires : sélectionnez le comportement appliqué aux colonnes supplémentaires.
          • Supprimer le supplément avec avertissement : les données qui s'étendent au-delà de la scission sont supprimées et un avertissement est généré, indiquant qu'il y avait des informations supplémentaires.
          • Supprimer le supplément sans avertissement : Les données qui s'étendent au-delà de la scission sont supprimées et aucun avertissement n'est généré.
          • Erreur : les données qui s'étendent au-delà de la scission provoquent une erreur et le workflow arrête le traitement.
        •  Nom de la racine de sortie : saisissez le nom des colonnes nouvellement générées à utiliser comme base. Les nouvelles colonnes sont nommées avec le nom de la racine plus un nombre entier ajouté par ordre croissant.
      • Fractionner en lignes : fractionnez une seule colonne de données à chaque instance du délimiteur spécifié en plusieurs lignes. Utilisez une colonne clé dans votre enregistrement afin de toujours savoir quelle valeur provient de quelle ligne.
    • Analyser : séparez l'expression en nouvelles colonnes et définissez le nom, le type et la taille des nouvelles colonnes. Une nouvelle colonne est créée dans la table Colonnes de sortie avec les colonnes suivantes :
      • Nom : sélectionnez le nom de la colonne pour saisir un nouveau nom.
      • Type : utilisez la liste déroulante pour sélectionner le nouveau type de données.
      • Taille : sélectionnez la taille des données pour saisir une nouvelle taille.
      • Expression : renseignée automatiquement.
    • Correspondre : ajoutez une colonne contenant un nombre : 1 si l'expression correspond, 0 si ce n'est pas le cas.
      • Nom de la colonne pour le statut de correspondance  : indiquez un nom pour la colonne ajoutée.
      • Erreur si non correspondance : sélectionnez cette option pour générer une erreur et arrêter le traitement du workflow si l'expression et la chaîne ne correspondent pas.

Exemples de méthodes de marquage avec un jeton

Ces cas d'usage reposent sur la méthode de marquage avec un jeton de l'outil RegEx.

  • Analysez une chaîne de neuf caractères  123456789 en trois champs. L'expression régulière est ....
  • Analysez une chaîne de neuf caractères en trois champs en ne renvoyant que le deuxième caractère. L'expression régulière est .(.)..
  • Analysez un champ avec le délimiteur Ctrl-AL'expression régulière permettant de marquer avec un jeton une chaîne délimitée par Ctrl-A est [^\cA]+.
    • [^...] Les crochets indiquent une correspondance avec un seul caractère d'un jeu de caractères. Si le jeu commence par ^, il est modifié pour une correspondance avec n'importe quel caractère qui n'est pas dans le jeu.
    • \cA Cela correspond simplement au caractèr Ctrl-A.
    • + Cela signifie une correspondance avec un ou plusieurs élément(s) précédent(s).
  • Autoriser les jetons vides à conserver les entrées : abc, ,defL'expression régulière est ([^,]*) (?:,|$).
    • (...) Les parenthèses créent un groupe marqué de l'expression. Le mode de marquage avec un jeton vous permet de correspondre une plus grande partie du champ d’entrée, mais de ne renvoyer qu’un sous-ensemble marqué. Vous évitez ainsi de renvoyer le délimiteur. Vous ne pouvez avoir qu’une seule expression marquée.
    • [^,] Si le jeu commence par ^, il est modifié pour une correspondance avec tout caractère qui n'est pas dans le jeu, dans ce cas le caractère ,.
    • * Correspondance avec 0 ou plusieurs des éléments précédents, ce qui permet un ensemble vide.  Il est impossible de terminer ici, car le moteur RegEx n’accepte pas une correspondance de 0 caractère étant donné qu’il y a un nombre infini de correspondances. Nous devons dès lors terminer la correspondance sur un élément.
    • (?:....) Il s'agit d'un groupe non marqué. Nous en avons besoin pour la clause ou pour laquelle nous utilisons le caractère|.
    • |   Cela détermine que la correspondance doit être faite avec l'élément qui précède ou qui suit, mais pas les deux. La plupart du temps, il doit être utilisé avec un groupe marqué ou non marqué.
    • $ Correspond à la fin de la chaîne. Par conséquent, (?:,|$)correspond à , ou à la fin de la chaîne.
  • Analyser les liens HTML à partir d'une page d'accueil. L'expression régulière est <a .*?>.*?</a>. Cela extrait tous les liens d’un document HTML et les place dans une série d’enregistrements.
    • <a Ceci est une correspondance littérale au texte <a.
    • Le caractère .*?. correspond à n'importe quel caractère et le caractère * à 0 ou plus. Le caractère ? modifie le caractère * pour le faire correspondre à la correspondance la plus courte possible. Sans ce caractère, l'expression pourrait trouver un seul jeton depuis le début du premier lien jusqu'à la fin du dernier lien.
    • > C’est une correspondance littérale avec le texte >
    • .*? La correspondance la plus courte possible avec n'importe quel caractère correspondant à toute l'expression régulière.
    • </a> C’est une correspondance littérale avec le texte </a>. Cela termine La correspondance.
Cette page vous a-t-elle été utile ?

Vous rencontrez des problèmes avec votre produit Alteryx ? Visitez la communauté Alteryx ou contactez le  support. Vous n'arrivez pas à soumettre ce formulaire ? Envoyez-nous un e-mail.