Skip to main content

Green hexagon containing a left parenthesis, period, asterisk and right parenthesis. Outil RegEx

Exemple d'outil unique

L'outil RegEx dispose d'un exemple d'outil unique. Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

Utilisez l'outil RegEx (Expression régulière) et exploitez une syntaxe d'expression régulière pour analyser, mettre en correspondance ou remplacer des données.

Assistance RegEx

Bien que les expressions régulières soient prises en charge dans Designer, les utilisateurs sont responsables de leurs propres expressions et de l'impact qu'elles ont sur leurs données.

Pour obtenir plus de ressources sur la rédaction d'expressions régulières, consultez la page https://regex101.com/ , un site non affilié à Alteryx ou RegEx Coach , une application graphique pour Windows, également non affiliée, que vous pouvez utiliser pour effectuer des tests interactifs avec des expressions régulières (compatibles Perl).

Pour plus d'informations sur Boost RegEx, reportez-vous aux ressources suivantes :

Configuration de l'outil

  1. Sélectionnez la colonne à analyser .

  2. Dans format à convertir ...

    • Saisissez votre expression régulière . Utilisez le bouton « + » pour accéder aux expressions régulières courantes dont vous pouvez avoir besoin lors de la création de votre expression. Retrouvez plus d'informations sur le site Web Perl Regular Expression Syntax .

    • Insensible à la casse  : option sélectionnée par défaut. Les recherches traitent indistinctement les majuscules et les minuscules.

  3. Dans Sortie , sélectionnez la méthode de sortie à utiliser lors de l'analyse. Configurez ensuite les propriétés associées.

    • Remplacer  : remplacez l'expression recherchée par une seconde expression.

      • Texte de remplacement  : saisissez une expression pour remplacer l'expression régulière originale en identifiant le groupe marqué qui la remplacera. Utilisez le bouton « + » pour accéder aux expressions régulières courantes dont vous pouvez avoir besoin lors de la création de votre expression.

      • Copier le texte qui ne correspond pas dans la sortie

    • Marquer avec un jeton  : divisez les données entrantes à l'aide d'une expression régulière. Cette option fonctionne de la même manière que l' outil Texte en colonnes , mais au lieu de faire correspondre des éléments non désirés ou de les supprimer, vous faites correspondre les éléments que vous souhaitez conserver. Vous devez effectuer une correspondance sur le jeton entier, et si vous disposez d'un groupe marqué, seule cette partie est renvoyée. Accédez aux exemples de méthodes de marquage avec un jeton ci-dessous.

      • Fractionner en colonnes : fractionnez une seule colonne de données à chaque instance du délimiteur spécifié en plusieurs colonnes.

        • Nombre de colonnes  : définissez le nombre de colonnes créées.

        • Colonnes supplémentaires  : sélectionnez le comportement appliqué aux colonnes supplémentaires.

          • Supprimer le supplément avec avertissement : les données qui s'étendent au-delà de la scission sont supprimées et un avertissement est généré, indiquant qu'il y avait des informations supplémentaires.

          • Supprimer le supplément sans avertissement : Les données qui s'étendent au-delà de la scission sont supprimées et aucun avertissement n'est généré.

          • Erreur  : les données qui s'étendent au-delà du fractionnement provoquent une erreur et le workflow arrête le traitement.

        • Nom de la racine de sortie  : saisissez le nom à partir duquel les colonnes nouvellement générées doivent être nommées. Les nouvelles colonnes sont nommées avec le nom de la racine plus un nombre entier ajouté par ordre croissant.

      • Fractionner en lignes : fractionnez une seule colonne de données à chaque instance du délimiteur spécifié en plusieurs lignes. Utilisez une colonne clé dans votre enregistrement afin de toujours savoir quelle valeur provient de quelle ligne.

    • Analyser  : séparez l'expression en nouvelles colonnes et définissez le nom , le type et la taille des nouvelles colonnes. Une nouvelle colonne est créée dans la table Colonnes de sortie avec les colonnes suivantes :

      • Nom  : sélectionnez le nom de la colonne pour saisir un nouveau nom.

      • Type  : utilisez la liste déroulante pour sélectionner le nouveau type de données.

      • Taille  : sélectionnez la taille des données pour saisir une nouvelle taille.

      • Expression  : renseignée automatiquement.

    • Correspondre  : ajoutez une colonne contenant un nombre : 1 si l'expression correspond, 0 si ce n'est pas le cas.

      • Nom de la colonne pour le statut de correspondance   : indiquez un nom pour la colonne ajoutée.

      • Erreur si non correspondance  : sélectionnez cette option pour générer une erreur et arrêter le traitement du workflow si l'expression et la chaîne ne correspondent pas.

Exemples de méthodes de marquage avec un jeton

Ces cas d'usage reposent sur la méthode de marquage avec un jeton de l'outil RegEx.

  • Analysez une chaîne de neuf caractères 123456789 en trois champs. L'expression régulière est la suivante : ... .

  • Analysez une chaîne de neuf caractères en trois champs en ne renvoyant que le deuxième caractère. L'expression régulière est la suivante : .(.). .

  • Analysez un champ avec le délimiteur Ctrl-A . L'expression régulière permettant de marquer avec un jeton une chaîne délimitée par Ctrl-A est la suivante : [^\cA]+ .

    • [^...] Les crochets indiquent une correspondance avec un seul caractère au sein d'un jeu de caractères. Si le jeu commence par ^ , il est modifié pour une correspondance avec n'importe quel caractère qui n'appartient pas au jeu.

    • \cA Correspondance avec le caractère Ctrl-A.

    • + Cela signifie une correspondance avec un ou plusieurs éléments précédents.

  • Autoriser les jetons vides à conserver les entrées : abc, ,def . L'expression régulière est la suivante : ([^,]*) (?:,|$) .

    • (...) Les parenthèses créent un groupe marqué de l'expression. Le mode de marquage avec un jeton vous permet de correspondre une plus grande partie du champ d’entrée, mais de ne renvoyer qu’un sous-ensemble marqué. Vous évitez ainsi de renvoyer le délimiteur. Vous ne pouvez avoir qu’une seule expression marquée.

    • [^,] Si le jeu commence par ^ , il est modifié pour une correspondance avec tout caractère qui n'appartient pas au jeu, dans ce cas, le caractère , .

    • * Correspondance avec aucun ou plusieurs des éléments précédents, ce qui permet un ensemble vide. Il est impossible de terminer ici, car le moteur RegEx n’accepte pas une correspondance de 0 caractère étant donné qu’il y a un nombre infini de correspondances. Nous devons dès lors terminer la correspondance sur un élément.

    • (?:....) Il s'agit d'un groupe non marqué. Nous en avons besoin pour la clause ou pour laquelle nous utilisons le caractère|.

    • | Concordance avec l’élément qui précède ou qui suit, mais pas les deux. La plupart du temps, il doit être utilisé avec un groupe marqué ou non marqué.

    • $ Correspondances avec la fin de la chaîne. En conséquence(?:,|$) correspond àa ,ou la fin de la chaîne.

  • Analyser les liens HTML à partir d'une page d'accueil. L'expression régulière est la suivante : <a .*?>.*?</a> . Cela extrait tous les liens d’un document HTML et les place dans une série d’enregistrements.

    • <a Il s'agit d'une correspondance littérale avec le texte <a.

    • .*?. correspond à n'importe quel caractère et * correspond à 0 ou plus. Le caractère ? modifie le caractère * pour qu'il corresponde à la correspondance la plus petite possible. Sans ce caractère, l'expression pourrait trouver un seul jeton depuis le début du premier lien jusqu'à la fin du dernier lien.

    • >  Il s'agit d'une correspondance littérale avec le texte > .

    • .*? Concordance la plus petite possible avec n’importe quel caractère correspondant à toute l’expression régulière.

    • </a> Il s'agit d'une correspondance littérale avec le texte </a> . Cela termine la correspondance.