Outil RegEx
Utilisez l’outil expression régulière (RegEx) pour créer une expression permettant d’analyser, de mettre en correspondance ou de remplacer des données.
Prise en charge des expressions régulières
Bien que les expressions régulières soient prises en charge, vous êtes responsable de vos propres expressions et de la façon dont les expressions affectent vos données.Designer
Pour plus d’informations sur l’expression Boost RegEx, consultez les points suivants:
- Classes de caractères RegEx prises en charge par Boost
- Nom des éléments de collationnement
- Syntaxe des chaînes de format Boost-Extended
- Syntaxe des expressions régulières étendues POSIX
Voici quelques ressources extérieures qui peuvent être utiles. Ceux-ci ne sont pas affiliés à alteryx enaucune façon:syntaxe d’expression régulière Perl. www.regexlib.comRegex coach
Configurer l’outil
- Colonne à analyser: sélectionnez la colonne que vous souhaitez rechercher et analyser, faire correspondre ou remplacer des données.
- Expression régulière: cliquez sur le signe plus pour commencer à créer une expression qui sera utilisée pour rechercher des données à analyser, à associer ou à remplacer.
- Output, méthode: quelle méthode de sortie voulez-vous utiliser après que la recherche trouve les données correspondant à l’expression que vous avez créée? Sélectionnez une méthode, puis configurez les propriétés de sortie associées pour la méthode.
- Remplacer: utilisez cette méthode pour remplacer l’expression que vous recherchez avec une seconde expression.
- Texte de remplacement: entrez une expression que vous souhaitez que l’outil utilise lors du remplacement du texte correspondant à votre expression régulière d’origine. La liste déroulante fournit des expressions régulières courantes dont vous pourriez avoir besoin tout en créant votre expression.
- Copiez le texte sans correspondance à la sortie: sélectionné par défaut. Tout le texte qui n’a pas été apparié est inclus dans la sortie.
- Tokene: fractionne les données entrantes à l'aide d'une expression régulière. Cette option fonctionne de la même Outil Texte en colonnes, sauf au lieu de faire correspondre et de supprimer ce que vous ne voulez pas, vous correspondez à ce que vous voulez conserver. Vous souhaitez faire correspondre le jeton entier, et si vous avez un groupe marqué, seule cette partie est retournée.
- Analysez une chaîne de 9 caractères 123456789 en 3 champs.
- Analysez une chaîne de 9 caractères en 3 champs, en renvoyant uniquement le deuxième caractère.
- Analyse d'un champ avec le délimiteur Ctrl-a
- Autoriser les jetons vierges à conserver les entrées: ABC,, def
- Analyse des liens HTML à partir d'une page d'accueil
- Fractionner en colonnes: fractionner une seule colonne de données à chaque instance du délimiteur spécifié en plusieurs colonnes.
- Nombre de colonnes: définir le nombre de colonnes créées.
- Colonnes supplémentaires: Sélectionnez le comportement appliqué aux colonnes supplémentaires.
- Supprimer le supplément avec avertissement : les données qui s'étendent au-delà de la scission sont supprimées et un avertissement est généré indiquant qu'il y avait un excès d'informations.
- Supprimer le supplément sans avertissement : les données qui s'étendent au-delà de la scission sont supprimées et aucun avertissement n'est généré.
- Erreur : Les données qui s'étendent au-delà de la scission provoquent une erreur et le workflow arrête le traitement.
- Nom de la racine de sortie : Entrez le nom des colonnes nouvellement générées dont il faudra s'inspirer. Les nouvelles colonnes sont nommées en tant que nom racine avec un entier ajouté par ordre croissant.
- Fractionner en lignes : Fractionner une seule colonne de données à chaque instance du délimiteur spécifié en plusieurs lignes. Utilisez une colonne clé dans votre enregistrement afin de toujours savoir quelle valeur provient de quelle ligne.
- Parse: séparez l'expression en nouvelles colonnes et définissez le nom, le type et la taille des nouvelles colonnes.
- Une nouvelle colonne est créée dans la table colonnes en sortie . Dans le tableau:
- Cliquez sur les noms de colonnes pour les renommer.
- Utilisez la liste déroulante pour sélectionner le nouveau type de données.
- Entrez la nouvelle taille.
- L'expression est remplie automatiquement.
- Match: ajoutez une colonne contenant un nombre; 1 si l'expression est appariée, 0 si elle ne l'a pas fait.
- Nom de la colonne pour l’état du match: indiquez un nom pour la colonne ajoutée.
- Erreur si elle n’est pas appariée: cette option n’est pas sélectionnée par défaut. Sélectionnez si vous souhaitez que le système arrête le traitement et affiche une erreur lorsque l’expression et la chaîne ne correspondent pas.
Non respect de la casse: sélectionné par défaut. Les recherches ne font pas de distinction entre lettres majuscules et minuscules.
Les cas d'utilisation suivants reposent sur la méthode de jeton de l'outil Regex.
L'expression régulière est ...
L'expression régulière est . (.).
L'expression régulière pour la symbolique d'une chaîne délimitée Ctrl-a est [^/nom] +
Explication Regex
[^...] Les crochets spécifient une correspondance à un caractère unique dans un jeu de caractères. Démarrage de l'ensemble avec ^ il change pour correspondre à n'importe quel caractère pas dans le jeu.
/nom Cela correspond simplement au caractère Ctrl-A.
+ Concordance avec 1 ou plusieurs des éléments précédents.
L'expression régulière est ([^,] *) (?:,|$)
Explication Regex
(...) Les parenthèses créent un groupe marqué de l'expression. Le mode de marquage avec un jeton permet d’obtenir une concordance sur une plus grande partie du champ d’entrée, mais vous ne renvoyez qu’un sous-ensemble marqué. Vous évitez ainsi de renvoyer le délimiteur. Vous ne pouvez avoir qu’une seule expression marquée.
[^,] Démarrage de l'ensemble avec ^ il change pour correspondre à n'importe quel caractère n'est pas dans le jeu, dans ce cas a ,.
* Match 0 ou plus de la précédente, ce qui permet un ensemble vide. Il est impossible de terminer ici, car le moteur RegEx n’accepte pas de concordance de 0 caractère étant donné qu’il y a un nombre infini de concordances. Nous devons dès lors terminer la concordance sur un élément.
(?:....) C'est un groupe non marqué. Nous avons besoin de cela pour le ou que nous utilisons un | pour.
| Cela veut dire match soit la chose avant ou après, mais pas les deux. Ce cas s’utilise presque toujours avec un groupe marqué ou non marqué.
$ Correspond à la fin de la chaîne. Par conséquent(?:, | $ ) correspond à Toa ou à la fin de la chaîne.
L'expression régulière est <a .*?="">. *?</a> . Cela tire chaque lien d'un grand document HTML dans une série d'enregistrements.
Explication Regex
Il s'agit d'une correspondance littérale pour le texte
.*? . est un caractère, * est 0 ou plus. Le ? modifie le * pour le faire correspondre à la plus courte correspondance possible. Sans cela, l'expression peut trouver un jeton unique depuis le début du premier lien jusqu'à la fin de la dernière.
> Ceci est une correspondance littérale pour le texte >.
.*? Le plus court match possible de tous les caractères qui satisfait toujours la Regex entière.
Il s'agit d'une correspondance littérale pour le texte . Cela termine la concordance.