Herramienta RegEx
Utilice la herramienta expresión regular (RegEx) para crear una expresión que analice, haga coincidir o reemplace los datos.
Soporte de regular Expression
Mientras que las expresiones regulares se admiten en, usted es responsable de sus propias expresiones y cómo las expresiones afectan a los datos.Designer
Para obtener más información acerca de Boost RegEx, visite lo siguiente:
- Clases de caracteres regex con soporte de Boost
- Cotejar nombres de elementos
- Sintaxis de cadena de formato Boost-Extended
- Sintaxis de expresiones regulares extendidas de POXIS
Estos son algunos recursos externos que pueden ser útiles. Estos no están afiliados a alteryx de ninguna manera:Sintaxis de expresiones regularesde Perl. www.regexlib.comRegex Coach
Configurar la herramienta
- Columna que analizar: seleccione la columna en la que desea buscar y analizar, hacer coincidir o reemplazar los datos.
- Expresión regular: haga clic en el signo más para empezar a crear una expresión que se usará para buscar datos para analizar, hacer coincidir o reemplazar.
- Método de salida: ¿Qué método de salida desea usar después de que la búsqueda encuentre datos que coincidan con la expresión que creó? Seleccione un método y, a continuación, configure las propiedades de salida relacionadas para el método.
- Replace: Use este método para reemplazar la expresión que busca con una segunda expresión.
- Texto de reemplazo: escriba una expresión que desee que utilice la herramienta al reemplazar texto que coincida con su expresión regular original. El desplegable proporciona expresiones regulares comunes que puede necesitar mientras crea su expresión.
- Copiar texto sin coincidencia a la salida: seleccionado de forma predeterminada. Todo el texto que no se ha emparejado se incluye en la salida.
- Token: Divida los datos entrantes utilizando una expresión regular. Esta opción funciona de forma similar a la Herramienta de Texto a Columnas, excepto en lugar de emparejar y quitar lo que no quieres, coincides para lo que quieres mantener. Desea coincidir con el token completo, y si tiene un grupo marcado, sólo se devuelve esa parte.
- Parse una cadena de 9 caracteres 123456789 en 3 campos.
- Analice una cadena de 9 caracteres en 3 campos, devolviendo sólo el segundo carácter.
- Analizar un campo con el delimitador Ctrl-a
- Permitir que los tokens en blanco conserven entradas: ABC,, Def
- Análisis de vínculos HTML desde una página principal
- Dividir en columnas: divide una sola columna de datos en cada instancia del delimitador especificado en varias columnas.
- Número de columnas: define cuántas columnas se crean.
- Columnas adicionales: Seleccione el comportamiento que se aplica a las columnas adicionales.
- Descartar extras con advertencia: los datos que se extienden más allá de la división se descartan y se genera una advertencia que indica que hubo exceso de información.
- Descartar extras sin advertencia: los datos que se extienden más allá de la división se descartan y no se genera ninguna advertencia.
- Error: los datos que se extienden más allá de la división causan un error y el flujo de trabajo detiene el procesamiento.
- Nombre raíz de la salida: introduce el nombre de las columnas recién generadas en las que te basarás. Las nuevas columnas se denominan con el nombre de la raíz y un número entero anexado que aumenta en serie.
- Dividir en filas: dividir una sola columna de datos en cada instancia del delimitador especificado en varias filas. Utiliza una columna clave en tu registro para que no pierdas noción de qué valor proviene de qué fila.
- Parse: separa la expresión en nuevas columnas, y establece el nombre, tipo y tamaño de las nuevas columnas.
- Se crea una nueva columna en la tabla de columnas de salida . En la tabla:
- Haga clic en nombres de columna para cambiar el nombre.
- Utilice el desplegable para seleccionar el nuevo tipo de datos.
- Introduzca el nuevo tamaño.
- La expresión se rellena automáticamente.
- Coincidencia: anexar una columna que contenga un número; 1 si la expresión coincide, 0 si no lo hizo.
- Nombre de columna para el estado de coincidencia: proporcione un nombre para la columna anexa.
- Error si no coincide: esto no está seleccionado de forma predeterminada. Seleccione si desea que el sistema detenga el procesamiento y muestre un error cuando la expresión y la cadena no coincidan.
Caso insensible: seleccionado de forma predeterminada. Las búsquedas no distinguen entre letras mayúsculas y minúsculas.
Los siguientes casos de uso se basan en el método de tokenización de la herramienta Regex.
La expresión regular es ...
La expresión regular es . (.).
La expresión regular para tokening una cadena delimitada Ctrl-a es [^ \cA] +
Explicación de Regex
[^...] Los paréntesis especifican una coincidencia con un solo carácter en un conjunto de caracteres. El inicio del conjunto con ^ lo cambia para que coincida con cualquier carácter que no esté en el conjunto.
\cA Esto simplemente coincide con el carácter Ctrl-A.
+ Esto significa coincidir 1 o más de los anteriores.
La expresión regular es ([^,] *) (?:,|$)
Explicación de Regex
(...) Los paréntesis crean un grupo marcado de la expresión. El modo de tokening le permite coincidir con una parte mayor del campo de entrada, pero sólo devuelve un subconjunto que se marcó. De esta manera se evita devolver el delimitador. Sólo puede tener 1 expresión marcada.
[^,] El inicio del conjunto con ^ lo cambia para que coincida con cualquier carácter no en el conjunto, en este caso, a ,.
* Coincidir 0 o más de la anterior, lo que permite un conjunto vacío. No se puede terminar aquí porque el motor regex no le gusta una coincidencia de 0 caracteres ya que hay un número infinito de partidos, así que tenemos que terminar el partido en algo.
(?:....) Este es un grupo no marcado. Necesitamos esto para el o que usamos un | para.
| Esto es decir coincidir con la cosa antes o después, pero no ambos. Esto casi siempre necesita ser utilizado con un grupo marcado o sin marcar.
$ Coincide con el final de la cadena. Por lo tanto(?:, | $) coincide con Toa ,o el final de la cadena.
La expresión regular es <a .*?="">. *?</a> . Esto saca cada eslabón de un documento HTML grande en una serie de registros.
Explicación de Regex
Esta es una coincidencia literal para el texto
.*? . es cualquier caracter, * es 0 o mas. El ? modifica el * para que coincida con la coincidencia más corta posible. Sin esto, la expresión puede encontrar un solo token desde el principio del primer enlace hasta el final del último.
> Esto es una coincidencia literal para el texto >.
.*? La coincidencia más corta posible de cualquier carácter que todavía satisfaga toda la Regex.
Esta es una coincidencia literal para el texto . Esto termina el partido.