Resumen de texto
La herramienta Resumen de texto resume cuerpos de texto. Utiliza la herramienta Resumen de texto para comprender mejor los cuerpos de texto o como ayuda para tareas posteriores que involucran grandes cuerpos de texto. La herramienta aprovecha las capacidades de resumen de texto de Summa - Textrank .
Se requiere Alteryx Intelligence Suite
Esta herramienta forma parte de Alteryx Intelligence Suite . Alteryx Intelligence Suite requiere una licencia independiente y un instalador de complemento para Designer. Después de instalar Alteryx Designer, instala Alteryx Intelligence Suite e inicia la prueba gratuita .
Idiomas compatibles
La herramienta Resumen de texto admite los idiomas inglés, francés, alemán, italiano, portugués y español.
Componentes de la herramienta
La herramienta Resumen de texto tiene dos anclas (una de entrada y una de salida):
Ancla de entrada: utiliza esta ancla para conectar los datos de texto que quieres resumir.
Ancla de salida: utiliza esta ancla para pasar el texto resumido a herramientas posteriores del flujo de trabajo.
Configurar la herramienta
Agrega una herramienta Resumen de texto al lienzo.
Utiliza el ancla de entrada para conectar la herramienta Resumen de texto a los datos de texto que quieres utilizar en el flujo de trabajo.
Para ingresar datos de texto en Designer, utiliza una herramienta Datos de entrada o Entrada de texto .
Te recomendamos que quites las marcas especiales entre las oraciones. Por ejemplo, quita los números de cita al final de las oraciones, como [número], (número) y número . Puedes quitar texto de este tipo con la herramienta RegEx .
Selecciona el idioma del texto de entrada. Si el texto contiene varios idiomas, selecciona el idioma más frecuente.
Selecciona la Columna con texto que quieres resumir.
Ingresa el número de oraciones para la longitud de resumen . El resumen de texto debe tener menos oraciones que tu texto.
Selecciona el método de resumen .
Ejecuta el flujo de trabajo.
Método de resumen
El resultado del resumen de texto puede variar en función del algoritmo o modelo que elijas. Recomendamos TextRank como el método predeterminado. Esta lista incluye los métodos de resumen que se admiten actualmente:
TextRank: un algoritmo basado en gráficos que crea un resumen de texto a partir de oraciones importantes. TextRank utiliza la metodología de resumen extractivo . Esta metodología de resumen extractivo identifica oraciones importantes y las devuelve textualmente en orden de importancia. Es posible que el resumen no sea tan articulado como uno generado por personas. TextRank funciona mejor en bloques de texto. Quita los encabezados, las notas al pie de página y otras partes del documento que no formen parte del texto. Para texto con varios idiomas, TextRank funciona mejor con el idioma más frecuente.
Salida
El resultado incluye una columna que contiene el resumen de texto. Conecta la herramienta Texto de informe para comparar el texto original con el resumen de texto.