Herramienta Datos de entrada
Utiliza la herramienta datos de entrada para incorporar datos al flujo de trabajo mediante la conexión a un archivo o base de datos.
- Haz clic en la herramienta Datos de entrada en la paleta de herramientas y arrástrala al área de lienzo del flujo de trabajo.
- En la ventana Configuración, haz clic en la flecha desplegable Conectar un archivo o base de datos.
Alteryx muestra la ventana de Conexiones de datos. Configura la conexión de datos mediante una de las siguientes opciones: Reciente, Guardado, Archivos, Orígenes de datos o Galería.
Selecciona una conexión reciente. Las conexiones recientes contienen archivos y conexiones de datos recientemente configurados.
Haz clic en Borrar lista para eliminar conexiones recientes.
Selecciona una conexión guardada. Para cambiar el nombre y editar las conexiones, utiliza Administrar conexiones de datos.
Para conectarse a un archivo en un directorio local o de red, realiza una de las siguientes acciones:
- En conexiones de Archivo, haz clic en seleccionar archivo para buscar un archivo,
- Arrastra y suelta un archivo en conexiones de Archivos,
- En Todos los tipos de archivo admitidos, haz clic en una extensión de tipo de archivo para buscar un archivo de ese tipo o
- Cierra las conexiones de datos y arrastra un archivo directamente al lienzo.
En la ventana examinar archivo, escribe un comodín como parte de la ruta de acceso al archivo.
Considera un caso en el que tengas varios archivos de datos con ambos:
- Se leen varios archivos con el formato comodín como *.csv o 2019*.csv en una sola herramienta Entrada, siempre que todos los archivos contengan el mismo número de campos y que los tipos de datos de cada campo sean los mismos. Designer establecerá el número de campos y los tipos de archivo basados en el primer archivo leído. Cualquier archivo subsiguiente que no coincida se omitirá y se mostrará una advertencia. No es posible controlar qué archivo se leerá primero cuando se usa una sintaxis de comodín como *.csv; depende del sistema qué archivo será designado como el primero.
- nombres similares en el mismo directorio
Escribe el nombre de archivo que tienen en común y agrega un * para sustituir todos los caracteres subsecuentes o un ? para sustituir un carácter. Recuerda incluir la extensión de archivo que es común a todos los archivos al especificar los nombres de archivo.
Esta ruta trae cada archivo .csv contenido en el directorio data\datafiles con un nombre de archivo que comienza con ABCD.
data\datafiles\ABCD*.csv
Lo traería en ABCD_4.csv y ABCD_012.csv.
Esta ruta trae cada archivo .csv contenido en el directorio data\datafiles con un nombre de archivo que comienza con caracter ABCD_ + 1.
data\datafiles\ABCD_?.csv
En Seleccionar entrada de Excel, selecciona una de las entradas de Excel:
- Selecciona una hoja para elegir entre las hojas disponibles en el archivo de Excel.
- Selecciona un rango con nombre para elegir entre los rangos con nombre disponibles en el archivo de Excel.
- Importar solo la lista de nombres de hoja para crear resultados con una sola columna que contenga nombres de hoja como valores.
Ninguno de los datos relacionados se emite cuando se selecciona esta opción.
Problemas conocidos
El controlador de Acceso lee !!! como ### y ambos ,,, y ... como ___. Esto puede impactar los nombres de la hoja y rangos con nombre en un archivo de Excel arrojado en Designer.
Consulta Soporte para archivos Gzip y Soporte de archivos Zip para más información.
Cuando se selecciona un archivo .gz, .tgz o .zip, se muestra la ventana Seleccionar tipo de archivo que se debe extraer. Utiliza el menú desplegable para seleccionar el tipo de archivos que desea utilizar.
Seleccionar archivos: haz clic en la casilla de verificación junto al archivo que deseas extraer.
Para ver todos los archivos en el archivo Gzip o Zip, incluidos los archivos que no son compatibles con Alteryx, selecciona Otros archivos en Seleccionar tipo de archivo que deseas extraer. Selecciona un tipo de archivo para Analizar otros archivos como.
Importante
Los archivos Gzip y Zip no son compatibles con Alteryx Gallery.
Alteryx Calgary | .cydb |
Base de datos Alteryx | .yxdb |
Alteryx Spatial Zip | .sz |
Avro | .avro |
Valores separados por comas | .csv |
dBase | .dbf |
ESRI Personal GeoDatabase | .mdb |
ESRI Shapefile | .shp |
Extensible Markup Language | .xml |
ASCII plano | .flat |
GIS | .grc, .grd |
Google Earth/Google Maps | .kml |
Gzip | .gz, .tgz |
IBM SPSS | .sav |
JSON | .json |
MapInfo Professional Interchange Format | .mif |
MapInfo Professional Table | .tab |
Microsoft Access 2000-2003 | .mdb |
Microsoft Access 2007, 2010, 2013, 2016 | .accdb |
Microsoft Excel Binary | .xlsb |
Microsoft Excel 1997-2003 | .xls |
Microsoft Excel | .xlsx |
Macro de Microsoft Excel activado | .xlsm |
QlikView | .qvx |
SAS | .sas7bdat |
SQLite | .sqlite |
SRC Geography | .geo |
Texto | .txt, .asc |
Zip | .zip |
Las fuentes de datos muestran fuentes de datos admitidos y utilizados con frecuencia.
- Herramientas: si seleccionas Conexión rápida para una herramienta que no ha instalado, se abre un navegador a Alteryx Gallery para que puedas descargar e instalar esa herramienta. Lee atentamente las instrucciones de la página. Una vez instalada la herramienta, la herramienta Datos de entrada cambiará en el lienzo a la herramienta seleccionada en la pestaña Fuentes de datos.
- Fuentes de datos
- ODBC inicia la ventana de conexión ODBC que muestra una lista filtrada de DSN en el sistema que usa ese controlador determinado.
- OleDB inicia el administrador OleDB de Windows nativo.
- OCI inicia el administrador de conexiones OCI de Oracle nativo. Desde aquí, selecciona el Nombre de servicio de red tal como se define en el archivo tnsnames.ora que deseas utilizar para esta conexión, así como las credenciales de nombre de usuario y contraseña.
- Bulk abre un cuadro de diálogo especial que te permite configurar una conexión masiva para el tipo de conexión seleccionado.
- Conexión rápida: para conexiones rápidas de SQL o Oracle, puedes utilizar una conexión guardada preexistente o bien puedes crear una nueva conexión guardada. Consulta lo siguiente para obtener más información:
- Todas las demás conexiones rápidas son conexiones que utilizan otra herramienta.
Haz clic en Conexión rápida en HDFS para crear una nueva conexión de base de datos de Hadoop.
Alteryx se conecta a un Hadoop Distributed File System y lee los archivos .csv y .avro. Se admiten todas las distribuciones Hadoop que implementan el estándar HDFS.
HDFS se puede leer usando httpfs (puerto 14000), webhdfs (puerto 50070) o Knox Gateway (8443). Consulta con tu administrador de Hadoop para saber cual utilizar. Si tienes un clúster Hadoop High Availability (HA), el administrador de Hadoop debe habilitar explícitamente httpfs.
MapR puede no admitir webhdfs.
En la ventana Conexión HDFS:
- Selecciona una configuración de servidor: HTTPFS, WebHDFS o Knox Gateway.
- Host: especifica la instancia instalada del servidor Hadoop. La entrada debe ser una dirección URL o IP.
- Puerto: muestra el número de puerto predeterminado para httpfs (14000), webhdfs (50070) o Knox Gateway (8443), o ingresa un número de puerto específico.
- URL: la URL por defecto se basa en el host. La URL puede ser modificada.
- Nombre de usuario: dependiendo de la configuración del clúster, especifica el nombre de usuario y la contraseña de acceso.
- httpfs: se necesita un nombre de usuario, pero puede ser cualquier cosa.
- webhdfs: el nombre de usuario no es necesario.
- Knox Gateway: se necesita un nombre de usuario y una contraseña.
- Kerberos: selecciona una opción de autenticación Kerberos para leer y escribir en HDFS. La opción que elijas dependerá de cómo el administrador de TI haya configurado el servidor HDFS:
- Ninguno: no se utiliza autenticación.
- Kerberos MIT: Alteryx utiliza el ticket de MIT predeterminado para autenticarse con el servidor. Primero debes adquirir un boleto válido usando el Administrador de tickets Kerberos MIT.
- Kerberos SSPI: Alteryx utiliza las claves Kerberos de Windows para la autenticación las cuales se obtienen al iniciar sesión en Windows con las credenciales de Windows. Por tanto, los campos Nombre de usuario y Contraseña no están disponibles.
- (Recomendado) Haz clic en Prueba para probar la conexión.
- Haz clic en Aceptar.
- Especifica la ruta del archivo (por ejemplo,
path/to/file. csv
) o navega hasta el archivo y selecciónalo. - Selecciona el formato de archivo Avro o CSV y haz clic en Aceptar.
Los certificados autofirmados no se admiten en Alteryx. Utiliza un certificado de confianza al configurar la autenticación de Knox.
Para conectarte a HDFS para el procesamiento en base de datos, utiliza Herramienta Conexión en BDD.
También puedes realizar una conexión genérica o una conexión de 32 bits a las bases de datos.
Antes de conectarte a una base de datos, ten en cuenta lo siguiente:
- Los tipos de conexión ODBC y OleDB admiten conexiones espaciales. Alteryx detecta automáticamente si una base de datos admite la funcionalidad espacial y muestra las configuraciones necesarias.
- Para conectarte a una base de datos para el procesamiento En base de datos, consulta Introducción a En base de datos..
Señala una opción y haz clic en una conexión de datos guardada o compartida para conectarla, o haz clic en Administrar para ver y editar conexiones.
Todas las conexiones: muestra una lista de conexiones guardadas en el ordenador y las conexiones compartidas desde Gallery.
Mi computadora: muestra una lista de conexiones guardadas en el equipo.
Gallery: muestra una lista de conexiones compartidas contigo desde una galería.
Agregar una galería: abre la pantalla de inicio de sesión de Gallery. Utiliza tu nombre de usuario y contraseña para iniciar sesión. Después de iniciar sesión, vuelve a las Conexiones de datos guardadas y apunta a la Galería de la lista para ver las conexiones compartidas desde la Galería.
Consulta Administrar conexiones de datos para obtener más información sobre cómo administrar las conexiones de datos guardadas y compartidas y la solución de problemas.
Adobe | Adobe Analytics |
Amazon | Amazon Athena |
Amazon Aurora | |
Amazon Redshift | |
Amazon S3 | |
Apache | Cassandra |
Hadoop Distributed File System (HDFS) | |
Hive | |
Spark | |
Cloudera | Impala |
Hadoop Distributed File System (HDFS) | |
Hive | |
Databricks | Databricks |
ESRI | ESRI GeoDatabase |
Exasolution | EXASOL |
Google Analytics | |
Google BigQuery | |
Google Sheets | |
Hortonworks | Hadoop Distributed File System (HDFS) |
Hive | |
IBM | IBM DB2 |
IBM Netezza | |
Marketo | Marketo |
MapR | Hadoop Distributed File System (HDFS) |
Hive | |
Microsoft | Microsoft Analytics Platform System |
Microsoft Azure Data Lake Store | |
Microsoft Azure SQL Data Warehouse | |
Base de datos de Microsoft Azure SQL | |
Microsoft Cognitive Services | |
Microsoft Dynamics CRM | |
Microsoft OneDrive | |
Microsoft SharePoint | |
Microsoft SQL Server | |
MongoBD | MongoBD |
MySQL | MySQL |
NetSuite | NetSuite |
Oracle | Oracle |
Pivotal | Pivotal Greenplum |
PostgreSQL | PostgreSQL |
Salesforce | Salesforce |
SAP | SAP Hana |
Snowflake |
|
Teradata | Teradata |
Teradata Aster | |
Vertical | Vertical |
Gallery muestra cada galería y su dirección URL que se ha agregado en el equipo local. Una lista debajo de cada nombre de la galería contiene las conexiones guardadas almacenadas en el servidor al que tienes acceso.
Haz clic en + Galería para agregar otra galería.
Selecciona opciones de formato de archivo. Las opciones varían según el archivo o la base de datos a la que te conectes. Consulta Opciones de formato de archivo.
Previsualiza el diseño de datos en la ventana de Previsualización . La vista previa del diseño de datos está limitada a 100 registros o menos en archivos amplios. Si los datos contienen 1500 columnas, se muestra al menos un registro y hasta dos filas. Para ver todos los datos, utiliza Herramienta Examinar.
Para utilizar el modo clásico:
- Haz clic en Opciones > Configuración de usuario > Editar configuración de usuario.
- En la pestaña Valores predeterminados, selecciona la casilla de verificación Usar el modo clásico para las opciones de menú de la herramienta Entrada/salida.
- Haz clic en Aceptar.
- Haz clic en el lienzo o presiona F5 para actualizar.
Ahora puedes usar el modo clásico de la herramienta Datos de entrada para seleccionar tus archivos y fuentes de datos.