Herramienta de descarga

Utilice la herramienta de descarga como alternativa a las limitaciones de los formatos de archivo y las fuentes de datos. Dado que la mayoría de las fuentes de datos tienen una API, puede usar la herramienta de descarga para transferir datos a través de la API del origen de datos. Aquí hay algunas cosas que puede hacer con la herramienta de descarga:

  • Conéctese a cualquier servicio basado en HTTP que incluya FTP y SFTP
  • Conéctese a recursos basados en HTTP, como las API de REST
  • Web raspar mediante una o varias direcciones URL

Visita la serie de maestría de la herramienta de la comunidad de Alteryx para aprender aún más sobre esta y otras herramientas.

Alteryx compatibilidad con galerías públicas

¿Planea publicar su flujo de trabajo en Gallery.alteryx.com? Primero debe solicitar una exención. Esta restricción no se aplica a las instancias privadas de Alteryx Server y Alteryx Gallery.

Configurar la herramienta

Utilice la ficha básica para definir los controles obligatorios de la herramienta de descarga.

  1. Campo URL: especifique el campo de la secuencia de datos entrante que contiene la dirección URL (localizador de recursos uniforme-recurso de Internet) para extraer datos de (o cargar datos). Esto podría ser simplemente un Herramienta Entrada de texto donde la URL se especifica como un valor de campo.
  2. Codificar texto de URL: cuando se comprueba, la URL especificada se codificará según sea necesario, donde los caracteres ASCII inseguros se convierten en un formato que se puede transmitir a través de Internet. Un ejemplo de esto sería la sustitución de% 20 por un espacio.
  3. Salida: Especifique cómo deben formatearse los datos devueltos. Los datos se pueden devolver en un campo de datos o en una salida a un archivo.
    • A un campo: el contenido descargado se devuelve en la secuencia de datos como un campo de datos. Los contenidos descargados estarán en un solo campo llamado "DownloadData". Es probable que tenga que analizar estos datos utilizando herramientas descendentes, como el Herramienta de Texto a Columnas, Herramienta RegExO Herramienta Fórmula.
      • Cadena: los datos se devuelven como un nuevo campo de tipo String ancho. Una cadena ancha admite caracteres Unicode ®.
      • Seleccione una de las Páginas de códigos para utilizar para la codificación. Por defecto es UTF-8. Para obtener los resultados más consistentes, las aplicaciones deben utilizar Unicode, como UTF-8 (Code Page 65001) o UTF-16, en lugar de una página de códigos específica.

      • BLOB: los datos se devuelven como un nuevo campo tipo BLOB. BLOB también se conoce como objetos binarios grandes. Los archivos de imagen suelen almacenarse en este formato. Para utilizar la imagen, configure AM Herramienta Imagen río abajo y especifique el campo imagen o BLOB.
    • A un archivo
      • Archivo temporal: los datos se emiten a un archivo temporal y se ubicarán en el directorio temporal del usuario. Para más información sobre el manejo de archivos temporales en Alteryx, consulte Alteryx y archivos temporales.
      • Nombre de archivo desde un campo: los datos se emiten a un archivo específico donde la especificación de archivo se encuentra en un campo entrante. Utilice el menú desplegable para seleccionar el campo que contiene el nombre de archivo a la salida.

Utilice la ficha encabezados para modificar los encabezados HTTP enviados con la solicitud Web.

  1. Añada de los siguientes valores constantes: permite agregar valores de encabezado fijos.
  2. Para agregar el encabezado "Aceptar: texto/plano", escriba "Accept" en el nombre y "text/plain" en valor.
  3. Y valores de estos campos: toma valores de los datos de registro y crea valores de encabezado.
  4. Por ejemplo, para agregar el encabezado "espere: 100-Continue", seleccione un campo de los datos de entrada denominado "esperar" que contiene "100-Continue".

Utilice la ficha carga útil para establecer la acción http que desea realizar y, opcionalmente, crear la cadena de consulta o el cuerpo de la solicitud Web.

  1. Acción http: Seleccione la acción http para la solicitud Web. Las opciones incluyen:
    • Get (o FTP): realice una solicitud GET o descargue un archivo desde un sitio FTP o SFTP. Esta opción se puede utilizar sin entrar en otras opciones en esta pestaña y se descargará la URL seleccionada.
    • Post: realiza una solicitud post a la URL seleccionada. Normalmente, al utilizar esta opción, se especificaría un cuerpo de correo utilizando las opciones siguientes.
    • Put: realiza una solicitud de Put. Esta opción sólo le permite tomar el cuerpo de la consulta desde un campo BLOB a través de la Herramienta Entrada Blob. Normalmente se utiliza para cargar un archivo en el servidor remoto.
    • Eliminar: realiza una solicitud de eliminación. Normalmente se utiliza para pedir al servidor remoto que elimine un recurso especificado.
    • Head: realiza una petición de cabeza. Esto le pide al servidor que devuelva los datos del encabezado, pero no los datos del cuerpo.
    • Custom: permite introducir un verbo personalizado en un cuadro de texto. Todo lo demás sobre esta petición se comportan igual que un post. El verbo post es sustituido por el verbo Custom justo antes de que se realice la solicitud.
    • Soporte de Verb

      Estas opciones sólo funcionan si el servidor remoto al que envía las solicitudes admite un verbo determinado. Compruebe la documentación de la API de la dirección URL que está utilizando para ver qué solicitudes se admiten.

  2. Elija entre las siguientes opciones de cadena de consulta/cuerpo:
    • Redactar cadena/cuerpo de consulta:
      1. De los siguientes valores constantes: agrega pares de valor de nombre constante a la cadena de consulta/cuerpo
      2. Y valores de estos campos: toma pares de valor de nombre del registro de datos entrante. El nombre de campo es el nombre utilizado en la cadena de consulta/cuerpo
      3. Content-Type: controla cómo se codifican los pares de valor de nombre.
        • Application/x-www-form-urlencoded: e.g. NAME1 = valor1 & nombre2 = valor2 & Name3 = valor3. Los caracteres ASCII no seguros se codifican automáticamente, así que asegúrese de que sus datos no estén codificados.
        • Multipart/form-data: sólo disponible cuando se utilizan las acciones http post y Custom.
    • Tomar la cadena de consulta/cuerpo desde el campo: seleccione el campo en los datos de entrada que contiene la cadena de consulta/datos del cuerpo. Los campos BLOB se pueden seleccionar cuando se usan las acciones http post, Put y Custom.
    • Utilice lo siguiente para la cadena de consulta/cuerpo: cuadro de texto que le permite escribir manualmente la cadena de consulta o el contenido del cuerpo.

    Todos los datos de texto son UTF-8 codificados antes de ser enviados al servidor Web remoto.

Utilice la ficha conexión para configurar las credenciales de conexión.

  1. Username: ingrese el nombre de usuario si es requerido por la especificación de URL arriba. Este es un campo opcional.
  2. Contraseña: Introduzca la contraseña si lo requiere la especificación de URL anterior. Este es un campo opcional.
  3. Conexiones máximas: especifique el número máximo de transferencias simultáneas para que la herramienta de descarga se ejecute. Las transferencias sólo se realizan en paralelo cuando hay varios registros de entrada enviados a la herramienta de descarga. Las múltiples herramientas de descarga operan de forma independiente, pero normalmente no funcionan al mismo tiempo. Para las nuevas herramientas de descarga agregadas a un flujo de trabajo, el número predeterminado de conexiones es 2 y el número máximo de conexiones es 32.
  4. El aumento del número de conexiones puede reducir el tiempo total que se toma para completar todas las transferencias, pero por favor tenga cuidado de no ajustar el número demasiado alto ya que podría sobrecargar el servidor que se está utilizando. Es posible que el servidor pueda dejar de responder, informar de errores o incluso rechazar conexiones si cree que lo está usando de forma indebido. Esto es particularmente importante cuando se accede a un sitio público que no está bajo su control. La mayoría de los navegadores web realizarán hasta 6 transferencias simultáneas, pero normalmente se trata de transferencias relativamente pequeñas como parte de una página web. Para un servidor dentro de su propio negocio donde usted tiene más control sobre cómo está configurado, usando un número más alto de conexiones puede estar bien.

    Adicionalmente, debido a que la herramienta de descarga enviará los registros por transferencias completas, es probable que se produzca un cambio en el orden de los registros a medida que pasan a través de la herramienta. Si el orden importa a su flujo de trabajo, asegúrese de ordenar los resultados o limitar el número de conexiones a 1. Por último, tenga en cuenta que las URLs vacías se procesarán por delante de aquellas que requieran una transferencia real.

  5. Timeout (segundos): especifique el número de segundos que debe esperar antes de informar de un tiempo de espera debido a una conexión que no responde. Seleccione un número de 0 (nunca timeout) a 10.000.

Otras consideraciones

Para evitar retrasos en la conexión al utilizar la herramienta de descarga, asegúrese de que la opción "detectar automáticamente la configuración" está deseleccionada dentro de las propiedades de Internet de su cuenta (panel de control > opciones de internet > conexiones > configuración de LAN).