Outil Télécharger

Utilisez l’outil de téléchargement comme alternative aux limitations des formats de fichiers et des sources de données. Étant donné que la plupart des sources de données ont une API, vous pouvez utiliser l’outil de téléchargement pour transférer des données via l’API de la source de données. Voici quelques choses que vous pouvez faire avec l’outil de téléchargement:

  • Se connecter à n’importe quel service basé sur HTTP, y compris FTP et SFTP
  • Se connecter aux ressources basées sur HTTP, telles que les API REST
  • Gratter Web en utilisant une ou plusieurs URL

Visitez la série de Maîtrise des outils de la communauté Alteryx pour en savoir plus sur cet outil et les autres.

Compatibilité de la galerie publique alteryx

Vous envisagez de publier votre workflow sur Gallery.alteryx.com? Vous devez d’abord demander une exemption. Cette restriction ne s’applique pas aux instances privées d’Alteryx Server et d’Alteryx Gallery.

Configurer l’outil

Utilisez l' onglet Basic pour définir les contrôles obligatoires pour l'outil de téléchargement.

  1. Champ URL: Spécifiez le champ à partir du flux de données entrant qui contient l'URL (Uniform Resource Locator-ressource Internet) pour extraire des données (ou télécharger des données vers). Cela pourrait simplement être un Outil Saisie de texte où l'URL est spécifiée en tant que valeur de champ.
  2. Encoder le texte d'URL: une fois cochée, l'URL spécifiée sera encodée si nécessaire lorsque les caractères ASCII non sécurisés sont convertis en un format qui peut être transmis sur Internet. Par exemple, les espaces sont remplacés par %20.
  3. Output: Spécifiez comment les données retournées doivent être mises en forme. Elles peuvent être insérées dans un champ de données ou dans un fichier.
    • Dans un champ: le contenu téléchargé est retourné dans le flux de données sous forme de champ de données. Le contenu téléchargé est placé dans un champ unique appelé « DownloadData ». Vous devrez probablement analyser ces données à l'aide d'outils en aval tels que le Outil Texte en colonnes, Outil RegEx, ou Outil Formule.
      • String: les données sont retournées sous la forme d'un nouveau champ de type chaîne large. Une chaîne large prend en charge les caractères Unicode ®.
      • Sélectionnez l'une des Pages de code à utiliser pour l'encodage. La valeur par défaut est UTF-8. Afin d’optimiser la cohérence des résultats, les applications doivent utiliser un format Unicode, par exemple UTF-8 (page de code 65001) ou UTF-16 au lieu d’une page de code spécifique.

      • BLOB: les données sont retournées sous la forme d'un nouveau champ de type BLOB. Les Blobs sont également connus sous le nom de « grands objets binaires ». Les fichiers image sont généralement stockés dans ce format. Pour utiliser l'image, configurez AM Outil Image en aval et spécifiez l'image ou le champ BLOB.
    • Dans un fichier
      • Fichier temporaire: les données sont sorties dans un fichier temporaire et se trouvent dans le répertoire temporaire de l'utilisateur. Pour en savoir plus sur la gestion des fichiers temp dans Alteryx, voir Alteryx et les fichiers temporaires.
      • Filename à partir d'un champ: Data est sortie vers un fichier spécifique où la spécification du fichier se trouve dans un champ entrant. Utilisez la liste déroulante pour sélectionner le champ contenant le nom du fichier de sortie.

Utilisez l' onglet en-têtes pour modifier les en- têtes HTTP envoyés avec la demande Web.

  1. Ajoutez les valeurs de constante suivantes: permet d'ajouter des valeurs d'en-tête fixes.
  2. Pour ajouter l'en-tête "accepter: text/plain", entrez "Accept" dans le nom et "text/plain" dans la valeur.
  3. Et les valeurs de ces champs: prend des valeurs à partir des données d'enregistrement et crée des valeurs d'en-tête.
  4. Par exemple, pour ajouter l'en-tête "expect: 100-continue", sélectionnez un champ à partir des données d'entrée nommées "expect" qui contient "100-continue."

Utilisez l' onglet charge utile pour définir l'action http que vous souhaitez effectuer et éventuellement générer la chaîne ou le corps de la requête pour la demande Web.

  1. Action http: Sélectionnez l'action http pour la demande Web. Plusieurs choix sont possibles :
    • Get (ou FTP): effectuez une demande GET ou téléchargez un fichier à partir d'un site FTP ou SFTP. Cette option peut être employée sans spécifier d’autres options dans cet onglet. Elle télécharge alors l’URL sélectionnée.
    • Post: effectue une demande post à l'URL sélectionnée. Généralement, lorsque vous utilisez cette option, vous devez spécifier un corps POST à l’aide des options ci-après.
    • Put: effectue une demande put. Cette option vous permet uniquement de prendre le corps de la requête à partir d'un champ BLOB via le Outil Entrée Blob. Généralement, elle est utilisée pour transférer un fichier vers le serveur distant.
    • Delete: effectue une demande de suppression. Généralement, elle est utilisée pour demander au serveur distant de supprimer une ressource spécifiée.
    • Head: effectue une demande de tête. Elle demande au serveur de renvoyer les données de l’en-tête, mais pas celles du corps.
    • Custom: vous permet d'entrer un verbe personnalisé dans une zone de texte. Ce détail mis à part, cette option fonctionne exactement comme la requête POST. Le verbe POST est remplacé par celui que vous avez spécifié juste avant le lancement de la requête.
    • Prise en charge des verbes

      Ces options ne fonctionnent que si le serveur distant que vous envoyez les demandes pour prend en charge un verbe particulier. Pour obtenir la liste des requêtes prises en charge, consultez la documentation de l’API sur l’URL utilisée.

  2. Choisissez parmi les options de chaîne/corps de requête suivantes :
    • Composer la chaîne/le corps de requête :
      1. À partir des valeurs de constante suivantes: ajoute des paires valeur de nom constant à la chaîne de requête/corps
      2. Et les valeurs de ces champs: prend des paires de valeurs de nom de l'enregistrement de données entrant. Le nom du champ est celui utilisé dans la chaîne/le corps de requête.
      3. Content-type: contrôle la façon dont les paires de valeurs de nom sont encodées.
        • Application/x-www-form-urlencoded: p. ex. Nom1 = value1 & nom2 = value2 & Name3 = value3. Les caractères ASCII susceptibles de générer des erreurs étant automatiquement encodés, assurez-vous que vos données ne le sont pas déjà.
        • Multipart/form-data: uniquement disponible lors de l'utilisation des actions http post et Custom.
    • Prendre la chaîne de requête/corps de champ: sélectionnez le champ dans les données d'entrée qui contient les données de la chaîne de requête/corps. Vous pouvez choisir un champ Blob si vous utilisez l’option POST, PUT ou Personnalisé… de la fonction Actions HTTP.
    • Utilisez la suite pour la chaîne de requête/Body: zone de texte vous permettant de taper manuellement la chaîne de requête ou le contenu du corps.

    Toutes les données de texte sont encodées en UTF-8 avant d’être envoyées au serveur Web distant.

Utilisez l' onglet connexion pour configurer les informations d'identification de connexion.

  1. Username: Entrez le nom d'utilisateur si requis par la spécification d'URL ci-dessus. Ce champ est facultatif.
  2. Mot de passe: Entrez le mot de passe si requis par la spécification d'URL ci-dessus. Ce champ est facultatif.
  3. Connexions maximales: Spécifiez le nombre maximal de transferts simultanés pour l'outil de téléchargement à effectuer. Les transferts sont uniquement effectués en parallèle lorsque plusieurs enregistrements d’entrée sont envoyés à l’outil Télécharger. Si plusieurs outils Télécharger sont employés, ils agissent indépendamment mais pas nécessairement en simultané. Pour les nouveaux outils Télécharger ajoutés à un workflow, le nombre de connexions maximum est de 32 (par défaut, 2).
  4. L’augmentation du nombre de connexions peut réduire la durée totale des transferts. Néanmoins, un nombre trop élevé risque de provoquer un engorgement du serveur utilisé. S’il soupçonne un abus de ses services, il est possible que le serveur cesse de répondre, qu’il affiche des erreurs et même qu’il refuse les connexions. Ce point est particulièrement important lorsque vous accédez à un site public que vous ne contrôlez pas. La plupart des navigateurs Web peuvent effectuer jusqu’à 6 transferts simultanés, mais il s’agit généralement de transferts relativement petits dans le cadre d’une consultation de page Web. Si le serveur se trouve à l’intérieur de vos locaux et si vous disposez d’un certain degré de contrôle sur sa configuration, vous pouvez vraisemblablement utiliser un nombre de connexions supérieur.

    En outre, dans la mesure où l’outil Télécharger envoie les enregistrements vers l’aval à la fin du transfert, il se peut qu’il en modifie l’ordre quand ils passent dans l’outil. Si l’ordre est important pour votre workflow, assurez-vous de trier les résultats ou de n’utiliser qu’une seule connexion. Enfin, veuillez noter que les URL vides sont traitées avant celles nécessitant réellement un transfert.

  5. Délai d'attente (secondes): Spécifiez le nombre de secondes à attendre avant de signaler un délai d'attente en raison d'une connexion non réactive. Sélectionnez un nombre entre 0 (le délai n’expire jamais) et 10 000.

Autres considérations

Pour éviter un ralentissement de la connexion lors de l’utilisation de l’outil Télécharger, veillez à ce que l’option Détecter automatiquement les paramètres soit désélectionnée dans les propriétés Internet de votre compte (Panneau de configuration > Options Internet > Connexions > Paramètres réseau).