Skip to main content

Page Importer des données

Note

Pour les sources basées sur des fichiers, Alteryx One Platform s'attend à ce que chaque ligne du fichier d'import soit terminée par un caractère de nouvelle ligne cohérent, y compris la dernière ligne.

  • Pour les fichiers ne comportant pas ce dernier caractère, l'enregistrement final peut être ignoré.

  • Pour les importations multifichiers sans saut de ligne dans l'enregistrement final d'un fichier, cet enregistrement final peut être fusionné avec le premier du fichier suivant, puis déposé dans l'Trifacta Photonenvironnement d'exécution.

Limitations générales

Note

Un jeu de données importé nécessite environ 15 lignes pour déduire correctement les types de données de colonne (pour les sources non relationnelles) et la ligne, le cas échéant, à utiliser pour les en-têtes de colonne.

Limites de fichier et de chemin :

  • Le caractère deux-points ( :) ne peut pas apparaître dans un nom de fichier ou un chemin de fichier.

  • Les noms de fichiers ne peuvent pas commencer par des caractères spéciaux tels que le point (.) ou le souligné ( _).

  • Les chemins de fichier ou de table d'entrée peuvent avoir une longueur maximale de 1024 caractères.

Tâche de base

1. Connecter aux sources

Lors de l'importation, Alteryx One identifie les formats de fichiers en fonction de l'extension du nom de fichier.

  • Les fichiers compressés sont reconnus et peuvent être importés en fonction de leurs extensions de fichier.

  • Les noms de fichiers qui n'ont pas d'extension sont traités comme des fichiers TXT.

Charger :Alteryx One peut également charger des fichiers à partir de votre système de fichiers local.

Astuce

Vous pouvez faire glisser et déposer des fichiers à partir de votre bureau pour les charger.

Note

Vous pouvez charger un fichier d'une taille maximale de 1 Go.

Note

Lorsque vous téléchargez une version mise à jour d'un fichier précédemment chargé, le nouveau fichier est stocké en tant que chargement séparé. Lorsque le jeu de données importé basé sur la version précédente est utilisé, il est nécessaire de remplacer l'ancien jeu de données pour pointer vers le nouveau.

Trifacta : si vous avez activé Alteryx Data Storage (ADS) pour votre espace de travail, vous pouvez accéder aux fichiers de ADS que vous avez chargés. Ces fichiers peuvent devenir la source pour la création de vos jeux de données importés.

Note

ADS peut être activé si ce n'est pas le cas. Pour en savoir plus, consultez la page Configuration de l'environnement de stockage.

Voir ADS Explorateur.

S3 : si vous êtes connecté à une instance S3, vous pouvez parcourir vos compartiments S3 pour sélectionner des fichiers sources.

Astuce

Pour S3, vous pouvez sélectionner des dossiers et ainsi définir chaque fichier du répertoire comme jeu de données distinct.

Voir Connexions S3 externes.

Redshift : si une connexion à un entrepôt de données S3 est configurée, il est possible d'importer la source depuis la base de données connectée. Voir Connexions Amazon Redshift.

Bases de données : si vous êtes connecté à une banque de données relationnelle, vous pouvez charger des tables ou des vues à partir de votre base de données. Voir Explorateur de bases de données.

Note

Pour les sources relationnelles longues à charger, il est possible de suivre la progression à chaque étape de l'ingestion. Une fois que ces sources ont été ingérées, les étapes suivantes d'importation et d'organisation des données peuvent être plus rapides.

Pour en savoir plus, consultez la page Présentation de la surveillance de tâche.

Pour plus d'informations sur les formats d'entrée pris en charge, consultez Formats de fichier pris en charge.

Nouveau/Modifier : cliquez sur ce bouton pour créer ou modifier une connexion. Par défaut, les connexions affichées prennent en charge l'importation.

Rechercher :saisissez un terme de recherche pour localiser une connexion spécifique.

Voir la fenêtre Créer une connexion.

2. Ajouter des jeux de données

Lorsque vous avez trouvé votre répertoire ou fichier source :

  • Vous pouvez survoler le nom d'un fichier pour prévisualiser son contenu.

    Note

    L'aperçu peut ne pas être disponible pour certaines sources, telles que Parquet.

  • Cliquez sur l'icône plus en regard du nom du répertoire ou du fichier pour l'ajouter en tant que jeu de données.

    Astuce

    Vous pouvez importer plusieurs jeux de données en même temps. Voir ci-après.

  • Fichiers Excel : cliquez sur l'icône Plus à côté du classeur parent pour ajouter toutes les feuilles comme un seul jeu de données, ou d'ajouter chaque feuille individuellement comme jeu de données distinct.

  • Si la requête SQL personnalisée est activée, sélectionnez Créer un jeu de données avec SQL pour saisir une instruction SQL personnalisée afin de pré-filtrer la table dans la base de données pour inclure uniquement les lignes et les colonnes qui vous intéressent.

    Pour en savoir plus, consultez la page Création d'un jeu de données avec SQL.

Si le paramétrage a été activé, vous pouvez appliquer des paramètres aux chemins de source de vos jeux de données pour capturer un ensemble plus large de sources. Sélectionnez Créer un jeu de données avec Paramètres. Accédez à Créer un jeu de données avec Paramètres. Vous pouvez afficher les fichiers ou dossiers masqués.

Note

Les noms de dossiers masqués commencent par un point (.) ou un souligné (_). En général, ces dossiers sont masqués pour une bonne raison. Les structures de fichiers peuvent changer sans préavis.

3. Configurer les sélections

Lorsqu'un jeu de données a été sélectionné, les champs suivants apparaissent sur le côté droit de l'écran. Effectuez les modifications nécessaires :

  • Nom du jeu de données : ce nom apparaît dans l'interface.

  • Description du jeu de données : vous pouvez ajouter une description facultative qui fournit des détails supplémentaires sur le jeu de données. Ces informations sont visibles dans certaines zones de l'interface.

Astuce

Cliquez sur l'icône en forme d'œil pour inspecter le contenu du jeu de données avant de l'importer.

Astuce

Vous pouvez sélectionner un ou plusieurs jeux de données pour l'importation.

4. Importer les sélections

Lorsque vous importez un jeu de données avec des paramètres provenant de plusieurs fichiers, seul le premier fichier correspondant s'affiche dans le panneau de droite.

Dans le panneau, vous pouvez voir un aperçu de chaque jeu de données et apporter les modifications nécessaires.