Skip to main content

Input Data Tool Icon Outil Entrée de données

Exemple d'outil unique

L'outil Entrée de données a un exemple d'outil unique Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

Utilisez l'outil Entrée de données pour ajouter des données à votre workflow en le connectant à un fichier ou à une base de données.

Note

L'utilisation de caractères génériques pour lire plusieurs fichiers .csv avec le Système de fichiers distribués Hadoop  génère une erreur.

Configuration de l'outil

La fenêtre Configuration de l'outil Entrée de données comporte deux sections : Connecter un fichier ou une base de données  et Options .

Connecter un fichier ou une base de données

Les étapes ci-dessous décrivent le processus avec le Gestionnaire de connexions aux données (DCM) désactivé. Lorsque cette option est activée, la liste déroulante Connecter un fichier ou une base de données est remplacée par un bouton Configurer une connexion qui ouvre la fenêtre Connexions aux données affichant uniquement les sources de données prises en charge par le DCM, et ouvre le DCM en sélectionnant une technologie.

Avec l'outil Entrée de données sur le canevas, suivez ces étapes :

  1. Dans la fenêtre Configuration , cliquez sur le menu déroulant Connecter un fichier ou une base de données .

  2. Designer affiche la fenêtre Connexion aux données . Configurez votre connexion aux données à l'aide de l'un des éléments suivants : Récent , Enregistré , Fichiers , Sources de données ou Server .

La section  Connexions récentes contient les fichiers et connexions aux données récemment configurés. Vous pouvez sélectionner une connexion récente ou sélectionner Effacer la liste pour supprimer les connexions récentes.

Sélectionnez une connexion enregistrée . Pour renommer et modifier vos connexions, utilisez Gérer les connexions enregistrées .

Pour vous connecter à un fichier dans un répertoire local ou réseau, utilisez une des 4 options suivantes :

  • Dans Connexions de fichier , cliquez sur Sélectionner un fichier pour accéder à un fichier.

  • Faites glisser un fichier vers Connexions de fichier .

  • Dans Tous les types de fichiers pris en charge , sélectionnez une extension de type de fichier pour accéder à un fichier de ce type.

  • Fermez la fenêtre Connexions de données et faites glisser un fichier directement sur le canevas.

Sources de données

L'onglet Sources de données affichent les sources de données prises en charge et fréquemment utilisées.

  • Outils : si vous sélectionnez Connexion rapide pour un outil que vous n'avez pas installé, un navigateur s'ouvre sur la Communauté Alteryx pour vous permettre de télécharger et d'installer cet outil. Lisez attentivement les instructions de la page. Une fois l'outil installé, l'outil Entrée de données change sur le canevas et est remplacé par l'outil que vous avez sélectionné dans l'onglet «  Sources de données  ».

  • Sources de données  :

    • « ODBC » lance la fenêtre de connexion ODBC qui affiche une liste filtrée de DSN sur le système utilisant ce pilote spécifique.

    • « OleDB » lance le gestionnaire OleDB natif Windows.

    • « OCI » lance le gestionnaire de connexions native Oracle OCI. À partir de là, sélectionnez le nom du service réseau tel que défini dans le fichier tnsnames. ora que vous souhaitez utiliser pour cette connexion, ainsi que les informations d'identification, à savoir le nom d'utilisateur et le mot de passe.

    • « En masse » ouvre une boîte de dialogue spéciale qui vous permet de configurer une connexion en masse pour le type de connexion sélectionné.

    • « Connexion rapide » : pour la connexion rapide SQL ou Oracle, vous pouvez soit utiliser une connexion enregistrée préexistante, soit créer une nouvelle connexion enregistrée. Pour plus de détails, consultez ces pages :

    • Toutes les autres connexions rapides utilisent un autre outil.

Server

Server affiche chaque interface utilisateur Server et son URL qui a été ajoutée sur l'ordinateur local. Une liste sous chaque nom de Server contient les connexions enregistrées stockées sur le Server auquel vous avez accès.

Sélectionnez + Server pour ajouter un autre Alteryx Server.

Dans la fenêtre d'explorateur de fichiers, entrez un caractère générique dans le chemin d'accès au fichier.

Imaginez un cas où vous avez plusieurs fichiers de données avec...

  • Le même nombre de champs où les types de données de chaque champ sont identiques.

  • Noms similaires dans le même répertoire.

Note

Plusieurs fichiers sont lus à l'aide d'un format à caractère générique, tel que *.csv ou 2019*.csv, dans un seul outil Entrée de données, à condition que tous les fichiers contiennent le même nombre de champs, où les types de données de chaque champ sont identiques. Designer définit le nombre de champs et les types de fichiers en fonction du 1er fichier lu. Tous les fichiers suivants qui ne correspondent pas sont ignorés et un avertissement s'affiche. Il n'est pas possible de contrôler le fichier qui est lu en premier en utilisant une syntaxe à caractère générique telle que *.csv. Le système est chargé de désigner le premier fichier.

Saisissez le nom de fichier que les multiples fichiers ont en commun et ajoutez un signe * (astérisque) pour remplacer tous les caractères suivants ou un signe ? pour remplacer 1 caractère. Lorsque vous spécifiez les noms de fichiers, incluez l'extension commune à tous les fichiers.

Exemple 1

Ce chemin permet de recenser tous les fichiers .csv figurant dans le répertoire data\datafiles et dont le nom commence par ABCD .

data\datafiles\ABCD*.csv

Cela fait apparaître ABCD_4.csv et ABCD_012.csv .

Exemple 2

Ce chemin permet de recenser tous les fichiers .csv figurant dans le répertoire data\datafiles dont le nom commence par  ABCD_  et comporte un caractère supplémentaire.

data\datafiles\ABCD_?.csv

Dans  Sélectionner une entrée Excel , sélectionnez l'une des entrées Excel :

  • Sélectionner une feuille pour choisir parmi les feuilles disponibles dans le fichier Excel.

    • Sélectionner une plage (cellules, lignes ou colonnes)  : facultativement, sélectionnez une plage de cellules, de lignes ou de colonnes dans la feuille.

  • Sélectionner une plage nommée pour choisir parmi les plages nommées disponibles dans le fichier Excel.

  • Importer seulement la liste des noms de feuille pour créer une sortie à une seule colonne contenant des noms de feuille comme valeurs. Aucune des données connexes n'est obtenue lorsque cette option est sélectionnée.

Si la feuille Excel sélectionnée est ouverte, un message d'erreur apparaît et vous ne pouvez pas continuer. Fermez la feuille, sélectionnez le bouton Actualiser dans la boîte de dialogue Sélectionner une entrée Excel et terminez le processus d'entrée.

L'outil Entrée de données ignore les colonnes qui ne sont pas définies. Une colonne définie est une colonne qui contient des données ou qui contenait auparavant des données qui ont été effacées par l'utilisateur. Pour inclure les colonnes qui ne sont pas définies, spécifiez une plage via l'option Sélectionner une plage (cellules, lignes ou colonnes) dans la boîte de dialogue Sélectionner une entrée Excel .

Consultez Prise en charge des fichiers Gzip et Prise en charge des fichiers Zip pour plus d'informations.

Lorsque vous sélectionnez un fichier.gz, .tgz ou .zip, la fenêtre Sélectionner le type de fichier à extraire s’affiche. Utilisez la liste déroulante pour sélectionner le type de fichier à utiliser.

Sélectionner des fichiers  : cliquez sur la case à cocher en regard du fichier que vous souhaitez extraire.

Pour voir tous les fichiers figurant dans le fichier Gzip ou Zip, y compris les fichiers qui ne sont pas pris en charge par Alteryx, sélectionnez Autres fichiers sous Sélectionner le type de fichier à extraire . Sélectionnez un type de fichier pour Analyser d'autres fichiers en tant que .

Important

Alteryx ne prend pas en charge les fichiers Gzip et Zip dans la galerie.

Alteryx Calgary

.cydb

Base de données Alteryx

.yxdb

Alteryx Spatial Zip

.sz

Avro

.avro

Valeurs séparées par des virgules

.csv

dBase

.dbf

ESRI Personal GeoDatabase

.mdb

ESRI Shapefile

.shp

Langage de balisage extensible

.xml

Flat ASCII

.flat

GIS

.grc, .grd

Google Earth/Google Maps

.kml

Gzip

.gz, .tgz

IBM SPSS

.sav

JSON

.json

Format MapInfo Professional Interchange

.mif

Table MapInfo Professional

.tab

Microsoft Access 2000-2003

.mdb

Microsoft Access 2007, 2010, 2013, 2016

.accdb

Microsoft Excel Binary

.xlsb

Microsoft Excel 1997-2003

.xls

Microsoft Excel

.xlsx

Macro Microsoft Excel activée

.xlsm

QlikView

.qvx

SAS

.sas7bdat

SQLite

.sqlite

SRC Geography

.geo

Texte

.txt, .asc

Zip

.zip

Les types de fichiers inconnus comprennent tout autre type de fichier qu'Alteryx ne peut pas lire nativement. Si vous utilisez un  outil Entrée de données  pour lire un type de fichier inconnu, la fenêtre Résoudre le type de fichier s'affiche et contient ces options :

  • Lire en tant que type intégré  : sélectionnez le type de fichier similaire à la structure de votre fichier.

  • Lire en tant que fichier texte à largeur fixe  : lorsque vous sélectionnez cette option, vous pouvez attribuer des colonnes à l'aide d'une règle défilante. Pour plus d'informations sur cette option, accédez à  Mise en page des fichiers plats .

  • Lire en tant que fichier texte délimité  : sélectionnez cette option si les sauts de colonne dans vos données ne sont symbolisés que par un seul délimiteur. Sélectionnez un type de délimiteur approprié et, éventuellement, indiquez si la première ligne contient les noms de champ dans vos données.

Options

Sélectionnez les options de format de fichier. Les options varient en fonction du fichier ou de la base de données auquel vous vous connectez. Accédez à  Options de format de fichier  pour plus d'informations.

Prévisualiser la disposition des données

Prévisualisez la disposition des données dans la fenêtre Aperçu . L'aperçu de la disposition des données est limité à 100 enregistrements ou moins si les fichiers sont volumineux. Si les données contiennent 1500 colonnes, au moins 1 enregistrement et jusqu'à 2 lignes s'affichent. Pour afficher toutes les données, utilisez un outil Explorateur .

Noms des colonnes en double

Si votre fichier d'entrée contient plusieurs colonnes du même nom, Designer renomme automatiquement les colonnes en double selon les règles suivantes :

Le nom en double se termine par 1 ou 9

Si le dernier caractère du nom de la colonne en double est 1 ou 9, Designer ajoute un trait de soulignement (_) et un chiffre, commençant par 2, au nom de colonne en double.

Nom d'origine de la colonne

Colonne en double (renommée par Designer)

A1

A1_2

A9

A9_2

Le nom en double se termine par un chiffre compris entre 2 et 8 (inclus)

Si le dernier caractère du nom de la colonne en double est un chiffre compris entre 2 et 8 (inclus), Designer incrémente ce chiffre pour renommer le nom de la colonne en double.

Cependant, si l'avant dernier caractère est également un chiffre, Designer ajoute un trait de soulignement (_) et un chiffre, commençant par 2, au nom de colonne en double.

Nom d'origine de la colonne

Colonne en double (renommée par Designer)

A2

A3

A5

A6

A22

A22_2

Le nom en double se termine par une lettre ou un caractère spécial

Si le dernier caractère du nom de la colonne en double est une lettre ou un caractère spécial, Designer ajoute un chiffre (commençant par 2) pour renommer le nom de la colonne en double.

Nom d'origine de la colonne

Colonne en double (renommée par Designer)

âge

âge2

inscrit ?

inscrit ?2

Note

Le Générateur visuel de requêtes ne peut pas afficher correctement les caractères multi-octets. Utilisez plutôt l'onglet Tables.

Convertir un outil Sortie de données en outil Entrée de données

Vous pouvez convertir un outil Sortie de données en un outil Entrée de données

  1. Cliquez avec le bouton droit de la souris sur l' outil Sortie de données que vous souhaitez convertir en outil Entrée de données .

  2. Sélectionnez Convertir à Entrée de données .

Les données de sortie deviennent les données d'entrée.