Assistant d’importation de données texte

22.04.2021

L'assistant d'importation de données textuelles vous aide à importer des ensembles de données à partir de fichiers texte.

L'assistant vous guide à travers quatre étapes pour compléter le processus d'importation :

Étape 1 - Paramètres du fichier

Vous spécifiez ici comment les données du fichier sont organisées et formatées. L'assistant tente de déterminer automatiquement les paramètres corrects du fichier et fournit le nombre de colonnes détectées en utilisant les paramètres actuels. Vérifiez ces paramètres avant de passer à l'étape suivante.

Le contenu du fichier est affiché dans un volet de prévisualisation afin que vous puissiez vérifier les paramètres. Les fichiers très volumineux ne s'affichent pas complètement, mais peuvent tout de même être importés dans leur intégralité.

Dans le champ Sélectionner le schéma d'importation enregistré ( Pas de modèle). Toutefois, vous avez la possibilité de sélectionner un schéma d'importation précédemment enregistré comme modèle, d'ajuster les paramètres et de l'enregistrer dans le dernier écran de l'assistant sous le même nom ou sous un nom différent.

Dans le champ Codage des caractères, indiquez le jeu de caractères utilisé pour coder les données. Le codageUTF est détecté automatiquement s'il est noté par l'utilisation d'une marque d'ordre d'octet (BOM) au début du fichier. Sinon, la page de code du système d'exploitation est définie par défaut. Vous pouvez généralement savoir si le réglage est incorrect si les caractères spéciaux ne s'affichent pas correctement.

Le champ Orientation permet de préciser si les données sont stockées par colonne ou par ligne.

Note :Comme la plupart des formats de données textuelles sont organisés par colonne, nous couvrons ici ce scénario particulier. Pour les données organisées par ligne, vous pouvez intervertir "ligne" et "colonne" dans le texte suivant.

Utilisez le champ Délimiteur de colonne pour spécifier comment les colonnes du fichier ont été séparées. Utilisez l'option Un seul délimiteur par colonne pour indiquer si le délimiteur doit être utilisé une seule fois ou aussi souvent que nécessaire. Les tableaux de texte sont souvent formatés avec des espaces vides, comme dans le cas d'une série de caractères d'espacement et de tabulations. Dans ce cas, sélectionnez Tab ou espace comme délimiteur et désélectionnez l'option Un seul délimiteur par colonne. Toutefois, certains tableaux de texte sont formatés de manière à ce qu'un seul caractère de tabulation soit utilisé comme délimiteur. Deux onglets séquentiels indiquent alors un champ vide. Dans ce cas, sélectionnez Tab comme délimiteur et sélectionnez l'option Un seul délimiteur par colonne.

Dans le champ Symbole décimal, indiquez le symbole décimal utilisé pour les valeurs à virgule flottante. Les milliers de séparateurs existants seront détectés et filtrés automatiquement.

Sous Plage de données, indiquez où commencent et se terminent les données réelles du fichier.

Étape 2 - Autres paramètres

Onglet Lignes d'en-tête et zone de données

Vous spécifiez ici à partir de quelle ligne les noms, les unités et les commentaires doivent être lus. Si vous laissez un champ vide, l'attribut particulier ne sera pas lu. Vous pouvez spécifier le même numéro de ligne pour les noms et les unités; vous pouvez spécifier le même numéro de ligne si l'unité a été spécifiée après le nom. Dans ce cas, une zone de liste supplémentaire apparaît, dans laquelle vous pouvez spécifier exactement le format utilisé.

X Onglet Ensemble de données

Vous indiquez ici si un ensemble de données X doit être lu ou calculé. L'ensemble de données X est ensuite affecté à tous les ensembles de données à lire, qui sont alors des ensembles de données Y. Dans un fichier texte contenant des séries temporelles, par exemple, la colonne contenant les valeurs temporelles serait l'ensemble de données X.

Sélectionnez Spécifier le jeu de données X via le numéro du jeu de données si le jeu de données X est présent dans le fichier. Pour le numéro, entrez le numéro de la colonne tel qu'il apparaît dans l'en-tête de la table des matières. Si chaque colonne Y a sa propre colonne X, sous Utiliser chaque nième colonne comme un ensemble de données X, entrez la grille dans laquelle elles apparaissent dans le fichier.

La sélection de l'ensemble de données X personnalisé vous permet de calculer un ensemble de données X avec des valeurs qui augmentent de façon linéaire. Utilisez cette option, par exemple, lorsque les valeurs X n'ont pas été enregistrées dans le fichier, mais que la fréquence ou l'intervalle d'échantillonnage sont connus. Dans ce cas, l'option Importer en tant que signal est définie automatiquement. Il vous suffit d'entrer soit l'intervalle d'échantillonnage, soit le taux d'échantillonnage, qui calculera automatiquement l'autre valeur. Sélectionnez à partir du paramètre si les attributs requis pour le calcul sont présents dans le fichier en tant que paramètres nommés.

Dans le champ Timestamp, vous pouvez saisir la valeur de l'heure du calendrier que FlexPro peut ensuite utiliser pour convertir le temps absolu en temps relatif et vice versa. Vous pouvez également définir le paramètre from pour lire l'horodatage à partir du fichier.

Remarques :
Si vous importez les données en tant que objets de liaison de données texteles données Y et X sont toujours combinées en tant que signaux.

Les numéros d'ensembles de données que vous pouvez être amené à spécifier sur cet onglet et sur d'autres sont alors identiques aux numéros de colonnes tels qu'ils apparaissent dans l'en-tête du contenu de la table lorsque seules les données d'une colonne sont affectées à chaque ensemble de données. Cependant, ce n'est pas toujours le cas. Lors de la lecture des valeurs du calendrier avec la date et l'heure, il se peut que deux colonnes soient affectées à un ensemble de données.

Onglet Heure du calendrier

Dans l'onglet Heure du calendrier, indiquez si les données d'heure du calendrier apparaissent dans le fichier texte, c'est-à-dire les valeurs horaires avec la date et/ou l'heure. Dans le champ Format, indiquez le format existant. Dans la plupart des cas, le format est détecté automatiquement. Le seul cas où vous devez ajuster manuellement le format est celui où les données ne peuvent pas être interprétées clairement (par exemple, les données de l'année précédente). "12-12-12"). Les lettres utilisées signifient les choses suivantes : J= jour, M= mois, A= année, h= heure, m= minute, s= seconde. La séquence MMM est le texte abrégé du mois. Les abréviations de texte du format de date défini dans le système d'exploitation Windows, les abréviations de texte allemandes JAN, FEB, MAR, APR, MAI, JUN, JUL, AUG, SEP, OKT, NOV, DEC, les abréviations de texte anglaises JAN, FEB, MAR, APR, MAY, JUN, JUL, AUG, SEP, OCT, NOV, DEC et les abréviations de texte de la langue sélectionnée sont prises en charge. Outre la forme courte de l'horodatage, la forme longue, telle que le 1er janvier 2016, est également prise en charge.

Pour tous les formats qui incluent des secondes, les formats affichent les secondes séparées par des séparateurs décimaux et des chiffres fractionnaires, ou les millisecondes séparées par un deux-points supplémentaire. Dans le champ Fuseau horaire, indiquez le fuseau horaire dans lequel les valeurs de l'heure du calendrier ont été enregistrées.

Sélectionnez l'option Tenir compte de l'heure d'été si les dates sélectionnées pour le fuseau horaire doivent tenir compte d'un éventuel changement d'heure dû à l'heure d'été.

Onglet Paramètres

Dans cet onglet, vous pouvez spécifier en option comment les paramètres stockés dans l'en-tête du fichier texte doivent être lus. Cliquez sur le symbole d'ajout d'entrée du tableau pour créer une entrée. Vous pouvez modifier les paramètres d'entrée en cliquant sur les champs respectifs dans le tableau.

Dans la colonne Type, vous pouvez spécifier comment les paramètres apparaissent dans le fichier. Ligne complète Sélectionnez cette option si seules les valeurs des paramètres sont présentes sans nom et qu'il y a une valeur par ligne. Dans ce cas, vous pouvez spécifier le nom du paramètre dans la ligne Nom/Titre n°, sinon un nom lui est automatiquement attribué. Sélectionnez Colonnes multiples, séparées par des séparateurs de colonne, si les valeurs des paramètres sont organisées sous forme de tableau. Si une colonne de titre est présente avec les noms des paramètres, entrez le numéro dans le champ Nom/N° de ligne de titre. Sinon, un nom est automatiquement attribué au paramètre. Sélectionnez la paire nom-valeur si un paramètre avec le nom et la valeur est présent pour chaque ligne. Dans le champ Séparateur de la paire nom-valeur, indiquez comment le nom et la valeur ont été séparés. Sélectionnez le type Paires nom-valeur, séparées par un séparateur de colonne si plusieurs paramètres avec un nom et une valeur sont présents pour chaque ligne. Même dans ce cas, vous devez spécifier le séparateur de la paire nom-valeur.

Dans la colonne Data Set No., indiquez à quels ensembles de données les paramètres de lecture doivent être affectés. Sélectionnez Via position de colonne si les paramètres sont présents dans exactement le même nombre de colonnes que les données et doivent être affectés par colonne.

Utilisez les champs Line No. From et To pour spécifier la plage du fichier texte à partir de laquelle les paramètres doivent être lus. Si les paramètres sont disposés dans un tableau, la ligne de titre n'est pas incluse dans ce cas.

Dans la colonne Type de données, vous pouvez éventuellement spécifier le type de données dans lequel le paramètre doit être importé et sauvegardé. Si vous sélectionnez (Automatique), FlexPro tente d'abord d'interpréter la valeur importée comme une valeur à virgule flottante. Si cela échoue, le paramètre est importé comme une chaîne de caractères.

Onglet "Paramètres supplémentaires

Si une ligne commence par un délimiteur, celui-ci est ignoré si vous sélectionnez l'option Ignorer les délimiteurs en début de ligne. Les délimiteurs et le texte supplémentaire en fin de ligne sont ignorés lorsque vous sélectionnez l'option Ignorer les colonnes invalides en fin de ligne. Sinon, une colonne supplémentaire contenant des valeurs invalides sera importée.

Si vous sélectionnez l'option Supprimer automatiquement les guillemets, les chaînes de caractères et les données numériques entre guillemets seront importées sans les guillemets. Dans ce cas, une chaîne peut également contenir des délimiteurs. Si une chaîne de caractères est présente entre guillemets, les guillemets devront être doublés dans la chaîne de caractères. Lors de l'importation, les guillemets en double seront supprimés. Exemples : "Un test" est lu comme Un test. "Unité ""Nm""" est lu comme Unité "Nm".

Vous devez sélectionner l'option Autoriser la fusion des noms si, par exemple, la date et l'heure sont importées sous forme de colonne, mais qu'il existe deux entrées distinctes "Date" et "Heure" dans la ligne de titre.

L'option Stocker des valeurs numériques équidistantes en économisant l'espace spécifie que les valeurs numériques linéairement croissantes ou décroissantes sont stockées de manière paramétrique sous la forme (nombre de valeurs, valeur de départ, incrément). C'est souvent le cas avec les données X, par exemple. Vous devez désactiver cette option si les données de mesure présentes ne s'écartent que légèrement de la linéarité, car FlexPro pourrait les interpréter à tort comme étant linéaires.

Le paramètre Nombre maximal de caractères par ligne spécifie le nombre maximal de caractères à importer par ligne.

Vous pouvez utiliser la case Facteur de réduction des données pour réduire les données lors de l'importation. La valeur 2 signifie, par exemple, que seule une ligne sur deux sera importée.

Utilisez les listes déroulantes Floating point type et Integer type pour déterminer la résolution dans laquelle FlexPro enregistre les valeurs en virgule flottante ou les entiers convertis.

Dans certains formats de fichiers, les millisecondes des colonnes de temps calendaire ne sont pas disponibles sous forme de chiffres fractionnaires de secondes, mais dans des colonnes séparées. Par exemple : 1.1.2017 12:00:00; 100 or 1.1.2017 12:00:00; 0.1. Dans la case Spécifier les millisecondes dans, indiquez si les millisecondes sont spécifiées dans l'unité millisecondes ou secondes. Par exemple, si vous sélectionnez Secondes, la valeur 0,1 est lue comme 100 ms. Si vous sélectionnez Millisecondes, la valeur 100 est lue comme 100 ms.

Lors de l'importation de données numériques, toutes les chaînes de caractères qui ne peuvent pas être interprétées comme une valeur à virgule flottante sont importées comme des valeurs invalides. Il en résulte que toutes les chaînes typiquement utilisées pour les valeurs invalides, telles que ? ou #NV, sont interprétées comme des valeurs invalides. Certains formats de données définissent toutefois une ou plusieurs valeurs à virgule flottante comme étant invalides. Si c'est le cas, vous devez saisir les valeurs pertinentes dans le champ Valeurs à virgule flottante invalides en les séparant par des points-virgules. La comparaison se fait numériquement, c'est-à-dire qu'il n'y a pas de différence si vous entrez, par exemple, 1E-3 ou 0,001.

Utilisez la zone de liste Cellules vides/invalides pour spécifier comment les cellules vides ou les cellules avec des valeurs invalides doivent être traitées. Si vous sélectionnez Supprimer les valeurs invalides ne seront pas importées. Dans ce cas, vous pouvez réduire le nombre de valeurs dans un ensemble de données.

Note :Si le nombre de valeurs dans un ensemble de données et dans un ensemble de données X assigné n'est pas égal, l'ensemble de données ne peut pas être importé en tant que signal ou série de signaux.

Certains formats de fichiers texte répètent les informations d'en-tête après un certain nombre de lignes de données. Vous pouvez utiliser Expression pour identifier les lignes invalides afin de filtrer ces lignes des informations d'en-tête. Pour ce faire, saisissez un motif qui doit correspondre à la ligne à filtrer. Le caractère "*" représente toute chaîne de caractères et peut également être vide. " ?" représente tout caractère. Dans le champ de saisie situé à droite, saisissez le nombre de lignes à sauter, y compris celles qui correspondent au modèle.

FlexPro reconnaît principalement le format de fichier par l'extension du nom de fichier. Toutefois, cette affectation n'est pas toujours évidente, notamment dans le cas de données textuelles. Par exemple, les extensions de fichier .txt ou .dat sont utilisées pour une grande variété de formats. Si vous enregistrez plusieurs schémas d'importation pour la même extension de fichier, une liste déroulante apparaît pour chaque importation de données, dans laquelle vous devez sélectionner le schéma approprié. Vous pouvez éviter cela en ayant une chaîne de caractères dans la première ligne du fichier qui identifie clairement le format des données. Le champ Identificateur de format de fichier est l'endroit où vous saisissez un modèle qui doit correspondre à la ligne contenant les informations sur la version. Inscrivez ce numéro de ligne dans la case située à sa droite. La première ligne du format de données texte FlexPro, par exemple, comprend le fichier de données texte FlexPro version 5.0 à UTC+1.0. Le modèle suivant conviendrait ici : Fichier de données texte FlexPro version 5.0*.

Si un fichier texte ne contient qu'une seule ligne, vous pouvez spécifier dans le champ Lire les valeurs scalaires comme si vous vouliez les importer comme une série de données avec une valeur ou comme une valeur scalaire.

Vous pouvez utiliser la reconnaissance automatique des ensembles de données pour spécifier si FlexPro doit analyser le fichier complet ou seulement un certain nombre de lignes afin de déterminer le format du fichier.

Étape 3 - Liste des ensembles de données

À l'aide des paramètres que vous avez configurés dans l'onglet précédent, l'assistant d'importation de données de texte analyse le fichier et répertorie tous les ensembles de données qu'il contient.

Si vous sélectionnez Détecter les ensembles de données automatiquement, les ensembles de données seront importés dans le format que vous voyez affiché dans le tableau. Si vous enregistrez vos paramètres dans l'onglet suivant en tant que schéma, vous pouvez ensuite l'utiliser pour des fichiers comportant plus ou moins de colonnes que celle que vous venez de sélectionner pour créer le schéma.

Si vous sélectionnez Attribuer les ensembles de données manuellement, le nombre d'ensembles de données importés à l'aide du schéma est prédéfini. D'autre part, ce mode vous permet de spécifier les paramètres de chaque ensemble de données séparément. Utilisez ce mode pour les cas plus complexes, par exemple lors de l'importation de matrices ou de formats de temps calendaires qui s'étendent sur plusieurs colonnes.  Ce mode vous permet également d'importer des formats de données qui contiennent plusieurs ensembles de données X, d'importer des chiffres hexadécimaux et de recalculer les données importées. Les options de réglage sont les suivantes :

Colonne

Description

Actif

Vous sélectionnez ici les ensembles de données qui doivent être importés.

Non.

Le numéro de l'ensemble de données, qui ne peut être modifié.

Nom

Le nom de l'ensemble de données.

Unité

L'unité de l'ensemble de données.

Composante

Vous indiquez ici si l'ensemble de données contient des données Y, X ou Z.

X Non.

Le numéro de l'ensemble de données de l'ensemble de données X correspondant, si le composant Y a été sélectionné.

Z Non.

Le numéro de l'ensemble de données Z correspondant, si le composant Y a été sélectionné.

Colonne de - Colonne à

Vous spécifiez ici quelle zone de colonnes est affectée à l'ensemble de données. Pour les valeurs de calendrier ou d'intervalle de temps, il est possible de spécifier plusieurs colonnes qui sont ensuite automatiquement agrégées en une valeur de calendrier ou d'intervalle de temps.

Exemple : 3 colonnes avec date, heure et millisecondes 1.1.2016;12:00:00;100 sont lues comme 1.1.2016 12:00:00,100.

Dans le cas de types de données numériques, plusieurs colonnes sont importées comme une matrice de données au lieu d'une série de données.

Type de données

Vous spécifiez ici le type de données dans lequel les données apparaissent pour l'ensemble de données.

Commentaires

Les commentaires de l'ensemble des données.

Post-traitement

Il s'agit d'une formule FPScript que vous pouvez utiliser pour recalculer automatiquement les données d'origine lors de l'importation. L'accès aux données originales est assuré par le nom de la variable.

Exemple : Doublez l'amplitude

données * 2

Remarque : Vous pouvez traiter plusieurs lignes de la liste en même temps, par exemple le n° X de plusieurs ensembles de données Y. Pour ce faire, cliquez sur plusieurs lignes tout en maintenant la touche CTRL enfoncée. Cliquez maintenant sur l'une des lignes sélectionnées tout en maintenant la touche CTRL enfoncée. La boîte de saisie apparaît, et ce que vous saisissez ici est copié sur toutes les lignes sélectionnées.

Étape 4 - Résumé

Le champ Résumé vous montre un résumé de votre saisie, que vous devez vérifier attentivement.

Copier les données et les stocker en tant qu'ensembles de données ; Créer un lien de données par ensemble de données ; Créer un lien de données pour l'ensemble du fichier ;

Dans le champ Stockage des données, indiquez si vous souhaitez copier les données ou établir un lien :

Copier les données et les stocker comme des ensembles de données configure les ensembles de données dans la base de données du projet qui contiennent les données importées.

Créer un lien de données par ensemble de données crée un objet de lien de données texte pour chaque ensemble de données sélectionné qui maintient un lien avec le fichier texte.

Créer une liaison de données pour l'ensemble du fichier Cette option permet de créer un objet de liaison de données de type texte, qui renvoie tous les ensembles de données importés sous forme de liste.

Si, dans le champ Structure des données, vous sélectionnez l'option Signal, l'ensemble de données X est utilisé comme composante X dans les ensembles de données Y. Sinon, il est stocké comme un ensemble de données distinct et lié aux ensembles de données Y. Vous devriez choisir cette option si les données X sont linéairement croissantes. Si ce n'est pas le cas, vous devez stocker le jeu de données X, en particulier dans le cas de fichiers comportant plusieurs colonnes Y, afin d'économiser de l'espace de stockage. Cette option est sélectionnée automatiquement si une liaison de données textuelles est créée et que le résultat est une liste. Cela s'applique également si vous avez défini un ensemble de données X personnalisé.

Si dans le champ Heure vous sélectionnez l'option Absolu, les données sont importées en tant que valeurs temporelles absolues avec la date et l'heure ; sinon, elles sont importées en tant que valeurs temporelles relatives.

Dans le champ Sous-dossiers, sélectionnez l'option Par fichier si FlexPro doit stocker les données dans un dossier portant le même nom que le fichier. Si, sous Stockage des données, vous avez sélectionné l'option Créer une liaison de données pour l'ensemble du fichier, un objet de liaison de données texte est créé au lieu d'un dossier. Le résultat est que cet objet de liaison de données renvoie tous les ensembles de données sélectionnés sous forme de liste.

Le champ Plage de données est facultatif et limite la plage de données importée.

Si vous souhaitez enregistrer les paramètres configurés en tant que nouveau schéma d'importation, sélectionnez l'option Enregistrer comme schéma d'importation et saisissez un nom pour le schéma. Désormais, le type de fichier généré est disponible pour une importation rapide en tant que type de fichier dans la boîte de dialogue d'importation. Dans le champ For file extension(s), indiquez les extensions, séparées par des points-virgules, auxquelles vous souhaitez lier le schéma. L'extension du fichier sélectionné est déjà présélectionnée.

La priorité contrôle le comportement de FlexPro dans le cas où plusieurs filtres d'importation sont liés à la même extension de fichier. FlexPro vérifie d'abord tous les filtres d'importation et les schémas d'importation de priorité supérieure. Lorsqu'un filtre d'importation est une correspondance exacte, il est utilisé. Si plus d'un filtre d'importation est trouvé, une boîte de dialogue s'affiche pour vous permettre de choisir le bon. FlexPro ne recherche un filtre de priorité inférieure que si aucun filtre d'importation de priorité supérieure n'est trouvé. L'assistant d'importation de données textuelles est enregistré comme un filtre d'importation de priorité inférieure, ce qui signifie qu'il apparaît toujours dans la zone de liste. Sélectionnez Priorité élevée lorsque vous souhaitez lier le schéma d'importation exclusivement à l'extension de fichier spécifiée ou lorsque vous avez spécifié un modèle d'identification du format de données qui peut être utilisé pour vérifier le format de données du fichier.

Remarque Les paramètres que vous pouvez choisir sur cette page de l'assistant sous Stockage des données et Plage de données ne sont pas enregistrés dans le schéma d'importation. Vous pouvez les définir séparément dans la boîte de dialogue Importation à chaque fois que vous importez des fichiers.

Organisation des schémas d'importation

FlexPro stocke les schémas d'importation dans votre base de données de modèles personnelle, que vous pouvez gérer dans la boîte de dialogue File > Info > Organiser. Vous avez ici la possibilité de copier un schéma d'importation dans une autre base de données afin de fournir des schémas d'importation à tous les utilisateurs, par exemple. Vous pouvez également exporter ou importer un schéma sous forme de fichier XML.

Un schéma d'importation enregistré sous forme de fichier XML peut également être utilisé sur d'autres ordinateurs. Pour ce faire, il vous suffit de copier le fichier dans le dossier suivant : C:\ProgramData\Weisang\FlexPro\2021\Templates\Import\Schema.

Voir aussi

Import de données

Objet de liaison de données

Partager l’article ou envoyer par mail :

Vous serez probablement intéressé par les articles suivants :