Reconnaître les formats de fichiers de données au format texte

Reconnaître les formats CSV, XML et JSON

Voici la même table codée sous trois formats de type texte différents.

CSV

XML

JSON

Nom, Prénom, Profession, Décès

Hugo, Victor, Écrivain, 1885

Camus, Albert, Écrivain, 1960

<Auteurs>

<Auteur>

<Nom>Hugo</Nom>

<Prénom>Victor</Prénom>

<Décès>1885</Décès>

</Auteur>

<Auteur>

<Nom>Camus</Nom>

<Prénom>Albert</Prénom>

<Décès>1960</Décès>

</Auteur>

</Auteurs>

[

{

"Nom" :"Hugo",

"Prénom" :"Victor",

"Décès" :1885

},

{

"Nom" :"Camus",

"Prénom" :"Albert",

"Décès" :1960

}

]

  • CSV [html, fr] : les données sont séparées par une virgule pour cet exemple. La première ligne du format CSV contient la liste des descripteurs de la table, séparés eux aussi par une virgule. Chaque ligne correspond aux données d'un individu de la collection. Les séparateurs n'étant pas standardisés, ils peuvent être dans d'autres cas un point-virgule ou une tabulation par exemple on parle alors de format TSV (Tabulation-separated values)

  • XML [html, fr] (Extensible Markup Language langage de balisage extensible) : c'est un langage "à balises". Chaque enregistrement est ici écrit sous la forme <descripteur>donnée</descripteur> , une donnée pouvant être elle-même une table (données hiérarchisées).

  • JSON [html, fr] (JavaScript Object Notation) : cet exemple montre que JSON est similaire au XML. Les enregistrements, séparés par des virgules, sont écrits de la forme descripteur : donnée. Chaque un individu de la collection est délimité par des accolades { ... }.

Fondamental

Les extensions de fichier peuvent servir à reconnaître le type de fichier.

Exemple

Un fichier de nom "mes_amis.csv" est un fichier CSV.