Reconnaître les formats de fichiers de données au format texte
Reconnaître les formats CSV, XML et JSON
Voici la même table codée sous trois formats de type texte différents.
CSV | XML | JSON |
---|---|---|
Nom, Prénom, Profession, Décès Hugo, Victor, Écrivain, 1885 Camus, Albert, Écrivain, 1960 | <Auteurs> <Auteur> <Nom>Hugo</Nom> <Prénom>Victor</Prénom> <Décès>1885</Décès> </Auteur> <Auteur> <Nom>Camus</Nom> <Prénom>Albert</Prénom> <Décès>1960</Décès> </Auteur> </Auteurs> | [ { "Nom" :"Hugo", "Prénom" :"Victor", "Décès" :1885 }, { "Nom" :"Camus", "Prénom" :"Albert", "Décès" :1960 } ] |
CSV [html, fr] : les données sont séparées par une virgule pour cet exemple. La première ligne du format CSV contient la liste des descripteurs de la table, séparés eux aussi par une virgule. Chaque ligne correspond aux données d'un individu de la collection. Les séparateurs n'étant pas standardisés, ils peuvent être dans d'autres cas un point-virgule ou une tabulation par exemple on parle alors de format TSV (Tabulation-separated values)
XML [html, fr] (Extensible Markup Language langage de balisage extensible) : c'est un langage "à balises". Chaque enregistrement est ici écrit sous la forme <descripteur>donnée</descripteur> , une donnée pouvant être elle-même une table (données hiérarchisées).
JSON [html, fr] (JavaScript Object Notation) : cet exemple montre que JSON est similaire au XML. Les enregistrements, séparés par des virgules, sont écrits de la forme descripteur : donnée. Chaque un individu de la collection est délimité par des accolades { ... }.
Fondamental :
Les extensions de fichier peuvent servir à reconnaître le type de fichier.
Exemple :
Un fichier de nom "mes_amis.csv" est un fichier CSV.