DE FR IT

CSV e SIARD

[14-11-2024] I file CSV devono essere convertiti in SIARD?

La pagina è stata tradotta dal tedesco all'italiano con il software DeepL. 

I file CSV sono file di testo strutturati in forma tabellare; i singoli valori, campi o colonne sono separati da uno speciale separatore, le righe sono generate da interruzioni di riga. Si tratta di un formato molto semplice per i dati strutturati.

Il CSV è uno dei più vecchi formati di scambio di database ed è quindi relativamente comune negli archivi. Tuttavia, il CSV presenta alcuni aspetti problematici:

  • Il set di caratteri non è specificato nel formato; in origine era ASCII, ma oggi può essere anche ANSI o UTF-8.
  • La scelta del delimitatore è libera, anche se sono comuni le virgole, le tabulazioni e i punti e virgola.
  • La chiusura dei campi tra virgolette o virgolette è facoltativa.
  • Il numero di campi per riga non deve essere necessariamente lo stesso in una tabella CSV.
  • Non esistono informazioni di fissità (checksum, ecc.) che permettano di riconoscere una modifica in un file CSV.

I file CSV devono essere convertiti in SIARD?

L'archiviazione di dati strutturati in CSV non è più consigliata. In primo luogo, a causa dei problemi già menzionati. In secondo luogo, a causa degli svantaggi del CSV rispetto a XML e JSON quando si tratta di mappare o descrivere strutture di dati complesse.

Se i dati in file di testo (semi)strutturati provengono da database, KOST raccomanda di convertire questi file in SIARD.

La conversione è necessaria anche se un database o uno schema di database deve essere archiviato in SIARD, ma non è possibile leggere il contenuto del database con uno strumento corrispondente per motivi tecnici o organizzativi. In questo caso, il formato di scambio dei dati tra il database e lo strumento SIARD è solitamente CSV o sempre più spesso JSON.

Una panoramica degli strumenti che supportano SIARD è disponibile su Lettura e scrittura di SIARD.