| |
Klarstellungen zum CSV-Format
Allgemein
Das CSV-Format ist zwar sehr weit verbreitet, wird aber leider manchmal etwas
unterschiedlich ausgelegt. Daher sollen folgende Darlegungen zu einer Klärung dienen.
Einzelne Punkte können ggf. in den Fachgruppen noch diskutiert und geändert werden.
| Bei der Kodierung von Daten im HIT-Protokoll ist nach der strikte HIT-CSV Festlegung
vorzugehen |
| Für CSV-Input und -Outputdateien, insbesondere für Datei-Verarbeitung mittels
HIT-Batch-Client kann wahlweise eine etwas andere, leichter lesbare Form gewählt
werden: Readable CSV |
| Zur Vereinfachung der Datenstrukturen auf der Clientseite ist es möglich, einzelne
Spalten in in einzelnen Zeilen eine CSV-Datei so zu kennzeichnen als ob diese Spalten in
diesem Datensatz gar nicht vorhanden wäre, siehe unten , sowie KA
(Keine Angabe) vs. NULL/Leerstring |
Pflichtpunkte
| Als Separator ist nur Semikolon erlaubt. |
| Nach der letzten Datenspalte kommt kein Separator. |
| Die erste Zeile enthält die Spaltennamen. |
| Als Charakterset wird z.Zt. ISO 8859-1 verwendet. |
| Als Dezimaltrenner ist nur der Punkt erlaubt. |
| Datums und Zeitangaben sind in lesbarem deutschen Format, notwendige Ergänzugen werden
automatisch vorgenommen
| Datum: T.M.J , mit T=1 oder 01...31, M=1
oder 01...12, J=1 oder 01...99 bzw, 1900...2100 |
| Zeit: H.N[.S] , mit H=0 oder 00...23,
N=0 oder 00...59, S=0 oder 0=...99 |
| Timestamp: T.M.J/H.N[.S[.X]] , mit X=0
oder 000000...999999. Bei X handelt es sich um Mikrosekunden (10 hoch -6) und nicht um
Sekundenbruchteile, d.h. 11:59:00.1 ist nicht 11:59:00.100000 sondern 11:59:00.000001 ! |
|
| Strings dürfen nicht in Hochkommas eingeschlossen werden. |
| Sonderzeichen werden hexadezimal kodiert, siehe Quoted-Hex,
insbesondere:
| wenn Verwechslungsmöglichkeit mit Protokoll-Separatoren besteht, also Doppelpunkt,
Semikolon u.ä. |
| oder der Protkollfluß beeinträchtigt wird, also alle Formen von Carriage Return,
Newline, Form Feed, u.ä |
|
| Ein Datenwert ohne Inhalt, d.h. NULL wird als Quoted Hex %--
dargestellt |
| Ein Leerstring, also etwas i.d.F ;; ist ein Textstring
der Länge 0 und damit kein gültiger Wert für Zahlen |
| Eine Spalte die überhaupt nicht berücksichtigt werden soll, dh. KA (keine
Angabe) wird als Quoted Hex %KA dargestellt |
| Strings werden immer in doppelte Hochkommas eingeschlossen und können damit
Sonderzeichen enthalten. |
| Die NULL wird als fehlendes Element in der Form ;;
angegeben. |
| Ein Leerstring wird in der Form "" angegeben. |
| KA (keine Angabe) wird als Quoted Hex %KA ohne
Hochkomma dargestellt |
|