| |
Allgemeines
Grundlagen
Gemäß eines Beschlusses des IT-Planungsrates und der Innenministerkonferenz „Lateinische
Zeichen in Unicode, Version 1.1 vom 27.1.2012“ (auch „String.Latin 1.1“
genannt) müssen Softwaresysteme, die dem Länder übergreifenden Austausch von
Personen- und Adressdaten dienen eine definierten Zeichenvorrat handhaben
können.
Als Weiterentwicklung dazu wurde März 2019 die DIN SPEC 91379:2019-03
verabschiedet zur Definition von "Unicode für die elektronische Verarbeitung
von Namen und den Datenaustausch in Europa"
Schriftzeichengruppe
In der DIN SPEC 91379 werden Schriftzeichengruppe als Zusammenfassung von
Schriftzeichen unter fachlichen Aspekten festgelegt.
| Normative Schriftzeichen
| Tabelle 3: Normative lateinische Buchstaben (netto, ohne Kombination
mit diakritische Zeichen) |
| Tabelle 5 (N1): Normative Nicht-Buchstaben, erforderlich für alle
Namen |
| Tabelle 6 (N2): Sonstige normative Nicht-Buchstaben, erforderlich
für nicht alle Namen |
| Tabelle 7 (N3): Normative Nicht-Buchstaben, erforderlich für Namen
juristischer Personen |
| Tabelle 8 (N4): Normative Nicht-Buchstaben, für Namen ungeeignet |
|
| Erweiterte Schriftzeichen (nicht-normativ)
| A.1 Griechische Buchstaben |
| A.2 Kyrillische Buchstaben |
| A.3 Sonstige erweiterte Nicht-Buchstaben, erforderlich für nicht
alle Namen |
|
Datentypen und zugehörige Schriftzeichengruppe
Gemäß DIN SPEC gilt es folgende 5 Datentypen zu unterscheiden
Datentyp A: Namen natürlicher Personen
| Der Datentyp A gibt wieder, welche Schriftzeichen in hoheitlichen
Dokumenten für Namen natürlicher Personen verwendet werden. |
| Datentyp A ist definiert durch
| die abschließenden Listen aller lateinischen Buchstaben nach Tabelle
3 |
| und der für alle Namen erforderlichen Nicht-Buchstaben nach Tabelle
5. |
| Andere Schriftzeichen werden durch diesen Datentyp zurückgewiesen. |
|
Datentyp B: sonstige Namen
| Der Datentyp B wurde vor allem für sonstige Namen, wie z. B. Ortsnamen
und Straßennamen mit Hausnummer, entworfen. |
| Datentyp B ist definiert durch
| die abschließenden Listen aller lateinischen Buchstaben nach Tabelle
3, |
| der für alle Namen erforderlichen Nicht-Buchstaben nach Tabelle 5
|
| und der sonstigen normativen Nicht-Buchstaben nach Tabelle 6. |
| Andere Schriftzeichen werden durch diesen Datentyp zurückgewiesen.
|
|
Datentyp C: Alle nach DIN SPEC 91379 normativen Schriftzeichen
| Der Datentyp C wurde für alle normativen Schriftzeichen der DIN SPEC
entworfen.
| Er ist somit die technische Umsetzung der Schnittstellenvereinbarung
„Alle nach DIN SPEC 91379 normativen Schriftzeichen“. |
| Texte mit griechischen oder kyrillischen Buchstaben oder mit
erweiterten (nicht-normativen) Nicht-Buchstaben sind unzulässig. |
|
| Datentyp C ist definiert durch
| die abschließenden Listen aller lateinischen Buchstaben nach Tabelle
3, der für alle Namen erforderlichen |
| Nicht-Buchstaben nach Tabelle 5, |
| der sonstigen normativen Nicht-Buchstaben nach Tabelle 6, |
| der normativen Nicht-Buchstaben, erforderlich für Namen juristischer
Personen nach Tabelle 7 |
| und der normativen für Namen ungeeigneten Nicht-Buchstaben nach
Tabelle 8. |
| Andere Schriftzeichen werden durch diesen Datentyp zurückgewiesen. |
|
Datentyp D: Namen juristischer Personen und für Produktnamen
| Der Datentyp D wurde vor allem für Namen juristischer Personen und für
Produktnamen entworfen. |
| Datentyp D ist definiert
| durch die abschließenden Listen aller lateinischen Buchstaben nach
Tabellen 3 |
| und griechischen Buchstaben nach Tabellen A.1, |
| der für alle Namen erforderlichen Nicht-Buchstaben nach Tabelle 5
|
| sowie der für Namen (im weiteren Sinne) geeigneten normativen und
erweiterten Nicht-Buchstaben nach den Tabellen 6, 7 und A.3. |
| Andere Schriftzeichen werden durch diesen Datentyp zurückgewiesen. |
|
Datentyp E: Alle nach DIN SPEC 91379 normativen und nicht-normativen
Schriftzeichen
| Der Datentyp E wurde für alle normativen und erweiterten Schriftzeichen
der DIN SPEC entworfen.
| Ein Einsatzgebiet dieses Datentyps kann der grenzüberschreitende
Datenaustausch sein, wenn auch griechische und kyrillische Buchstaben
benötigt werden. |
| Er ist somit die technische Umsetzung der Schnittstellenvereinbarung
„Alle nach DIN SPEC 91379 normativen und nicht-normativen
Schriftzeichen“. |
| Texte mit Buchstaben oder Nicht-Buchstaben, die in der DIN SPEC
nicht enthalten sind, wie z. B. asiatische oder arabische Buchstaben,
sind unzulässig. |
|
| Datentyp E ist definiert durch
| die abschließenden Listen aller lateinischen, griechischen und
kyrillischen Buchstaben nach den Tabellen 3, A.1 und A.2 |
| sowie aller normativen und erweiterten Nicht-Buchstaben nach den
Tabellen 5, 6, 7, 8 und A.3. |
| Andere Schriftzeichen werden durch diesen Datentyp zurückgewiesen. |
|
Übersicht Datentypen
Datentypen und Verwendung
Lateinische Zeichen in Unicode in HIT
| Seit Mitte 2020 ist in HIT/ZID die Übertragung von Lateinische Zeichen
in Unicode gemäß "Datentyp E: Alle nach DIN SPEC 91379 normativen und
nicht-normativen Schriftzeichen" realisiert. |
| Welche Untermenge davon im jeweiligen fachlichen Kontext sinnvoll und
erlaubt ist muss innerhalb der fachlichen Vorgaben für die Teilverfahren
festgelegt werden und ist nicht Bestandteil der technischen Umsetzung. |
HIT-Protokoll
| Eine Änderung im HIT-Protokoll selbst ist nicht notwendig. |
| Es genügt wenn der Client das HIT-Protokoll
| in Unicode UTF-8 kodiert auf dem Socket verwendet |
| bzw. vor und nach der Verschlüsselung entsprechend kodiert und
dekodiert, nähere Hinweise hier bei
HIT-Verschlüsselung ... |
| dem Server im ersten Befehl - dem LOGON dies mittels Parameter
mitteilt |
| Ein Wechsel des Zeichensatzes bzw. der Zeichensatzkodierung
innerhalb einer aufgebauten Verbindung ist nicht möglich. |
|
HIT-Batch
| Der HitBach-Client kann seit 2020 entsprechend in Unicode UTF-8 mit dem
Server kommunizieren. |
| Dazu sind lediglich in der HitBatch.INI im Kapitel [Global] Parameter
folgendermaßen zu setzen
| StreamEncodingIn=UTF-8 |
| StreamEncodingOut=UTF-8 |
| UTF8=1 (beachte: hier ohne
Strich) |
|
| Um den vollen Zeichenumfang nutzen zu können müssen die
Input/Outputdateien entsprechend kodiert sein. Gesteuert wird das mit den
Parametern InFileCharset bzw.
OutFileCharset |
| Weitere Details siehe HitBatch INI-Parameter
|
HIT/ZID Oberflächen
Neue Weboberflächen / Meldeprogramme
| HIT V.3 - neues HIT Meldeprogramm |
| ZID V.2 - neues ZID Meldeprogramm |
In den neuen Programmen werden die HTML-Seiten/Formulare UTF-8 kodiert
ausgegeben und eingelesen, Damit werden alle relevanten Unicode Zeichen richtig
dargestellt und entgegengenommen.
Bei den Suchfunktionen werden zur Zeit keine der von der DIN SPEC
vorgeschlagenen "Gleichsetzungen" vorgenommen. Sonderzeichen werden nur exakt so
gesucht wie sie im Suchkriterium angegeben sind.
Alte Weboberflächen / Meldeprogramme
| HIT V.1 - klassisches HIT Meldeprogramm |
| HIT V.2 - REST Version 1 besitzt nur eine Testoberfläche |
| ZID V.1 - altes ZID Meldeprogramm, dient nur noch zur Anzeige
historischer Daten und wird von Endkunden nicht mehr benutzt. |
In den alten Programm wird keine Anpassung vorgenommen. Eingaben und Ausgaben
sind nach wie vor nur in ISO / ANSI möglich. Geringfügige Darstellungsprobleme
von nicht westeuropäischen Zeichen oder Sonderzeichen müssen akzeptiert werden,
haben aber auf die Funktionsfähigkeit keine Auswirkung. |