Nichtdeutsche Buchstaben in elektronischen Dokumenten
Proletarier aller Länder, vereinigt Euch!
Workers of all nations, unite!
Prolétaires de tous les pays, unissez-vous!
¡Proletarios de todos los países, uníos!
Proletari di tutti i paesi, unitevi!
Proletariusze wszystkich krajów, łączcie się!
Proletáři v¨ech zemí, spojte se! Proletári v¨etkých krajín, spojte sa!
Világ proletárjai, egyesüljetek!
Proletari din toate ţările, uniţi-vă!
Proletarci vseh de¸el, zdru¸ite se!
Proleteri svih zemalja, ujedinite se!
Пролетери свих земаља, уједините се!
Пролетери во сите земји, воединетесе!
Пролетарии от всички страни, съединявайте се!
Proletarë të të gjitha vendeve, bashkohuni!
Προλετάριοι όλων των χωρών, ενωθείτε !
Bütün ülkelerin proleterleri, birleşin!
Пролетарии всех стран, соединяйтесь!
Die technische Voraussetzungen für das Erstellen mehrsprachiger (mehrschriftlicher) Dokumente sind vorhanden. Es hängt aber von unserem Willen und Wissen ab, ob wir diese bei Bedarf auch nutzen. Ich glaube, dass dieses Thema in Österreich – wegen der Vielfalt der privaten, geschäftlichen und politischen Beziehungen mit unseren Nachbarn, die nichtdeutsche Schriftzeichen in Ihren Sprachen, bzw. Schriften verwenden – von Bedeutung ist.
Hinweis: Falls Sie sich nur für die technischen Einzelheiten interessieren, blättern Sie bitte weiter zum Untertitel "WIE TUT MAN DAS?".
Was sind die Buchstaben mit diakritischen Zeichen? In der deutschen Sprache sind es die Umlaute äöü, also die Buchstaben, die sich durch die zusätzliche Zeichen von ähnlich aussehenden Basisbuchstaben unterscheiden (diakritisch, aus dem griechischen διακρητικός, unterscheidend). Die Aussprache dieser Buchstaben weicht deutlich von der Aussprache deren Basisbuchstaben ab – es handelt sich also um keine Akzente, die nur eine andere Betonung hätten, sondern um eindeutige Buchstaben. So ist es in anderen Sprachen auch, z.B. die südslawischen Sprachen kennen auch folgende Buchstaben: ćčđ¨¸. Mehr zu diesem Thema bei der Wikipedia Seite über diakritischen Zeichen (auch auf English) und Wikipedia Háček Seite (auch auf English).
Sind diakritische Zeichen wichtig? Na ja... falls Sie z.B. Jörg Möller heißen, wird Ihnen wahrscheinlich lieber, wenn Ihr Korrespondenz-Partner Ihr Namen auch so schreibt und nicht etwa Jorg Moller oder Joerg Moeller. Dabei geht wenig Inhalt verloren und man kann die Wörter auch so lesen und verstehen (obwohl die Aussprache eine ganz andere ist). Wenn sich aber Ihr Korrespondenz-Partner bemüht, die Wörter genau so zu schreiben "wie es sich gehört", dann werden Sie genau das merken - nämlich das Bemühen, das Entgegenkommen. Genau so wird wahrscheinlich Ihr Korrespondenz-Partner auch Sie, Ihre Bemühungen und Ihr Können merken, falls Sie sein Namen z.B. als ´upančič und nicht als Zupancic schreiben.
Diakritische Zeichen und Ihr Rechner? Es ließe sich darüber diskutieren, warum die Firma Microsoft ab dem MS Windows NT das ganze Betriebssystem von Grund auf so aufgebaut hat, dass die Schriftzeichen aus fast allen Schriften der Welt gleichzeitig unterstützt werden. Mir kommt die Sorge um die weltweite Kulturvielfalt, als eine mögliche Begründung, ziemlich lächerlich vor. Nein, es wird eher die Maximierung des Profites durch das frühe absichern einer Monopol-Position auf dem globalen Markt der wahre Grund sein. Wie dem auch sei, die MS Betriebssysteme (z.B. MS Windows 2000 oder XP), zusammen mit vielen anderen Programmen, unterstützen die Erstellung mehrsprachiger bzw. mehrschriftlicher Dokumente sehr gut. Solche Dokumente können später (auch nach einer e-Mail-Übertragung um die Welt) mit verschiedensten Softwareprodukten noch immer korrekt betrachtet und bearbeitet werden. Es ist allerdings aber auch so, dass die Computerbenutzer meistens wenig Überblick über die Möglichkeiten haben, die ihnen zur Verfügung stehen. Bevor wir genau diese Möglichkeiten unter die Lupe nehmen, will ich ein paar Hinweise über die internationalen Standards geben, welche die Grundlage für all das bilden.
DIE STANDARDS
Jeder Standard, der in diesem Zusammenhang von Bedeutung ist, ordnet den Schriftzeichen (d.h. den Buchstaben, aber auch z.B. den chinesischen Schriftzeichen usw.) eindeutige Nummern zu. Man kann sich das so vorstellen, wie ob jedem Schriftzeichen ein eindeutiger Name zugeordnet wäre (wobei dieser Name eben eine Nummer ist). Nun, von der Spanne der möglichen Nummern hängt es ab, wie viele Zuordnungen durch so ein Standard definiert werden können.
ASCII. Ab den 60-er Jahren gibt es den ASCII Standard (American Standard Code for Information Interchange). Dieser ist Ihnen eventuell ein Begriff. Es ist dabei von Bedeutung, dass bei diesem Standard nur 128 unterschiedliche Nummern zur Verfügung stehen. Dadurch konnte man kaum mehr als das englische Alphabet benutzen. In den 60-ern kümmerten sich in der Tat nur wenige in der EDV-Branche um andere Sprachen. Mehr darüber auf der Wikipedia ASCII-Seite.
ISO-8859. Diese Zustände haben zwischen 70-en und 90-en Jahren einen Boom an neuen Standards verursacht, dessen Idee war, die Gruppen von je 256 Zuordnungen zu definieren. Jede solche Gruppe definierte dann die Nummern für eine Auswahl der Schriftzeichen, die in Sprachen einer bestimmten Region verwendet werden (z.B. Zentraleuropa, Südeuropa, Kyrillisch, Griechisch, Arabisch, Hebräisch, usw.). Die Logik dahinter: wenn man ein Dokument erstellen will, entscheidet man sich im allgemeinem für eine dieser Gruppen, wodurch man dann nur die Schriftzeichen aus dieser Gruppe zur Verfügung hat. Es können also nie mehr als 256 unterschiedliche Schriftzeichen in einem Dokument verwendet werden. Obwohl das ein großes Manko war, muss man fairerweise einsehen, dass durch dieses und ähnliche Konzepte (mit mehr als 256 möglichen Zuordnungen, z.B. für japanische und chinesische Schriften) sehr viele Sprach- und Kulturregionen eine annehmbare Unterstützung bekommen haben. Die meist bekannten dieser Standards (die noch immer verwendet werden) kennt man unter dem allgemeinen Namen ISO-8859. Mehr zu diesem Thema bei der Wikipedia Seite über die ASCII-Erweiterungen, Wikipedia Seite über s.g. code pages und Wikipedia Seite über ISO 8859-n.
Unicode. Ab den 90-en Jahren wird ein ganz anderer Standard entwickelt, mit dem Ziel, dass jedes Schriftzeichen, aus jeder Sprache der Welt eine eigene Nummer bekommt. Dadurch wurde die Grundlage festgelegt, um in einem Dokument die Schriftzeichen vieler Sprachen gleichzeitig verwenden zu können. Dieser Standard heißt Unicode. Theoretisch kann er über eine Million Zuordnungen definieren, wovon bis zum März 2005 (Unicode Version 4.1) die 97720 davon tatsächlich definiert worden sind. Der Unicode Standard ist schon jetzt – in 2005 – so bedeutend, wie es einst der ASCII war und er wird mit der Zeit an Bedeutung noch gewinnen. Mehr darüber auf der Wikipedia Unicode Seite (auch auf English) und beim Unicode Consortium. Hier noch der direkte Zugang zu den Unicode Schriftzeichen-Tabellen.
WIE TUT MAN DAS?
Für den PC-Benutzer stellt sich die Frage, wie diese "merkwürdigen" Buchstaben mittels einer deutschen Tastatur einzugeben sind? Aus der Benutzersicht kann man zwei Situationen erkennen, nämlich ob man gelegentlich nur ein paar nichtdeutsche Schriftzeichen eingeben muss, oder ob man längere nichtdeutsche Texte mit vielen Sonderzeichen schreiben muss. In der zweiten Situation lohnt sich eine einmalige Installation eines s.g. Eingabegebietsschemas.
Gelegentliche Eingabe der nichtdeutschen Schriftzeichen
Unter MS Windows 2000 oder XP. Sie schreiben also Ihr Text (mit beliebiger Anwendung) und befinden sich gerade an der Stelle, wo Sie ein Schriftzeichen eingeben müssen, das auf Ihrer Tastatur nicht zu finden ist. Dann bedient man sich eines Schriftzeicheneingabeprogramms, das folgendermaßen zu finden ist: Start / Programme / Zubehör / Systemprogramme / Zeichentabelle. Hacken Sie dort zuerst bitte das Kästchen Erweiterte Ansicht an. Ich schlage vor, dass Sie in diesem Programm bei der Schriftart die "Arial Unicode MS" (oder, falls nicht vorhanden, dann "Lucida Sans Unicode"), beim Zeichensatz "Unicode" und beim Gruppieren nach "Unicode-Unterbereich" auswählen. In einem zusätzlichen Fensterchen werden Sie dann zwischen den Untergruppen auswählen können (wobei es durchaus sein kann, dass Sie schon in der ersten Untergruppe ("Latin") die Schriftzeichen finden, die Sie brauchen). Anschließend klicken Sie einfach doppelt auf ein oder mehrere Schriftzeichen, die Sie in Ihr Dokument übernehmen wollen. Mit "Kopieren" bringen Sie die ausgewählten Schriftzeichen in den Zwischenspeicher, aus welchem Sie diese letztendlich auf die übliche Art in Ihr Dokument einfügen können.
Achtung MS Word-Benutzer: Die beschriebene Zeichentabelle ist im MS Word integriert und dadurch viel einfacher zu erreichen: gehen Sie im MS Word einfach zum Einfügen / Symbol.
Nehmen wir an, dass Sie auf dieser Weise einige Schriftzeichen in Ihr Dokument eingefügt haben. Sie stellen aber fest, dass manche davon nicht sichtbar sind (bzw. als kleine leere Kästchen oder Fragezeichen zu sehen sind – genau so wie es am Anfang dieser Seite wahrscheinlich teilweise der Fall ist!). Sehr wahrscheinlich kann die Schriftart (engl. Font), die Sie oder Ihre Anwendung verwendet, um Ihr Dokument darzustellen, diese Schriftzeichen nicht darstellen. (Für die fernöstlichen Schriften muss man sowieso noch die entsprechende Unterstützung im Betriebssystem einmalig aktivieren.) Nämlich, die meisten von Schriftarten können leider nur eine begrenzte Auswahl aus den fast 100000 möglichen Schriftzeichen wirklich darstellen. Falls es Ihre Anwendung erlaubt, probieren Sie es mit Schriftarten "Arial Unicode MS", "Lucida Sans Unicode", "Times New Roman" oder Code2000 – diese können relativ viele Schriftzeichen darstellen.
Schreiben längerer nichtdeutschen Texte
Unter MS Windows 2000. In so einem Fall benötigen Sie ein neues s.g. Eingabegebietsschema, dessen Installation so durchzuführen ist: Start / Einstellungen / Systemsteuerung / Ländereinstellungen / Eingabe. Hier werden Sie drei Bereiche sehen, von welchen hier der Bereich Installierte Eingabegebietsschemas von Bedeutung ist. Klicken Sie dort auf Hinzufügen und wählen Sie von Ihnen gewünschtes Eingabegebietsschema aus (z.B. Kroatisch, oder Slowakisch, oder Tschechisch, usw.). Der Eintrag Tastaturlayout/IME wird sich automatisch ändern und es ist gut so. Bestätigen Sie mit OK. Am unteren Rand des Fensters haken Sie unbedingt die Option Sprachanzeige aktivieren (Taskliste) an. Verlassen Sie das Eingabefenster mit OK.
Unter MS Windows XP. In so einem Fall benötigen Sie ein neues s.g. Eingabegebietsschema, dessen Installation so durchzuführen ist: Start / Einstellungen / Systemsteuerung / Regions- und Sprachoptionen / Sprachen. Hier werden Sie zwei Bereiche sehen, von welchen hier der Bereich Textdienste und Eingabesprachen von Bedeutung ist. Klicken Sie dort auf Details. Hier werden Sie drei Bereiche sehen, von welchen hier der Bereich Installierte Dienste von Bedeutung ist. Klicken Sie dort auf Hinzufügen und wählen Sie von Ihnen gewünschtes Eingabegebietsschema aus (z.B. Kroatisch, oder Slowakisch, oder Tschechisch, usw.). Der Eintrag Tastaturlayout/IME wird sich automatisch ändern und es ist gut so. Bestätigen Sie mit OK. Klicken Sie jetzt im Bereich Einstellungen auf Eingabegebiestschema-Leiste... Haken Sie hier sowohl die Einstellung Eingabegebiestschema-Leiste auf dem Desktop anzeigen, wie auch die Zusätzliche Symbole oberhalb der Taskleiste anzeigen an. Bestätigen Sie mit OK. Bestätigen Sie nochmals mit OK. Verlassen Sie Regions- und Sprachoptionen mit OK.
Anschliessend (sowohl beim MS Windows 2000 und XP)... Nun, Sie werden rechts in der Taskleiste einen Kästchen mit Buchstaben DE merken. Durch das Anklicken können Sie jetzt das Eingabegebietsschema wechseln. Allerdings wird diese Einstellung vom Betriebssystem dem jeweils aktuellen Fenster zugeordnet. Dass heißt, dass Sie zuerst Ihr Dokument zu bearbeiten anfangen sollen (z.B. im Word öffnen) und erst dann in der Taskleiste zum gewünschten Eingabegebietsschema wechseln.
Es gibt noch eine "Kleinigkeit": die Tastatur, die Sie verwenden, ist noch immer die deutsche. Unter welchen Tasten sind die Schriftzeichen des neuen Eingabegebietsschemas verborgen? Die einfachste Lösung: Drucken sie die Tasten eine weile, um zu erfahren, wo sich was befindet. Allerdings gibt es auch hier ein Hilfeprogramm – Sie können auch folgendes ausprobieren: Start / Programme / Zubehör / Eingabehilfen / Bildschirmtastatur. Probieren Sie es aus. Experimentieren Sie.
"LERNEN, LERNEN UND NOCHMALS LERNEN"
"Учиться, учиться и еще раз учиться." (Владимир Ильич Ульянов – Ленин) Dieser Aufruf wird sehr oft dem Lenin zugeschrieben (siehe z.B. Lenin: The Tasks of the Youth Leagues – Zitat: "And so, in dealing from this angle with the tasks confronting the youth, I must say that the tasks of the youth in general, and of the Young Communist Leagues and all other organisations in particular, might be summed up in a single word: learn." oder Lenin: A Retrograde Trend in Russian Social-Democracy – Zitat: "At a time when educated society is losing interest in honest, illegal literature, an impassioned desire for knowledge and for socialism is growing among the workers, real heroes are coming to the fore from amongst the workers, who, despite their wretched living conditions, despite the stultifying penal servitude of factory labour, possess so much character and will-power that they study, study, study, and turn themselves into conscious Social-Democrats – 'the working-class intelligentsia'."). In diesem Sinne werden hier noch einige Hinweise und Informationsquellen angeboten...
Alt+NumPad Eingabemethode: Falls Sie für einige spezielle Schriftzeichen, die Sie immer wieder brauchen, schon die Unicode-Nummern auswendig kennen, bietet sich für Sie noch eine sehr schnelle und zuverlässige Eingabemethode an, die s.g. ALT+[+]+[Hexadezimal Unicode]. Diese Methode steht allerdings nur unter MS Windows XP zur Verfügung. Man macht Folgendes: Die Alt-Taste drucken und halten, die Taste "+" auf der nummerischen Tastatur drucken, die hexadezimale Nummer des Unicode-Schriftzeichens eingeben, die Alt-Taste loslassen. Zum Beispiel, der griechische Buchstabe Omega hat die hexadezimale Unicode-Nummer U+03A9. Wenn sie in Ihrem Textverarbeitungsprogramm die hexadezimale Nummer 3A9 wie beschrieben eingeben, wird nach dem loslassen der Alt-Taste der folgende Buchstabe sichtbar: Ω.
Schriftartenprobleme: Vergessen Sie bitte nicht, dass die meisten von Schriftarten (engl. Fonts) nur eine begrenzte Auswahl aus den fast 100000 möglichen Schriftzeichen wirklich darstellen können. Wie schon gesagt, die Schriftarten "Arial Unicode MS", "Lucida Sans Unicode", "Times New Roman" oder Code2000 können relativ viele Schriftzeichen darstellen. (Nebenbei erwähnt: Anscheinend entwickelt Microsoft für das nächste Betriebsystem eine Reihe neuer Schriftarten für Longhorn.)
Text-Dokumente: Falls Sie einfache Texte mit eingebauten Notepad-Editor schreiben, wählen Sie beim Abspeichern des Dokuments unbedingt die Unicode-Kodierung UTF-8 aus! Es lohnt sich aber auch einige anderen Editoren auszuprobieren: EmEditor (geringer Preis) ist hervorragend als leistungsfähiger Ersatz für Notepad. BabelPad Editor (kostenlos) ist geeignet für die mehrsprachige Texte mit ungewöhnlichen Schriften, besonders bei der Erstellung der Web-Seiten (Manipulation dessen Quellenkodes).
MS Word-Dokumente: Es sind keine besondere Vorkehrungen notwendig, abgesehen von der Auswahl der Schriftart (siehe oben).
e-Mail: E-Mail-Programme unterstützen den Unicode-Standard noch sehr spärlich. Falls Sie sicherer sein wollen, dass Ihr Korrespondenz-Partner von Ihnen geschriebene Sonderzeichen korrekt sehen wird, schreiben Sie Ihre Nachricht unbedingt in der HTML-Form. In dem Fall wird Ihr e-Mail-Programm die Sonderzeichen meist richtig übertragen können.
Web-Foren (wie z.B. kominform.at): Falls Sie auch hier sicher sein wollen, dass Ihre Sonderzeichen durchkommen, verwenden Sie unbedingt auch hier das HTML-Format – d.h. auch wenn Sie nicht vor haben, die HTML-Fächigkeiten explizit zu benutzen, sondern "reines" Text eingeben wollen, wählen Sie (falls auf Forum-Seiten vorgesehen) das HTML als Eingabeformat aus. So werden von Ihnen eingegebene spezielle Schriftzeichen richtig "umkodiert".
Erstellen Ihrer eigenen Web-Seiten: Falls Ihre Seiten nichtdeutsche Schriftzeichen beinhalten, speichern Sie die Seiten am besten in der Unicode-Kodierung UTF-8 ab. Vergessen Sie gleichzeitig aber nicht, die entsprechende Meta-Zeile ins Header zu stellen, z.B. . Wenn Sie genau verstehen wollen, um was es dabei geht, schauen Sie sich evtl. die folgenden Seiten an:
Document character set,
HTML Document Representation,
Character encodings,
Numeric character reference,
Character entity reference,
Setting encoding in web authoring applications,
Web Internationalization Articles. Untersuchen sie auch den Quellkode der Seite, die Sie gerade lesen.
ZUM SCHLUSS
Im Mai 2005 konnte man auf diesen Seiten einen Artikel lesen, der von der APA übernommen wurde und unter anderem von EDV-Problemen bei der Verwendung von nicht deutschen Schriftzeichen berichtete (Slowenisch: "Háček" müsste "Stre¨ica" sein). Da ich einige Behauptungen dieses Artikels nicht teilte (wahrscheinlich dadurch, dass ich kein Sprachwissenschaftler, sondern Informatiker bin), entschloss ich mich meine Sichtweise darzustellen und den Lesern beizubringen, wie man Dokumente erstellt, die auch nichtdeutsche Schriftzeichen beinhalten. So entstand dieser Beitrag. Ich bedanke mich bei meinen Freunden für die Unterstützung bei dessen Vorbereitung. Ich werde mich über Kommentare der Leser freuen. Falls Fragen auftauchen, hoffe ich, dass mir die andere Kenner und informierte Mitleser helfen werden, diese zu beantworten.
valter
Siehe auch: WORKERS OF THE WORLD, UNITE!

