The Cyrillic HOWTO Autor: Aleksander L. Belikoff, v3.0, 13 sierpień 1995 Wersja polska: Gwidon S. Naskrent naskrent@hoth.amu.edu.pl v2.0, luty 1998 Dokument ten opisuje jak skonfigurować swój system linuxowy aby móc pisać, oglądać i drukować dokumenty w języku rosyjskim. Dokument ten został napisany w standardzie ISO-8859-2. Oryginał tego dokumentu znajduje się pod adresem ______________________________________________________________________ Table of Contents: 1. 1. Uwagi ogólne 1.1. 1.1 Wstęp 1.2. 1.2 Dostępność i uwagi 2. 2. Znaki i zestawy znaków 3. 3. Ustawianie trybu tekstowego 3.1. 4.1. Konsola 3.2. Konsola FreeBSD 3.3. System X Window 3.3.1. Xowe czcionki 3.3.2. Tłumaczenie danych wprowadzanych 3.3.2.1. Tablica znaków 3.3.2.2. Zasady przełączania trybów 4. Obsługa cyrylicy w LaTeXie 4.1. Używanie Washington Cyryliic 4.2. Pakiet KOI-8 dla LaTeXa 4.3. Używanie pakietu cmcyralt dla LaTeXa 4.4. Pakiet CyrTUG 5. Cyrylica w PostScriptcie 5.1. Dodawanie czcionek cyrylicowych do Ghostscripta 6. Drukowanie 6.1. Ładowanie czcionek cyrylicowych do drukarki niepostscriptowej 6.2. Drukowanie różnymi czcionkami 6.3. Konwersja tekstu do TeXa 6.4. Konwersja tekstu do postscriptu 7. Konfiguracja różnych narzędzi 7.1. 6.1. bash 7.2. 6.2. csh/tcsh 7.3. 6.3. emacs 7.4. 6.4. ispell 7.5. joe 7.6. ksh 7.7. less 7.8. lynx 7.9. mc (Midnight Commander) 7.10. Netscape Navigator 7.10.1. Konfiguracja podstawowa 7.10.2. Konfiguracja zaawansowana 7.11. pine 7.12. rlogin 7.13. sendmail (aka 'zguba sysadmina') 8. zsh 9. Użyteczne narzędzia 9.1. Narzędzia do konwersji 9.2. Narzędzia programisty 10. Wykaz użytecznych zasobów ______________________________________________________________________ 1. 1. Uwagi ogóólne 1.1. 1.1 Wstęęp Dokument ten obejmuje to czego potrzebujesz aby skutecznie pisać, oglądać i drukować dokumenty po rosyjsku pod Linuxem. Chociaż dokument ten zakłada że jako systemu operacyjnego używasz Linuxa, większość z przedstawionych informacji stosuje się także do innych odmian Unixa. Postaram się zachować rozróżnienie tak widocznym jak to możliwe. Istnieje pewna liczba popularnych dystrybucji linuxowych. Jako system przykładowy opiszę Linuxa Red Hat 3.0.3 (Picasso) oraz Red Hat 4.1 (Vanderbildt) - tego którego osobiście używam. Niemniej jednak postaram się zaznaczyć różnice, jeśli takowe istnieją, w instalacji Linux Slackware. Ponieważ taka instalacja bezpośrednio modyfikuje i rozszerza system operacyjny, powinieneś zdawać sobie sprawę z tego co robisz. Chociaż starałem się sprawy maksymalnie uprościć, posiadanie pewnego doświadczenia z danym programem jest korzystne. Nie zamierzam opisywać czym jest system X Windows i jak składać dokumenty używając TeXa lub LaTeXa, albo jak zainstalować drukarkę w Linuxie. Problemy te omawiane są w innych dokumentach. Z tych samych powodów opisuję instalację na skalę systemową, domyślnie wymagającą uprawnień administratora. Jeśli jednak istnieje możliwość instalacji na poziomie użytkownika, nie omieszkam jej wspomnieć. Uwaga: system X Windows, TeX i inne składniki Linuxa są złożonymi systemami z wyrafinowaną konfiguracją. Jeśli coś sknocisz, możesz nie tylko nie dokonać instalacji cyrilicy, ale popsuć składnik, jeśli nie cały system. Nie ma to na celu cię odstraszać, lecz tylko sprawić abyś zrozumiał powagę operacji i był ostrożnym. Wstępna kopia zapasowa plików konfiguracyjnych jest wielce pożądana. Posiadanie pod ręką jakiegoś guru zawsze się przydaje. 1.2. 1.2 Dostęępnośśćć i uwagi Dokument ten dostępny jest na sunsite.unc.edu lub tsx-11.mit.edu jako część Linux Documentation Project. Może także być dostępny w różnych archiwach zawierających Linuxa. Co więcej, może także wchodzić w skład dystrybucji Linuxa. Można go wreszcie otrzymać bezpośrednio od autora, na ftp.netvision.net.il. Jeśli masz jakieś pytania dotyczące tego dokumentu, nie wahaj się, proszę, skontaktować się ze mną pod adresem belikoff@netvision.net.il. Każda nowa i użyteczna informacja na temat obsługi Cyrilicy w różnych Unixach jest mile widziana. Pamiętaj, pomoże to innym. Wielu ludzi pomogło mi (i nie tylko mi) wartościowymi informacjami oraz sugestiami. Jeszcze więcej ludzi dołożyło oprogramowania na użytek publiczny. Przepraszam jeżeli zapomniałem kogoś wymienić. Oto więc oni: Bas v. de Bakker, David Daves, Siergiej Wakulenko, Siergiej O. Naoumow, Winfried Trümper, Michael van Canneyt. Ten dokument jest (c) 1995 Aleksander L. Belikoff. Można go używać i rozpowszechniać zgodnie ze zwykłymi warunkami Linux HOWTO opisanymi poniżej. Poniższe jest notką o prawach autorskich Linux HOWTO: Dokumenty Linux HOWTO stanowią prawną własność ich autorów, chyba że zaznaczono inaczej. Dokumenty Linux HOWTO mogą być reprodukowane i rozposzechniane w całości lub części, w każdym fizycznym lub elektronicznym środku przekazu, tak długo jak w każdej kopii pozostaje niniejsza notka o prawach autorskich. Redystrybucja komercyjna jest dozwolona i popierana; autorzy jednak woleliby zostać o takich dystrybucjach powiadomieni. Wszystkie tłumaczenia, prace pochodne i zbiorowe zawierające dokumenty Linux HOWTO muszą podlegać po tą notkę o prawach autorskich. To jest, nie możesz stworzyć z HOWTO pracy pochodnej i nałożyć dodatkowe ograniczenia na jej dystrybucję. Wyjątki do tych reguł mogą być udzielone pod pewnymi warunkami; proszę skontaktować się z koordynatorem Linux HOWTO pod adresem podanym poniżej. W skrócie, chcielibyśmy promować rozprzestrzenianie się tych informacji tak wieloma kanałami jak to możliwe. Pragnęlibyśmy jednakże zachować prawa autorskie do dokumentów HOWTO, i być powiadamianymi o każdych planach ich redystrybucji. Jeśli masz pytania, skontaktuj się proszę z Gregiem Hankinsem, koordynatorem Linux HOWTO, pod adresem gregh@sunsite.unc.edu. Możesz użyć tego adresu z programem finger by zdobyć numer telefonu i inne dodatkowe informacje dotyczące kontaktu. Unix jest zastrzeżonym znakiem przemysłowym X/Open Ltd.; MS-DOS, Windows, Windows NT i Windows 95 są zastrzeżonymi znakami Microsoft Corp.; System X Windows jest znakiem zastrzeżonym Consortium X, Inc. Wszystkie inne znaki zastrzeżone należą do ich odpowiednich posiadaczy. 2. 2. Znaki i zestawy znakóów Ażeby zrozumieć i wyświetlać znaki różnych języków, system i programy muszą być zdolne odróżniać je od innych znaków. To jest, każdy pojedynczy znak musi mieć odrębną reprezentację wewnątrz systemu operacyjnego, bądź konkretnego pakietu programów. Taka kolekcja wszystkich odrębnych znaków które jakiś system jest w stanie reprezentować w danym momencie nazywa się zestawem znaków. W czasie tworzenia największych systemów operacyjnych nikt nie dbał o to aby programy były wielojęzyczne. Dlatego też najpopularniejszym zestawem znaków był (i ciągle jest) ASCII (American Standard Code for Information Interchange). Standardowy ASCII (aka siedmiobitowy ASCII) zawiera 128 odrębnych kodów. Niektóre z nich ASCII definiuje jako faktyczne drukowalne znaki, a niektóre są tak zwanymi znakami kontrolnymi, które posiadały specjalne znaczenia w starszych protokołach komunikacyjnych. Każdy element zestawu identyfikuje kod będący liczbą całkowitą (0-127). Podzbiór znaków drukowalnych przedstawia te które znaleźć można na klawiaturze maszyny do pisania, z niewielkimi dodatkami. Każdy znak zajmuje siedem najmniej znaczących bitów bajtu, podczas gdy najbardziej znaczący używany był dla celów kontrolnych (np. kontroli transmisji w starszych pakietach komunikacyjnych). Koncepcję ASCII siedmiobitowego rozszerzył ASCII ośmiobitowy (aka rozszerzony ASCII). W tym zestawie zakres kodów znaków to 0-255. Dolna połowa (0-127) to czysty ASCII, podczas gdy górna zawiera 127 dodatkowych znaków. Ponieważ zestaw ten jest wstecznie kompatybilny z ASCII (znak ciągle zajmuje osiem bitów, kody odpowiadają staremu ASCII), zyskał on sobie szeroką popularność. ASCII ośmiobitowe nie definiuje zawartości górnej połówki zestawu. Dlatego ISO powzięło zadanie ustalenia rodziny standardów znanych jako rodzina ISO-8859-X. Jest to zbiór kodowań ośmiobitowych, w których niższa połowa każdego kodowania (0-127) odpowiada ASCII, a wyższa definiuje znaki dla różnych języków. Zdefiniowano na przykład następujące kodowania: ˇ 8859-1 - Europa Zachodnia, Ameryka Łacińska (znany też jako Latin 1) ˇ 8859-2 - Europa Środkowa i Wschodnia ˇ 8859-5 - cyrylica ˇ 8859-8 - hebrajski W Latin 1 górna połowa tabeli definiuje różne znaki które nie są częścią alfabetu angielskiego, ale znajdują się w różnych językach zachodnioeuropejskich (umlauty niemieckie, akcenty francuskie). Programy które nie zakładają nic co do ósmego bitu danych ASCII zwane są ośmiobitowo czystymi. Niektóre starsze programy, napisane z myślą o ASCII 7-bitowym, nie są czyste ośmiobitowe i mogą działać niepoprawnie z danymi ośmiobitowymi. Większość jednak pakietów domyślnie radzi sobie z ośmiobitowym ASCII, albo wymaga bardzo prostego ustawienia. UWAGA: zanim wyślesz pytanie "Wszystko ustawiłem poprawnie, a nie mogę wprowadzać/oglądać znaków cyrylicowych!", zajrzyj do sekcji 8 co do uwag o programie którego używasz. Ponieważ na większości systemów ASCII zajmuje osiem bitów, nie ma już możliwość aby ciągle je rozszerzać. Sposobem na zaimplementowanie nowych symboli w kodowaniach opartych na ASCII jest stworzenie innej imple...
Porozmawiajmy.TV