Strony internetowe powinny zawierać w źródłe informacje o rodzaju użytego kodowania. Jest to szczególnie istotne w przypadku stron np. polskojęzycznych, które zawierają polskie znaki diaktryczne. Różne kodowania w różny sposób obsługują kody tych znaków, jeśli więc deklaracja zostanie pominięta lub będzie niezgodna z rzeczywistością, polskie litery będą wyświetlane błędnie.
Dla języka polskiego, prawidłowymi, powszechnie używanymi zestawami znaków są:
- iso-8859-2 (środkowoeuropejski)
- utf-8 (unicode)
W przykładach na tej stronie używam kodowania utf-8 i takie też zalecam osobom, tworzącym skrypty w Google Maps API. Jest ono bardziej pamięciochłonne niż kodowanie środkowoeuropejskie, ale też obsługuje nie tylko język polski, poza tym jest w pełni zgodne z API Google.
W zależości od użytego kodowania, informacja w nagłówku może wyglądać w następujący sposób:
dla kodowania utf-8:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
dla kodowania iso-8859-2:
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-2" />
Konwersja
Sam wybór kodowania nie wystarcza. Większość programów, przeznaczonych specjalnie dla projektantów stron dba automatycznie o odpowiedni zapis znaków w wybranym kodowaniu. Inne programy mogą jednak nie oferować takiej możliwości. Przykładowo, Windowsowy Notanik zapisuje pliki w kodowaniu windows-1250, które nie powinno być używane. W takiej sytuacji polecam używany przeze mnie program Gżegżółka XP - wskazuje się pliki do konwersji, następnie wybiera źródłowe kodowanie (lub pozwala na automatyczny wybór przez program) i kodowanie docelowe, a program sam zadba o odpowiednią konwersję.
Pobierz Gżegżółkę XP (program darmowy)
Więcej informacji
Więcej informacji na temat kodowania znaków dla polskich witryn znajduje się pod tym adresem.
