Sākumlapa
"Pirmā web lapa"
CSS
Citi materiāli
Ceļošana - kalni
HTML
Sintakse
Pamatelementi
Virsraksti, rindkopas
Saraksti
Saites
Attēli
Tabulas
Noformējums
Meta
HTML ...
Doctype
Rakstāmzīmju kodējums
Entītijas
Valodas norādīšana
Teksta virziens
Vēl iesaku:
HTML materiāla sākumā tikai pieminēju rakstāmzīmju kodēšanu un parametru "charset". Ar rakstāmzīmēm mēs sapratīsim jebkurus burtus, skaitļus vai simbolus jebkurā vēlamā valodā, ko vēlētos redzēt korekti attēlotu pārlūkprogramā. Tagad aplūkosim to mazliet tuvāk.
Kā jau, droši vien, zināms, tad pa elektrības vadiem, kabeļiem un dzīslām (piemēram, telefona, datora, datortīklu, tajā skaitā internetā) neskraida vārdi un simboli, bet gan elektriskie impulsi. Lai vārdus pārvērstu impulsos un otrādi, lieto kodēšanu pēc kādas kodu tabulas. Tā gandrīz katram jau ir skaidrs, ka, saņemot signālu pēc Morzes kodu tabulas "...---..." (SOS), kādam nepieciešama steidzama palīdzība. Savukārt datorā rakstāmzīmes tiek kodētas ar bitu (vieninieku un nullīšu virknes) palīdzību. Saņemot šādus bitu virknējumus, atšifrētājam jāzin, pēc kādas metodes jeb kodējuma saņemtos bitus pārvērst rakstāmzīmēs. Tad nu "charset" ir tas, kas nosaka šo kodējumu.
Daži iespējamie kodējumi:
Ja mēs neieliktu nevienu norādi par kodējumu (drīkst arī neielikt), tad ir rekomendēts, ka kā noklusētais kodējums automātiski tiktu piemērots "iso-8859-1", taču praksē tas var arī nenotikt.
Šie rakstāmzīmju kodēšanas vārdi ir reģistrnejūtīgi (lielo-mazo burtu), t.i., var rakstīt gan "UTF-8", gan "utf-8"
Visu šo informāciju var iekļaut "meta" tagā, t.i., "meta" elementā. "Meta" elements savukārt ievietojams HTML dokumenta galvenē :), t.i., "head" elementā, pie tam pēc iespējas drīzāk.
Piemērs:
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
</head>
Analizējot piemēru, redzam sekojošo:
Tātad cilvēcīgā valodā mēs to varētu pateikt tā: "http protokola saturs ir teksts, pie tam html teksts, utf-8 kodējumā.
Ikdienā, protams, mēs par visu šo garo saturu varam neuztraukties, to vienkārši iekopējot vajadzīgajā vietā - no visa piemēra taču (iespējams) mainās tikai pašas beigas - parametra "charset" vērtība, jeb norādītais kodējums.
Ja tomēr neizdodas attēlot kādas rakstāmzīmes, tad var lietot sekojošas to atsauces:
Lūk, daži piemēri:
| rezultāts | entītija | decimālais | rezultāts | entītija | decimālais |
|---|---|---|---|---|---|
| tukšums | |   | < | < | < |
| § | § | § | > | > | > |
| © | © | © | × | × | × |
| ® | ® | ® | ÷ | ÷ | ÷ |
| & | & | & | ± | ± | ± |
Piezīme: " " nāksies lietot, ja jāieliek vairāk kā viena atstarpe, jo pārlūkprogramma ar klaviatūru liktās atstarpes interpretē tikai kā vienu atstarpi, neatkarīgi no to faktiskā skaita. Protams, ja vien nelieto nenoformētu tekstu (<pre>). Savukārt < un > tekstā jālieto obligāti, jo < un > apzīmē taga sākumu un beigas.
Pilnu sarakstu var skatīt sadaļā "Entītijas"
Šo gribu pieminēt tikai viena iemesla dēļ - nereti validējot lapu, parādīsies apmēram šāds brīdinājums: "jūsu dokuments satur BOM, un, kamēr tas nav pietiekami atbalstīts, vēlams no tā tikt vaļā". Tiesa, BOM klātesamība neiespaido lapas validitāti.
Kas tas ir?
Lai palielinātu iespēju, ka lapas, kurās tiktu lietots "utf-16" kodējums, tiktu pareizi atkodētas, ir W3C ieteikums, ka tām būtu jāsākas ar speciālu rakstāmzīmi, sauktu par BOM (heksadecimāli - FEFF). Ieraugot pašā sākumā BOM, atkodētājs saprot, ka ir jāpiemēro īpašā atkodēšanas sistēma. Pie tam lieta tāda, ka daudzi teksta formāta web lapu redaktori, piemēram, MS Windows iebūvētais Notepad u.c., šo BOM automātiski iemet ar to veidoto web lapu pirmajā rindiņā. Pie tam, parastajos apstākļos jūs to neredzat. Jāsaka, ka līdz šim BOM klātesamība man nav traucējusi, un veidotās lapas ir korekti attēlotas jaunākajos Internet Explorer, FireFox un Opera pārlūkos. Ja nu tomēr gribat BOM aplūkot vai tikt no tā vaļā, tad nāksies lietot kādu HEX editoru (atrodamas internetā kaut vai pēc atsēgvārdiem "HEX editor download"), kurā jāatver lapa un pašā pirmajā koda rindiņā būs redzami BOM "ķeburi". To tad var mierīgi izdzēst. Var arī meklēt teksta formāta web lapu redaktorus, kas BOM-u bez prasīšanas neievieto.
Autortiesības © 2005-2009, kasis.lv. Visas tiesības aizsargātas.