Sākumlapa
"Pirmā web lapa"
CSS
Citi materiāli

Ceļošana - kalni


HTML

Sintakse
Pamatelementi
Virsraksti, rindkopas
Saraksti
Saites
Attēli
Tabulas
Noformējums
Meta

HTML ...
Doctype
Rakstāmzīmju      kodējums
Entītijas
Valodas norādīšana
Teksta virziens

Vēl iesaku:

W3Schools
Krāsu palete

Rakstāmzīmju kodējums (character encoding)

HTML materiāla sākumā tikai pieminēju rakstāmzīmju kodēšanu un parametru "charset". Ar rakstāmzīmēm mēs sapratīsim jebkurus burtus, skaitļus vai simbolus jebkurā vēlamā valodā, ko vēlētos redzēt korekti attēlotu pārlūkprogramā. Tagad aplūkosim to mazliet tuvāk.

Kā jau, droši vien, zināms, tad pa elektrības vadiem, kabeļiem un dzīslām (piemēram, telefona, datora, datortīklu, tajā skaitā internetā) neskraida vārdi un simboli, bet gan elektriskie impulsi. Lai vārdus pārvērstu impulsos un otrādi, lieto kodēšanu pēc kādas kodu tabulas. Tā gandrīz katram jau ir skaidrs, ka, saņemot signālu pēc Morzes kodu tabulas "...---..." (SOS), kādam nepieciešama steidzama palīdzība. Savukārt datorā rakstāmzīmes tiek kodētas ar bitu (vieninieku un nullīšu virknes) palīdzību. Saņemot šādus bitu virknējumus, atšifrētājam jāzin, pēc kādas metodes jeb kodējuma saņemtos bitus pārvērst rakstāmzīmēs. Tad nu "charset" ir tas, kas nosaka šo kodējumu.

Daži iespējamie kodējumi:

Ja mēs neieliktu nevienu norādi par kodējumu (drīkst arī neielikt), tad ir rekomendēts, ka kā noklusētais kodējums automātiski tiktu piemērots "iso-8859-1", taču praksē tas var arī nenotikt.
Šie rakstāmzīmju kodēšanas vārdi ir reģistrnejūtīgi (lielo-mazo burtu), t.i., var rakstīt gan "UTF-8", gan "utf-8"

Visu šo informāciju var iekļaut "meta" tagā, t.i., "meta" elementā. "Meta" elements savukārt ievietojams HTML dokumenta galvenē :), t.i., "head" elementā, pie tam pēc iespējas drīzāk.
Piemērs:

<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
</head>

Analizējot piemēru, redzam sekojošo:

Tātad cilvēcīgā valodā mēs to varētu pateikt tā: "http protokola saturs ir teksts, pie tam html teksts, utf-8 kodējumā.

Ikdienā, protams, mēs par visu šo garo saturu varam neuztraukties, to vienkārši iekopējot vajadzīgajā vietā - no visa piemēra taču (iespējams) mainās tikai pašas beigas - parametra "charset" vērtība, jeb norādītais kodējums.

Ja tomēr neizdodas attēlot kādas rakstāmzīmes, tad var lietot sekojošas to atsauces:

Lūk, daži piemēri:

rezultāts entītija decimālais rezultāts entītija decimālais
tukšums &nbsp; &#160; < &lt; &#60;
§ &sect; &#167; > &gt; &#62;
© &copy; &#169; × &times; &#215;
® &reg; &#174; ÷ &divide; &#247;
& &amp; &#38; ± &plusmn; &#177;

Piezīme: "&nbsp;" nāksies lietot, ja jāieliek vairāk kā viena atstarpe, jo pārlūkprogramma ar klaviatūru liktās atstarpes interpretē tikai kā vienu atstarpi, neatkarīgi no to faktiskā skaita. Protams, ja vien nelieto nenoformētu tekstu (<pre>). Savukārt &lt; un &gt; tekstā jālieto obligāti, jo < un > apzīmē taga sākumu un beigas.

Pilnu sarakstu var skatīt sadaļā "Entītijas"

Byte Order Mark (BOM)

Šo gribu pieminēt tikai viena iemesla dēļ - nereti validējot lapu, parādīsies apmēram šāds brīdinājums: "jūsu dokuments satur BOM, un, kamēr tas nav pietiekami atbalstīts, vēlams no tā tikt vaļā". Tiesa, BOM klātesamība neiespaido lapas validitāti.

Kas tas ir?
Lai palielinātu iespēju, ka lapas, kurās tiktu lietots "utf-16" kodējums, tiktu pareizi atkodētas, ir W3C ieteikums, ka tām būtu jāsākas ar speciālu rakstāmzīmi, sauktu par BOM (heksadecimāli - FEFF). Ieraugot pašā sākumā BOM, atkodētājs saprot, ka ir jāpiemēro īpašā atkodēšanas sistēma. Pie tam lieta tāda, ka daudzi teksta formāta web lapu redaktori, piemēram, MS Windows iebūvētais Notepad u.c., šo BOM automātiski iemet ar to veidoto web lapu pirmajā rindiņā. Pie tam, parastajos apstākļos jūs to neredzat. Jāsaka, ka līdz šim BOM klātesamība man nav traucējusi, un veidotās lapas ir korekti attēlotas jaunākajos Internet Explorer, FireFox un Opera pārlūkos. Ja nu tomēr gribat BOM aplūkot vai tikt no tā vaļā, tad nāksies lietot kādu HEX editoru (atrodamas internetā kaut vai pēc atsēgvārdiem "HEX editor download"), kurā jāatver lapa un pašā pirmajā koda rindiņā būs redzami BOM "ķeburi". To tad var mierīgi izdzēst. Var arī meklēt teksta formāta web lapu redaktorus, kas BOM-u bez prasīšanas neievieto.




Autortiesības © 2005-2009, kasis.lv. Visas tiesības aizsargātas.