Šiuolaikinės žymėjimo kalbos. Žymėjimo kalbos. Programos, skirtos kurti HTML puslapius

1969 m. trys IBM mokslininkai sukūrė GML – formatavimo kalbą, skirtą publikuoti dokumentus. GML yra ne tik apibendrintos žymėjimo kalbos akronimas, bet ir jos kūrėjų – Charleso Goldfarbo, Edwardo Mosherio ir Raymondo Laurierio – inicialai.

GML palaiko teksto redagavimą ir formatavimą ir leidžia informacijos išgavimo posistemiams keistis dokumentais. Tuo pačiu metu vietoj paprastos žymėjimo schemos GML pristato formaliai apibrėžtų dokumentų tipų koncepciją, kurioje yra griežta struktūrinių elementų hierarchija.

Pagrindiniai GML komponentai buvo įdiegti pagrindinio kompiuterio leidybos sistemose, o pati kalba yra labai populiari pramonėje. GML naudoja IBM, jos pagalba sukuriama daugiau nei 90% įmonės dokumentų.

Išplėtus GML sąvokomis, tokiomis kaip išnašos, nuorodų tvarkymas ir lygiagrečiai dokumentų tipai, buvo sukurta standartinė apibendrinta žymėjimo kalba. SGML buvo pradėtas aktyviai naudoti leidybos versle, be to, jis buvo priimtas naudoti JAV vyriausybės leidykloje ir 1986 m. gavo tarptautinio standarto statusą.

Tačiau SGML buvo mažai žinomas iki 1990 m., kai World Wide Web kūrėjas Timas Bernersas-Lee sukūrė hiperteksto žymėjimo kalbą, kuri yra SGML poaibis. Netrukus po to visų tipų dokumentuose ir duomenyse kiekvieno teksto elemento pradžioje ir pabaigoje pradėjo būti žymos pagal stilių. Dešimtojo dešimtmečio pabaigoje atsirado XML (Extensible Markup Language)... ir IT visata pasikeitė negrįžtamai.

Tiesą sakant, atrodo, kad nė dienos nepraeina be žinios apie naujos žymėjimo kalbos sukūrimą ar aprašą. Iš tiesų „Computerworld“ jau paskelbė 10 straipsnių „Quick Study“ skiltyje, aprašančių įvairias žymėjimo kalbas, o tada tik pačias paprasčiausias. „Google“ paieška pagal žymėjimo kalbą pateikia nuorodų į daugiau nei 6 milijonus puslapių. Žemiau pateikiamas trumpas šiuolaikinės „žymėjimo kalbos erdvės“ vadovas. Žinoma, jis nėra išsamus, tačiau jis suteikia supratimą apie koncepcijos lankstumą ir galimybes bei jų panaudojimą. Dauguma šių kalbų yra XML arba domenui būdingų dokumentų tipų apibrėžimų plėtiniai, nors kai kurios iš jų yra gana sudėtingos.

Kalbos

  • Verslo procesų vykdymo kalba (BPEL) skirta atlikti žiniatinklio operacijų seriją ir (arba) aprašyti sąsajas, reikalingas žiniatinklio operacijoms atlikti. Jis naudojamas verslo procesams modeliuoti naudojant operacijų ir kompensavimo operacijų specifikacijas, duomenų srautus, pranešimus ir suplanuotus įvykius, verslo taisykles, saugos vaidmenis ir išimčių tvarkymą.
  • Langelių žymėjimo kalba (CellML) skirta saugoti ir dalytis kompiuteriniais matematiniais modeliais, leidžiančiais mokslininkams dalytis modeliais, net jei jie naudoja skirtingą programinę įrangą jiems kurti. Kalba taip pat leidžia pakartotinai panaudoti komponentus viename modelyje kuriant kitą, taip pagreitinant procesą. CellML apima matematinius ir metaduomenis naudojant esamas kalbas, įskaitant MathML. www.cellml.org
  • Cheminė žymėjimo kalba (CML) yra naujas požiūris į molekulinės informacijos valdymą, kuriame naudojami naujai sukurti interneto įrankiai, tokie kaip XML ir Java. Ši kalba, sukurta griežtai remiantis SGML, gali palaikyti itin sudėtingas informacijos struktūras ir taip veikti kaip mainų mechanizmas arba archyvavimo įrankis. Jis lengvai sąveikauja su šiuolaikinėmis duomenų bazių architektūromis, ypač reliacinėmis ar objektinėmis. Svarbiausia, kad jai apdoroti ir transformuoti jau sukurta daugybė bendrosios paskirties XML programinės įrangos. www.xml-cml.org
  • DARPA agento žymėjimo kalba (XML) turi ribotas galimybes apibūdinti ryšius tarp objektų. DAML išplečia XML naudodama ontologijas – gerai apibrėžtas formalias specifikacijas, kurios aprašo, kaip tam tikroje srityje pavaizduoti objektus, sąvokas ir kitus elementus, taip pat ryšius tarp jų. www.daml.org/about.html
  • Dinaminė žymėjimo kalba (DML) yra XML pagrindu sukurta kalba, sukurta specialiai objektų grafinėms struktūroms ir vartotojo sąsajos kūrimui. Kaip ir HTML, ši kalba apima plėtinius, kurie palaiko skaičiavimus, argumentų perdavimą ir kintamųjų saugojimą. www.rocklyte.com/dml
  • Katalogų paslaugų žymėjimo kalba (DSML) apibrėžia katalogo turinį ir struktūrą, prižiūri jį paskirstytuose kataloguose. DSML suteikia kūrėjams paprastą ir patogų būdą įdiegti XML programas internete. Šis palaikymas yra labai svarbus elektroninės prekybos programoms.
  • Finansinių produktų žymėjimo kalba (FPML) yra keitimosi verslo informacija elektroninės prekybos ir išvestinių finansinių priemonių apdorojimo standartas. Jame nustatomas keitimosi informacija ir darbo su išvestiniais ir struktūriniais produktais protokolas. www.fpml.org/index.html
  • Hiperteksto žymėjimo kalba (HTML), interneto pagrindas, yra pagrįstas GML versija, anksčiau naudota CERN. Pagrindinis jo pranašumas buvo tai, kad pirmą kartą ji leido sukurti paprastas hiperteksto nuorodas tarp dokumentų. www.w3.org/MarkUp
  • Žmogaus žymėjimo kalba (HML)– tai projektas, skirtas sukurti platformą viso žmonių bendravimo proceso modeliavimui, įskaitant tokias sritis kaip mąstymas, emocijos, elgesys, veido išraiškos, naudojant grafinį ar tekstinį vaizdavimą. www.humanmarkup.org
  • Medžiagų žymėjimo kalba (MatML) buvo sukurta keistis informacija apie medžiagas. www.matml.org
  • Daugialypės terpės paieškos žymėjimo kalba (MRML) suvienija prieigą prie programinės įrangos komponentų, naudojamų daugialypės terpės informacijai gauti ir valdyti, siekiant išplėsti jų galimybes. www.mrml.net
  • Fizinė žymėjimo kalba (PML) yra paprasta, bendros paskirties kalba, skirta apibūdinti fizinius objektus ir aplinką, skirtą pramoninėms, komercinėms ir vartotojų reikmėms. PML yra toks modulinis ir lankstus, kad jį galima naudoti fizinei aplinkai stebėti ir valdyti. Taikomos programos apima sandėlio stebėjimą, automatizuotas operacijas, tiekimo grandinės valdymą, mašinų valdymą ir ryšį tarp įrenginių. http://web.mit.edu/mecheng/pml/index.htm
  • Saugumo patvirtinimo žymėjimo kalba (SAML) yra XML pagrindu sukurtas įvynioklis, naudojamas informacijai apie vartotojo autentifikavimą, teises ir atributus perduoti. Tai leidžia įmonėms perduoti informaciją apie subjekto (dažniausiai žmogaus) tapatybę, atributus ir teises kitiems subjektams, pvz., įmonei partnerei ar kitai įmonės programai. www.oasis-open.org/committees/security/faq.php
  • Paslaugų teikimo žymėjimo kalba (SPM) yra apvalkalas, skirtas keistis informacija apie vartotojus, išteklius ir paslaugų teikimą tarp taikomųjų programų ir organizacijų.
  • Kalbos sintezės žymėjimo kalba (SSML) Padeda generuoti dirbtinę kalbą žiniatinklio programinėje įrangoje ir kitose programose, suteikdamas standartinį būdą valdyti kalbos charakteristikas, pvz., tarimą, stiprumą, aukštį ir kalbos greitį įvairiose platformose. www.w3.org/TR/speech-synthesis
  • Vartotojo sąsajos žymėjimo kalba (UIML) leidžia kurti vartotojo sąsajas bet kokiam įrenginiui, kalbai ir įrenginio operacinei sistemai. Jame aprašoma sąsajos išvaizda, kaip vartotojas sąveikauja su sąsaja ir kaip sąsaja yra susijusi su programos logika. www.uiml.org
  • Balso išplečiama žymėjimo kalba (VoiceXML). Balsu valdomos programos tampa vis populiaresnės, o „VoiceXML“ aprašo bendrąsias galimybes, užtikrinančias perkeliamumą įvairiose platformose. www.voicexml.org/
  • Belaidžio ryšio žymėjimo kalba (WML) aprašo turinį ir formatus, skirtus duomenims pateikti riboto pralaidumo įrenginiuose, pvz., mobiliuosiuose telefonuose ir pranešimų gavikliuose. Užuot bandęs perteikti visą tinklalapio turinį, kuris būtų matomas asmeniniame kompiuteryje, WML pateikia daugiausia tekstinę informaciją, optimizuotą mobiliesiems įrenginiams.
  • Išplečiamoji prieigos valdymo žymėjimo kalba (XACML) yra XML pagrindu sukurta schema, skirta kurti taisykles ir automatizuoti jų naudojimą, norint valdyti prieigą prie įvairių tinklo įrenginių ir programų.
  • Išplečiamoji žymėjimo kalba (XML) sujungia SGML mastelį su paprastu ir plačiu HTML palaikymu. Iš esmės tai yra SGML poaibis, jis yra paprastesnis ir lengviau įgyvendinamas ir palaiko daugumą SGML funkcijų. XML kaip standartą patvirtino World Wide Web Consortium 1998 m.

ML nereiškia "žymėjimo kalba"

Ne kiekviena kalba ar akronimas, kuris baigiasi ML, yra žymėjimo kalba. Čia yra labiausiai pastebimos išimtys.

ML simboliai iš pradžių buvo naudojami kaip žodžio „metalanga“ santrumpa, tai yra, bendrosios paskirties programavimo kalba, skirta dideliems projektams. Šiuo metu vartojami du pagrindiniai šios kalbos dialektai. Tai yra standartinis ML (SML; žr www.dcs.ed.ac.uk/home/stg/NOTES), matematiškai apibrėžta kalbos versija, kurią iš dalies suformulavo originalios kalbos kūrėjai, ir Objective Caml (OCaml; žr. http://caml.inria.fr/), išvestinė originalios ML versija, prie kurios kūrėjo nuožiūra pridedamos galimybės, jų neapibrėžiant standarte. Kiti žinomi dialektai apima išplėstinį ML (EML; žr http://homepages.inf.ed.ac.uk/dts/eml) ir Alisa ML ( www.ps.uni-sb.de/alice).

ML ir jo variantai yra funkcinės kalbos ir nepalaiko jokio atminties įrašymo. Jas sunku programuoti, tačiau jomis sukurtos programos kur kas geriau tinka formaliai analizei ir teisingumo įrodymui.

  • Vieningoji modeliavimo kalba (UML) yra standartinis žymėjimas, skirtas modeliuoti realaus pasaulio objektus kaip objektinio projektavimo metodikos kūrimo dalis. UML naudojamas modeliuoti programų struktūrą, elgseną ir architektūrą, taip pat verslo procesus ir duomenų struktūras. Šią kalbą palaiko daugelio kompiuterinio projektavimo sistemų gamintojai. UML buvo sukurtas remiantis metodikomis, kurios taip pat aprašo modelio kūrimo ir naudojimo procesus. www.uml.org
  • YAML nėra žymėjimo kalba (YAML) yra tarptautinis projektas, skirtas sukurti nuoseklaus duomenų išdėstymo kalbą, kuri, viena vertus, būtų suprantama žmonėms, kita vertus, palaiko rimtas skaičiavimo galimybes.

Sveiki mielas skaitytojau. Pats laikas pakalbėti apie HTML žymėjimo kalba, kurios pagalba buvo sukurtos absoliučiai visos interneto svetainės – tiek rusiškos, tiek buržuazinės ir net kiniškos. Bet tai ne programavimo kalba, kaip kai kurie žmonės galvoja, o hiperteksto žymėjimo kalba.

Leiskite jums priminti, kad hipertekstas yra tekstas, kuriame yra nuorodų į kitus puslapius ir dokumentus. Žymėjimo kalba parodo, kur ir kaip turi būti dedamas koks nors teksto elementas, pavyzdžiui, pastraipa, antraštė, sąrašas ir pan. CSS kalba, glaudžiai susijusi su HTML, yra atsakinga už šių elementų dizainą, todėl sukuriamas svetainės dizainas. puslapiai gražūs, skaitomi ir lengvi. Norėdami iškrauti puslapio kodą.

Be CSS, html galima papildyti PHP ir JavaScript programavimo kalbų funkcijomis, kurios suteikia puslapiams interaktyvumo, t.y. gebėjimas reaguoti į vartotojo veiksmus.
Naudodami visus šiuos įrankius galite sukurti bet kokį sudėtingumą ir bet kokį funkcionalumą. Pati HTML kalba yra atsakinga tik už žymėjimą

Tinklalapis iš vidaus



<br>Tai mano svetainė <br>


Tai mano tekstas

Šiame pateiktame kode matote komandas - žymės kurie kartais vadinami aprašai. Jie yra uždėti kampiniuose skliausteliuose. Žymos dažniausiai yra suporuotos. Atidarymas<>ir uždarymas, pasviruoju brūkšniu į priekį. Visas HTML žymėjimo kalbos kodas yra įdėtas vienas į kitą ir panašus į „lėlę matryoshka“, kur vienas konteineris įdėtas į kitą.

Žemiau esančiame paveikslėlyje parodytas šio kodo dekodavimas:

Štai kaip tas pats puslapis atrodo „Mozilla Firefox“ naršyklėje. Parodžiau, kur rodomas tekstas antraštę Pavadinimas ir tekstas žyma kūnas

Kaip sukurti html puslapį

Kad būtų aiškumo, nukopijuokite tekstą su aukščiau pateiktomis žymomis į bet kurį teksto rengyklę, pavyzdžiui, bloknotą, ir išsaugokite jį darbalaukyje. Dešiniuoju pelės mygtuku spustelėkite ir pasirinkite „pervardyti“. Vietoj plėtinio .txt, kaip įprastame tekstiniame faile, nurodykite plėtinį .html arba .htm. Užrašų knygelės piktograma pasikeis į naršyklės piktogramą, kurią spustelėję pamatysite pirmąjį tinklalapį.

Jei plėtinys nerodomas, turite atlikti šiuos veiksmus.

Kompiuteryje raskite: Išvaizda ir personalizavimas – Aplanko parinktys – Rodinys.

Visada naudinga rodyti failų plėtinius, kad užpuolikai negalėtų tikėtis, kad atidarysite failą su tokia infekcija kaip „gift.jpg“, kuri iš tikrųjų bus „gift.jpg.exe“. Be plėtinio, kurį „Windows“ slepia pagal numatytuosius nustatymus, labai lengva supainioti „kenkėjiškos programos“ paleidimo failą su paslėptu plėtiniu .EXE su įprasta nuotrauka.

Žiūrėkite vaizdo įrašą apie HTML puslapių kūrimą


Programos, skirtos kurti HTML puslapius

Html hiperteksto žymėjimo kodo rašymas rankiniu būdu be patirties gali atrodyti kaip dėmesingumo ir ištvermės išbandymas. Tačiau patikėkite manimi, tik tokiu būdu sustiprinę savo įgūdžius galėsite išdidžiai vadintis žiniatinklio valdytoju.

Norint išmaniai valdyti HTML kodo rašymą rankiniu būdu, yra daug programų su kodo paryškinimu. Notepad++ yra populiariausias tarp kūrėjų mėgėjų. PHP Dizaineris, Dreamweaver

Paskutinės dvi programos yra mokamos, tačiau senas versijas, kurios nėra prastesnės už naujas, galima rasti internete nemokamai ir legaliai naudoti savo poreikiams. Dreamweaver yra vaizdo redaktorius. Jis pats paverčia jūsų tekstą su dizainu į kodą. Bet kokiu atveju, susipažinę su šiuo įrankiu nepasigailėsite.

Kam tada mokytis rašyti kodą ranka? Reikalas tas, kad bet kokie vaizdiniai redaktoriai, net ir „WordPress“ įmontuotas redaktorius, kartais sukuria tiek daug savo nepageidaujamo kodo, kad puslapiai sveria daug kartų daugiau nei tie, kurie parašyti jūsų galva ir rankomis. Taip, jei taip pat atsižvelgsite į tai, kad paieškos sistemos dabar atkreipia dėmesį į kodo švarą, tuomet neišvengiamai pagalvosite apie HTML studijavimą, kad galėtumėte kontroliuoti visą procesą.

Apskritai Dreamwaver iš pradžių pakeis gerą mokytoją. Naudokite šią programą ir pažiūrėkite, kaip rašomas html puslapis. Svarbiausia, nepatingėkite pažvelgti į viršutinį programos langą, kuriame sugeneruojamas kodas. Atkreipkite dėmesį į tai, kur programa daro ką nors nereikalingo.

Kas iš tikrųjų yra naršyklė?

Daugelis žmonių mano, kad naršyklė skirta svetainių paieškai internete, ir tai yra jos paskirtis. Taigi, kompiuterio vartotojo supratimu, susidaro klaidinga nuomonė apie naršyklės paskirtį. Tiesą sakant, naršyklė yra programa, skirta interpretuoti html kodą, CSS kodą, JS kodą ir kt. Kitaip tariant, tai yra taikomosios programinės įrangos įrankis tinklalapiams ir kitiems dokumentams rodyti.

Šiuolaikinių naršyklių galimybės yra tikrai puikios. Juk internetiniuose puslapiuose yra įvairių formatų grafika, vaizdo įrašai ir tekstai. Naršyklė nuskaito html kodą, mato vaizdo medžiagą, ten įdėtą grafinį bei tekstinį kodą ir visa tai teisingai parodo įrenginio ekranuose. Žymos jam padeda tai padaryti, šie įprasti angliški žodžiai kampiniuose skliaustuose<>.

Naršyklė, naudodama žymes, mato, kuri teksto dalis, kurią ji interpretuoja, yra svetainės pavadinimas, kuri yra antraštė, ką reikia pateikti kaip pastraipą, kur įdėti paveikslėlį ir pakeliui išspręsti daugelį problemų, susijusių su įvairios kalbos, įterptos į įprastą HTML.

HTML žymėjimo kalba ir pagrindinės žymos

praneša naršyklei, kad tai yra HTML dokumentas
čia yra informacija paieškos sistemoms
turinys rodomas naršyklės lange
puslapio pavadinimas

Antraštės: nuo didžiausios iki mažiausios
Teksto paryškinimas pusjuodžiu ir kursyvu
nuorodos tekstas Nurodo naršyklei, kad tai nuoroda su tekstu " nuorodos tekstas«

Naujos pastraipos kūrimas

pastraipos lygiavimas ( kairėn, dešinėn, išlyginti arba centre)
Nurodo naršyklei sukurti formą

Ši lentelė skirta tik pagrindiniams aprašams parodyti.

Šiuolaikinėje HTML5 versijoje kartu su naujomis žymomis atsirado daugybė naujų funkcijų, apie kurias svetainių kūrėjai net nesvajojo prieš 10 metų.

Stiliai html dokumente

Kai naršyklė rodo tinklalapio turinį, ji rodo vieno stiliaus antraštes, kitu pastraipos tekstą ir skirtingų šriftų dydžius. Tai pagal numatytuosius nustatymus įjungta kiekvienoje naršyklėje. Bet mes norime matyti individualų tinklalapių dizainą, o čia į pagalbą ateina CSS. Kaskadinių stiliaus lapų kalba. Naudodami CSS galite nustatyti bet kurio elemento dizainą, galite sukurti bet kokį žiniatinklio dokumento dizainą.

CSS yra HTML kalbos stiliaus papildymas ir be jo nebūtų.

Html stiliai įgyvendinami taip:

Galva>

Jei naudojamas išorinis stiliaus failas styles.css, tada jis prisijungia prie html dokumento taip:

CSS taisyklių rašymo pavyzdys:

p (spalva: juoda; šriftas: x-small).

Nurodo naršyklei, kokia yra pastraipos spalva

juoda- juodas, o šrifto dydis yra x mažas(mažas)

Taip, pavyzdžiui, formuoju turinį kiekvieno šio tinklaraščio straipsnio pradžioje.

Skelbimai
(kraštinė: 2 piks. pradžioje žalia;
kraštinės spindulys: 10 pikselių;
plotis: 360;
šriftų šeima: „Yeseva+One“;
šrifto dydis: 16 pikselių;
linijos aukštis: 1,2 em; užpildymas: 10 piks. 10 piks. 10 piks. 20 piks.;
paraštė: 10 piks. automat. 20 piks.;
teksto lygiavimas:kairėje;
fono spalva: #a7cece;
}

paskutinėje eilutėje yra įdomus fragmentas: fono spalva: #a7cece;

#a7cece – tai html spalva. Naudodami HEX simbolių rinkinį - šešioliktainę sistemą: skaičiai nuo 0 iki 9 ir raidės nuo A iki F, galite nustatyti absoliučiai bet kokią spalvą. Čia yra gražus akvamarinas.

Prie CSS temos grįšiu atskiruose leidiniuose.

Kaip išmokti HTML žymėjimo kalbą

  • Internetas pilnas žinynų apie HTML (html). Man patinka svetainė http://htmlbook.ru. Aš dažnai čia ateinu ieškoti informacijos. Rekomenduoju taupyti laiką.
  • Andrejus Bernatskis. Būtinai patikrinkite!
  • Man patinka amerikiečių autorių knygos. Tai labiausiai žavi HTML/CSS kalbos pamoka su tokiu šauniu medžiagos pateikimu, kad skaitysite nesustodami. Viskas pasakyta paprastai ir aiškiai. Ją galima nemokamai parsisiųsti iš interneto, bet geriau nusipirkti ir dirbti su ja kaip su knyga.

Geriausias būdas įsisavinti HTML žymėjimo kalbą (HTML) yra atsisiųsti garsiausius mokymo kursus iš „RuNet“, o kai kurie iš jų yra visiškai nemokami. Eikite į Jevgenijaus Popovo svetainę ir atsisiųskite daugybę naudingos mokomosios informacijos. Norėdami gauti profesionalų mokymą, perskaitykite informaciją.

Visi dokumentai, pasiekiami per žiniatinklį, yra parašyti specialiai šiam tikslui sukurta kalba, vadinama hiperteksto žymėjimo kalba (HTML). HTML yra paprasta žymėjimo kalba, leidžianti pažymėti teksto fragmentus ir nustatyti nuorodas į kitus dokumentus, paryškinti antraštes keliais lygiais, skaidyti tekstą į pastraipas, jas centruoti ir pan., paprastą tekstą paverčiant suformatuotu hipermedijos dokumentu.

HTML kalbos įrankių pagrindas yra žymės – HTML instrukcijos, kurių kalboje yra apie šimtus. Jie yra hipertekstinio dokumento viduje ir leidžia formuoti visą jo dizaino struktūrą ir stilių iki subtilybių. Pavyzdžiui, peržiūrint tokį dokumentą naudojant naršyklę, šios žymos yra nematomos. O kuriant tinklalapį naudojant specializuotus programinės įrangos įrankius, o tokie įrankiai yra beveik visose biuro programose (Word, Excel, Access, Power Point, Outlook ir kt.), žymos vartotojui nėra matomos – jos įvedamos automatiškai .

Žymos rašomos, pavyzdžiui, kampiniuose skliaustuose

arba
. Čia pirmoji žyma yra pradžios žyma, o antroji su pasviruoju brūkšniu yra uždarymo žyma. Šios žymų poros poveikis yra tas, kad tekstas tarp jų yra sulygiuotas su lango, kuriame peržiūrimas dokumentas, centre. Žymų yra įvairių – nuo ​​paprastų (struktūriniam dizainui ir teksto lygiavimui, spalvų formavimui, dydžiui, šrifto stiliui ir kt.) iki specialių (grafinių ir daugialypės terpės objektų įtraukimui į dokumentą. Sudėtingos žymos, be to, pavadinimą, taip pat turi atributų, nurodančių, kaip juos naudoti.

HTML žymos neapibrėžia absoliutaus dokumento formatavimo, kaip teksto rengyklės kodai, o tik santykinius. Pavyzdžiui, žyma, dėl kurios teksto eilutė yra centre, vienodai veiks tiek plačiame, tiek siaurame ekrane, o jei tekstas netelpa per visą ekrano plotį, jis automatiškai perkeliamas į antrą eilutę, trečias ir pan.

Tinklalapius galite peržiūrėti bet kuriame teksto rengyklėje, tačiau tai padaryti yra labai nepatogu, nes puslapis nėra suformatuotas, bet matomos jo žymos.

HTML dokumentų peržiūros programos vadinamos naršyklėmis. Interneto dokumentų peržiūra yra viena iš pagrindinių, nors ir ne vienintelė, naršyklės funkcijų.

Nuo pirmosios kalbos versijos (HTML 1.0) sukūrimo praėjo keli metai. Per tą laiką įvyko gana rimta kalbos raida. Žymėjimo elementų skaičius išaugo beveik dvigubai, dokumentų apipavidalinimas vis labiau artėja prie kokybiškų spausdintų leidinių dizaino, kuriamos netekstinės informacijos išteklių aprašymo priemonės, sąveikos su taikomąja programine įranga metodai. Tobulinamas standartinių stilių kūrimo mechanizmas. Tiesą sakant, HTML šiuo metu vystosi kuriant standartinę kalbą vietinėms ir paskirstytoms sistemoms kurti.

Žymėjimo kalbos

Žymėjimo kalba(tekstas) kompiuterių terminologijoje – simbolių arba sekų rinkinys, įterpiamas į tekstą, siekiant perteikti informaciją apie jo išvestį arba struktūrą. Priklauso kompiuterinių kalbų klasei. Tekstiniame dokumente, parašytame naudojant žymėjimo kalbą, yra ne tik pats tekstas (kaip žodžių ir skyrybos ženklų seka), bet ir papildoma informacija apie įvairias jo dalis – pavyzdžiui, antraštės, paryškinimai, sąrašai ir pan. sudėtingesnis Kai kuriais atvejais žymėjimo kalba leidžia į dokumentą įterpti interaktyvius elementus ir turinį iš kitų dokumentų.

Reikėtų pažymėti, kad žymėjimo kalba yra neišsami Turingo kalba ir paprastai nėra laikoma programavimo kalba, nors griežtai taip yra.

HTML (iš anglų kalbos) Hiperteksto žymėjimo kalba– „hiperteksto žymėjimo kalba“ – maždaug 1986–1991 m. Europos branduolinių tyrimų centre Ženevoje (Šveicarija) sukūrė britų mokslininkas Timas Bernersas-Lee. HTML buvo sukurtas kaip kalba keistis moksline ir technine dokumentacija, tinkama naudoti žmonėms, kurie nėra maketavimo srities specialistai. HTML sėkmingai susidorojo su SGML sudėtingumu, apibrėždamas nedidelį struktūrinių ir semantinių elementų rinkinį, vadinamą deskriptoriais. Deskriptoriai taip pat dažnai vadinami „žymomis“. Naudodami HTML galite lengvai sukurti gana paprastą, bet gražaus dizaino dokumentą. Be dokumento struktūros supaprastinimo, prie HTML pridėtas hiperteksto palaikymas. Multimedijos galimybės buvo pridėtos vėliau.

Iš pradžių HTML kalba buvo sumanyta ir sukurta kaip dokumentų struktūrizavimo ir formatavimo priemonė, nesusiejant jų su atkūrimo (rodymo) įrankiais. Idealiu atveju tekstas su HTML žymėjimu turėjo būti atkuriamas be stilistinių ir struktūrinių iškraipymų ant įrangos su skirtinga technine įranga (modernaus kompiuterio spalvotas ekranas, vienspalvis organizatoriaus ekranas, riboto dydžio mobiliojo telefono ar įrenginio ekranas ir balso programos tekstų atkūrimas). Tačiau šiuolaikinis HTML naudojimas labai toli nuo jo pradinės paskirties. Pavyzdžiui, žymėti

, kelis kartus naudojamas puslapiui formatuoti, skirtas dažniausiai pasitaikančių lentelių kūrimui dokumentuose. Bėgant metams pagrindinė HTML platformos nepriklausomybės idėja buvo paaukota dėl šiuolaikinių daugialypės terpės ir grafikos poreikių.

XML(Anglų) eX tempiamasM arkupL kalba-- išplečiama žymėjimo kalba; tariamas [ ex-em-eml]) yra World Wide Web Consortium (W3C) rekomenduojama žymėjimo kalba. XML specifikacija aprašo XML dokumentus ir iš dalies aprašo XML procesorių (programų, kurios skaito XML dokumentus ir suteikia prieigą prie jų turinio) elgseną. XML buvo sukurta kaip kalba su paprasta formalia sintaksė, patogi kurti ir apdoroti dokumentus programomis, o tuo pačiu patogi žmonėms skaityti ir kurti dokumentus, akcentuojant naudojimąsi internete. Kalba vadinama išplečiama, nes nefiksuoja dokumentuose naudojamo žymėjimo: kūrėjas gali laisvai kurti žymėjimą pagal konkretaus domeno poreikius, ribojamas tik kalbos sintaksinėmis taisyklėmis. Paprastos formalios sintaksės, draugiškumo žmogui, išplečiamumo, taip pat Unicode kodavimo, skirto dokumentų turiniui atvaizduoti, derinys leido plačiai naudoti tiek patį XML, tiek daug išvestinių specializuotų kalbų, pagrįstų XML. programinės įrangos įvairovė.

XHTML(Anglų) Ex tempiamasH ypert extM arkupL kalba-- Extensible Hypertext Markup Language) yra XML pagrindu sukurtų tinklalapių žymėjimo kalbų, kurios atkartoja ir išplečia HTML 4 galimybes, šeima. XHTML 1.0 ir XHTML 1.1 specifikacijos yra World Wide Web Consortium rekomendacijos, tačiau jos kūrimas šiuo metu sustojo su rekomendacija naudoti HTML. Naujos XHTML versijos neišleidžiamos.

Pagrindinis skirtumas tarp XHTML ir HTML yra tai, kaip dokumentas apdorojamas. XHTML dokumentus apdoroja jų pačių modulis (analizatorius) taip pat, kaip ir XML dokumentus. Šio apdorojimo metu kūrėjų padarytos klaidos nėra taisomos.

XHTML atitinka SGML specifikaciją, nes XML yra jos poaibis. HTML apdorojimo procese turi daug funkcijų ir iš tikrųjų nustojo priklausyti SGML šeimai, kuri yra įtraukta į HTML 5 specifikacijos projektą.

Naršyklė pasirenka analizatorių, kad apdorotų dokumentą pagal turinio tipo antraštę, gautą iš serverio:

· HTML – tekstas/html

· XHTML – aplikacija/xhtml+xml

· Vietiniam peržiūrai kliente pasirenkamas failo plėtinys.

· Internet Explorer iki 8 versijos nėra analizatoriaus, skirto XHTML dokumentams apdoroti.

WML(Anglų) Belaidžio ryšio žymėjimo kalba-- "belaidžio ryšio žymėjimo kalba") yra dokumentų žymėjimo kalba, skirta naudoti mobiliuosiuose telefonuose ir kituose mobiliuosiuose įrenginiuose, naudojantys WAP standartą.

Struktūra primena kiek supaprastintą HTML, tačiau yra ir esminių skirtumų, nes WML skirtas įrenginiams, kurie neturi asmeninio kompiuterio galimybių (mažas ekranas, ne visi įrenginiai gali rodyti grafiką, mažas atminties dydis ir pan.): visi informacija yra WML formatu vadinamuosiuose „deniuose“ (angl. denis). Dec yra mažiausias duomenų blokas, kurį serveris gali perduoti. Kalėse yra „kortos“ ( kortelę) (kiekvienas žemėlapis ribojamas žymomis Ir). Vienoje kaladėje visada turi būti bent viena korta, tačiau gali būti ir kelios. Tuo pačiu metu įrenginio ekrane bet kuriuo metu rodoma tik viena kortelė, kurią vartotojas gali perjungti sekdamas nuorodas – tai daroma siekiant sumažinti serveriui pateikiamų informacijos užklausų skaičių; tuo pačiu metu WML puslapių dydis neturėtų viršyti 1–4 kilobaitų.

VML(Anglų) Vektoriaus žymėjimo kalba-- vektorinė žymėjimo kalba), kurią Microsoft sukūrė vektorinei grafikai apibūdinti. VML W3C 1998 metais pristatė Microsoft, Macromedia ir kt. Maždaug tuo pačiu metu Adobe, Sun ir kelios kitos kompanijos pateikė dokumentus apie PGML. Abi šios kalbos vėliau tapo SVG pagrindu.

PGML (Tikslios grafikos žymėjimo kalba, laisvai išversta į rusų kalbą – „tiksliosios grafikos žymėjimo kalba“) – XML pagrindu sukurta žymėjimo kalba, naudojama apibūdinti vektorinę grafiką tinklalapyje (schemos, atskiri sąsajos elementai) teksto forma XML formatu, naudoja vaizdo konstravimo modelį. , panašus į PDF ir PostScript. Ją W3C konsorciumui pateikė „Adobe Systems“, IBM, „Netscape Communications“ ir „Sun Microsystems“ 1998 m., tačiau jis nebuvo priimtas kaip rekomenduojama. Beveik tuo pačiu metu „Microsoft“ pateikė svarstyti savo VML projektą, o po metų buvo sukurta pažangesnė SVG kalba, pagrįsta dviejų technologijų idėja. SVG rekomendavo W3C ir jis tapo pagrindiniu vektorinės grafikos aprašymo formatu tinklalapyje.

SVG(iš anglų kalbos S suderinamasV veikėjasG rapsai-- Scalable Vector Graphics) -- Scalable Vector Graphics Markup Language, sukurta World Wide Web Consortium (W3C) ir Extensible Markup Language XML pogrupio, skirta apibūdinti dvimatę vektorinę ir mišrią vektorinę/rastrinę grafiką XML formatu. formatu. Palaiko ir nejudamą, ir animuotą interaktyvią grafiką – arba, kitaip tariant, deklaratyvųjį ir scenarijų. Nepalaiko trimačių objektų aprašymo. Tai atviras standartas, kurį rekomenduoja W3C konsorciumas – organizacija, kuri sukūrė tokius standartus kaip HTML ir XHTML. SVG yra pagrįstas VML ir PGML žymėjimo kalbomis. Sukurta nuo 1999 m.

XBRL(Anglų) eX tempiamasB naudingumasR eksportuojančiųL kalba, liet. Extensible Business Reporting Language yra atviras standartas, skirtas finansinėms ataskaitoms pateikti elektroniniu būdu. XBRL formatas yra pagrįstas išplečiama žymėjimo kalba XML. XBRL naudoja XML sintaksę ir su XML susijusias technologijas, tokias kaip XML vardų sritis, XML schema, XLink ir XPath. Vienas iš XBRL tikslų yra atstovauti ir keistis finansine informacija, pavyzdžiui, įmonės finansinėmis ataskaitomis. XBRL kalbos specifikaciją kuria ir skelbia nepriklausoma tarptautinė organizacija XBRL International, Inc.

Siekiant pagerinti vizualinį žiniatinklio suvokimą, plačiai naudojama CSS technologija, leidžianti nustatyti vienodus daugelio tinklalapių dizaino stilius. Dar viena naujovė, į kurią verta atkreipti dėmesį – URN (angl.) išteklių pavadinimų sistema. Vienodas šaltinio pavadinimas).

Populiari pasaulinio žiniatinklio kūrimo koncepcija yra semantinio žiniatinklio kūrimas. Semantinis žiniatinklis yra esamo pasaulinio žiniatinklio priedas, sukurtas tam, kad tinkle skelbiama informacija būtų suprantamesnė kompiuteriams. Semantinis žiniatinklis yra tinklo sąvoka, kurioje kiekvienas išteklius žmonių kalba būtų pateikiamas su kompiuteriu suprantamu aprašymu. Semantinis internetas atveria prieigą prie aiškiai struktūrizuotos informacijos bet kuriai programai, nepriklausomai nuo platformos ir programavimo kalbų. Programos galės pačios susirasti reikiamus išteklius, apdoroti informaciją, klasifikuoti duomenis, nustatyti loginius ryšius, daryti išvadas ir net pagal šias išvadas priimti sprendimus. Jei semantinis žiniatinklis bus plačiai priimtas ir įgyvendinamas išmintingai, jis gali sukelti revoliuciją internete. Norėdami sukurti kompiuterio skaitomą šaltinio aprašą, semantinis žiniatinklis naudoja RDF (anglų k.) formatą. Išteklių aprašymo sistema), kuris yra pagrįstas XML sintaksė ir naudoja URI ištekliams identifikuoti. Nauji produktai šioje srityje yra RDFS (angl. RDF schema) ir SPARQL (angl. Protokolas ir RDF užklausų kalba) nauja užklausų kalba, skirta greitai pasiekti RDF duomenis.

1998 m. vasario pradžioje tarptautinė organizacija W3C patvirtino Extensible Markup Language (XML) 1.0 specifikaciją, kuri buvo daugelio naujų žymėjimo kalbų, skirtų informacijai perduoti internetu, remiantis XML standartu, kūrimo pradžia. Iš esmės tai reiškė naują žingsnį kuriant hiperteksto žymėjimo kalbas. Per ketverius savo gyvavimo metus XML ne tik sulaukė gana didelio paprastų vartotojų ir daugelio interneto dizainerių dėmesio, bet ir tapo neatsiejama interneto dalimi. Šiandien praktiškai nėra serverių, kurie vienaip ar kitaip nenaudotų šios technologijos kaip HTML analogo. Tačiau dar anksti teigti, kad XML dabar tampa pagrindiniu hiperteksto perdavimo pasauliniu tinklu būdu. Pati kalba dar gana jauna, o kai kurie jos elementai dar tik kuriami. Kol kas sukurtas tik bendras karkasas, kas, ko gero, pakeis HTML ateityje, tačiau kokia konkrečiai forma tai bus, pasakyti kol kas neįmanoma.

Nuo pradžios

1990 m. lapkritį, kai interneto vartotojai pirmą kartą išgirdo apie naują technologiją, kurios pavadinimas nesunkiai tilpo tik į tris raides, beveik niekas negalėjo įsivaizduoti, kad praeis labai mažai laiko ir ši technologija taps praktiškai vieninteliu būdu perduoti informaciją pasaulinis tinklas. Šiandien daugeliui nepatyrusių vartotojų žodis internetas stipriai asocijuojasi su WWW, nors iš tikrųjų šie dalykai, žinoma, yra susiję vienas su kitu, bet vis tiek šiek tiek skiriasi.

Iš esmės būtent neįtikėtinas pasaulinio žiniatinklio ir jo sudedamosios dalies HTML populiarumas neabejotinai tapo priežastimi itin padidėjusio dėmesio dokumentų hipertekstinio žymėjimo struktūroms.

Hiperteksto sąvoką V. Bushas pirmą kartą pristatė dar 1945 m. Tačiau tikros programos, naudojantys tokias duomenų struktūras, pradėtos naudoti tik nuo septintojo dešimtmečio, o tikrai nepaprastas šios technologijos aktyvumo antplūdis prasidėjo tik tada, kai iškilo realus kelių informacijos išteklių sujungimo mechanizmo poreikis, suteikiantis galimybę kurti ir peržiūrėti nelinijinį tekstą. Ir šio mechanizmo įgyvendinimo pavyzdys buvo tas pats WWW.

Pati dokumento žymėjimo kalba yra specialių instrukcijų, vadinamų žymomis, rinkinys (kai kuriuose verstuose leidiniuose žymos vadinamos sparčiaisiais klavišais), skirtos sukurti dokumentų struktūrą ir atitinkamai apibrėžti ryšius tarp įvairių šios struktūros elementų. Žymėjimo kalbos žymos arba valdymo deskriptoriai, kaip jie kartais vadinami, tokiuose dokumentuose užkoduojami labai specifiniu būdu, priskiriami pagrindiniam dokumento turiniui, o tada naudojami kaip instrukcijos programai, kuri interpretuoja ir rodo dokumento turinį. dokumentas, tiesą sakant, asmeniui, kuriam jis žiūrimas, jei bandote rasti analogijų su internetu, tai kažkas yra klientas, o vertimo programa dažniausiai yra naršyklė). Jau pirmosiose sistemose buvo nuspręsta naudoti simbolius "<" и ">“, kurio viduje pateikiami instrukcijų pavadinimai ir jų parametrai. Šiandien šis žymų žymėjimo būdas yra visuotinai priimtas standartas.

Pats tekstinio dokumento hiperteksto skaidymo naudojimas šiuolaikinėse informacinėse sistemose daugiausia susijęs su tuo, kad hipertekstas leidžia sukurti vadinamojo netiesinio informacijos peržiūros mechanizmą. Tai reiškia, kad sistemose duomenys pateikiami ne kaip nenutrūkstamas teksto struktūrų srautas, o kaip tarpusavyje susijusių komponentų rinkinys, kuris naršomas naudojant hipersaitus.

Šiandien populiariausia ir labiausiai žinoma hiperteksto žymėjimo kalba – HTML – buvo sukurta specialiai internete esančiai informacijai struktūrizuoti ir perduoti ir neabejotinai yra pagrindinė WWW technologijos sudedamoji dalis. Naudojant hiperteksto dokumento modelį, tinkle tapo tvarkingesnis įvairių informacijos išteklių pateikimo būdas, vartotojai gavo patogų mechanizmą reikalingos informacijos paieškai ir peržiūrai. Tačiau pirmuoju ženklu šiuo klausimu vis dar laikoma daug senesnė kalba – SGML.

SGML (Standartinė apibendrinta žymėjimo kalba) buvo oficialiai priimta 1986 m. kaip tarptautinis standartas (ISO 8879:1986), apibūdinantis įvesties/išvesties įrenginius ir nuo aplinkos nepriklausomus metodus, skirtus tekstinei informacijai pateikti elektronine forma. Jos sukūrimo pagrindas buvo gana sena žymėjimo kalba GML (Generalized Markup Language), kurią IBM sukūrė dar pirmųjų asmeninių kompiuterių laikais. Tiksliau sakant, SGML yra metakalba, skirta kitoms žymėjimo kalboms apibūdinti.

Iš pradžių žodis žymėjimas paprastai buvo naudojamas apibūdinti anotacijas ar kitus teksto žymėjimus, kurie buvo skirti dokumento autoriui arba „maketuotojui“, kaip kartais vadinama, tiksliai nurodyti, kaip reikia įvesti tam tikrą ištrauką. Tokie metodai gali apimti vingiuotą pabraukimą, nurodantį kursyvą, kai kurias specialias piktogramas, skirtas praleisti tam tikras frazes arba spausdinti jas konkrečiu šriftu ir pan. Laikui bėgant formatavimas ir spausdinimas tapo automatizuoti, šis terminas apėmė visų rūšių specialius žymėjimo kodus, kurie buvo įterpiami į elektroninius tekstinius dokumentus, siekiant valdyti formatavimą, spausdinimą ar kitą apdorojimą.

Taigi žymėjimo kalba reiškia formatavimo konvencijų rinkinį, kuris naudojamas teksto blokams koduoti. Žymėjimo kalba turi aiškiai nurodyti, koks žymėjimas yra priimtinas pateiktame dokumente, koks žymėjimas reikalingas, kaip atskirti jo elementus nuo paprasto teksto ir ką žymėjimas reiškia. SGML sugebėjo išspręsti pirmąsias tris problemas, o paskutinei išspręsti reikėjo neformalaus aprašymo.

SGML, skirtingai nei visos kitos jo pagrindu sukurtos žymėjimo kalbos, vietoj procedūrinio žymėjimo naudoja vadinamojo aprašomojo žymėjimo principą. Tokia sistema naudoja žymėjimo elementus, kurie tiesiog suteikia pavadinimus, kad atskiros dokumento dalys būtų priskirtos tam tikroms kategorijoms. Kitaip tariant, žymės, pvz Arba \end(sąrašas), tiesiog identifikuoja dokumento dalį ir nurodo, kad „ši dalis yra pastraipa“ arba „ši dalis yra pradėto sąrašo pabaiga“ ir pan. Sistema, kuri naudoja procedūrinį žymėjimą (tai apima tekstų rengyklės, pavyzdžiui, Microsoft Word), nustato, koks apdorojimas bus atliktas konkrečiame tekstinio dokumento taške: „šioje vietoje iškvieskite tokią ir tokią procedūrą su 5 parametrais, e ir z“ arba „perkelti dokumento kraštą 7 mm į dešinę bet kurio elemento atžvilgiu, praleisti vieną eilutę, kitą pradėti nuo raudonos linijos ir pan. SGML instrukcijose, kurių reikia norint apdoroti dokumentą tam tikram tikslui (pavyzdžiui, formatavimui), yra aiškiai atskirtos nuo aprašomojo žymėjimo dokumente. Paprastai jie surenkami už dokumento ribų, atliekant atskiras procedūras ar programas.

Naudojant aprašomąjį, o ne procedūrinį žymėjimą, tą patį dokumentą galima apdoroti skirtingomis programomis, kurių kiekviena gali pritaikyti savo apdorojimo instrukcijas toms jo dalims, kurias laiko svarbiomis. Pavyzdžiui, turinio analizės programa gali visiškai nepaisyti išnašų, o formatavimo programa gali jas išskleisti ir surinkti spausdinti kiekvienos dalies pabaigoje. Su ta pačia failo dalimi gali būti susietos skirtingų tipų apdorojimo instrukcijos. Pavyzdžiui, viena programa gali išgauti žmonių vardus ir vietovių pavadinimus iš dokumento, kad sukurtų rodyklę arba duomenų bazę, o kita programa, apdorojanti tą patį tekstą, gali spausdinti vardus kitu šriftu.

SGML taip pat pristato dokumento tipo sąvoką ir atitinkamai jo apibrėžimo būdus (dokumento tipo apibrėžimas, DTD). Dokumentai laikomi atspausdintais, kaip ir kiti kompiuteriu apdoroti objektai. Dokumento tipą formaliai lemia jo sudedamosios dalys ir jų struktūra. Pavyzdžiui, dokumento tipą galima apibrėžti taip, kad jį sudarytų pavadinimas ir galbūt autoriaus vardas, po kurio seka santrauka ir vienos ar kelių pastraipų seka. Bet koks dokumentas, neturintis pavadinimo, pagal šį formalų apibrėžimą, nebus ataskaita, nei pastraipų seka, po kurios eina santrauka, kad ir koks dokumentas būtų panašus į ataskaitą žmogaus požiūriu. skaitytojas..

Kadangi dokumentai yra žinomų tipų, galite naudoti specialią programą, vadinamą analizatoriumi, kad apdorotumėte dokumentą, kuris teigia esąs tam tikro tipo, ir patikrinkite, ar yra ir ar yra visi tam dokumento tipui reikalingi elementai tinkama seka ir teisingai. struktūrizuotas. Dar svarbiau, kad skirtingi tos pačios rūšies dokumentai gali būti tvarkomi vienodai. Galima rašyti programas, kurios naudoja žinias, esančias dokumento informacinėje struktūroje, todėl jos gali būti protingesnės.

SGML, kaip metakalba, leidžia apibrėžti konkrečias kalbas (dažnai vadinamas "SGML programomis"), kurios taikomos konkrečioms programoms. To pavyzdys yra HTML kalba, plačiai naudojama WWW. Kiekviena tokia kalba yra aprašyta DTD forma, apibrėžiant elementus ir jų atributus. Gavus tokį DTD, SGML programinė įranga gali tinkamai apdoroti dokumentus, parašytus pagal tą DTD.

Net projekte ši kalba buvo sukurta specialiai tam, kad būtų įgyvendintas dabartinis informacijos perdavimo pasauliniam tinklui modelis. Kitaip tariant, HTML yra interneto produktas. Nors iš tikrųjų HTML yra supaprastinta standartinės apibendrintos žymėjimo kalbos – SGML (standartinė apibendrinta žymėjimo kalba) versija, kurią ISO patvirtino kaip standartą dar praėjusio amžiaus 80-aisiais. SGTML nėra kalba gryna forma, o tam tikrų taisyklių ir aprašymų rinkinys, skirtas kurti kitas kalbas; jis apibrėžia galiojantį žymų rinkinį, jų atributus ir vidinę dokumento struktūrą. Tinkamo deskriptorių naudojimo kontrolė vykdoma naudojant specialų taisyklių rinkinį, vadinamą DTD aprašymais, kuriuos naudoja kliento interpretatoriaus programa analizuodama dokumentą. Kiekvienai dokumentų klasei yra apibrėžtas atskiras taisyklių rinkinys, apibūdinantis atitinkamos žymėjimo kalbos gramatiką. Naudodami SGML galite tvarkyti dokumentuose esančią informaciją, apibūdinti struktūrizuotus duomenis ir pateikti šią informaciją tam tikru standartizuotu formatu vėlesniam naudojimui. Tačiau dėl tam tikro sudėtingumo SGML daugiausia buvo naudojamas kitų kalbų (iš kurių garsiausia yra HTML) sintaksei apibūdinti, o kelios programos tiesiogiai dirbo su SGML dokumentais.

HTML yra daug patogesnė ir lengviau naudojama kalba nei SGML. Pagal ją negalima apibrėžti papildomų kalbų. HTML naudojimas apima dokumento žymėjimą pagal standartą, kurį apibrėžia gana ribotas instrukcijų ar žymų rinkinys. Tokios instrukcijos pirmiausia skirtos valdyti dokumento turinio rodymo kliento programos ekrane procesą ir taip nustatyti dokumento pateikimo būdą, bet ne bendrą jo struktūrą. Daugeliu atvejų HTML duomenys pateikiami paprasto teksto faile, kurį galima lengvai perkelti tinklu naudojant http protokolą.

Tačiau laikui bėgant ir keliant vis griežtesnius reikalavimus populiariosioms technologijoms, šiuolaikinėms programoms reikia ne tik kalbos duomenų pateikimo kliento ekrane, bet ir mechanizmo, leidžiančio nustatyti dokumento struktūrą ir aprašyti jame esančius elementus. . HTML turi paprastą komandų rinkinį ir gana sėkmingai susidoroja su užduotimi aprašyti tekstinę informaciją ir rodyti ją peržiūros programos – naršyklės – ekrane. Tačiau patys rodomi duomenys niekaip nesusiję su formatavimui naudojamomis žymomis, todėl analizavimo programos neturi galimybės naudoti HTML žymų, kad surastų mums reikalingus dokumento fragmentus. Tie. susidūręs, pavyzdžiui, su tokiu aprašymu

rožė,

Žiūrovas žinos, kokia spalva rodyti tekstą, esantį žymose ir, greičiausiai, parodys jį teisingai, tačiau visiškai nesvarbu, kur dokumente randama ši žyma, į kokias kitas žymas įtrauktas dabartinis fragmentas, ar yra jame įdėtų fragmentų, ar sukurti ryšiai tarp objektų teisingai. Šis „abejingumas“ dokumento struktūrai lemia tai, kad informacijos paieška ar analizė jame niekuo nesiskirs nuo darbo su ištisiniu tekstiniu failu, nesuskaidytu į elementus. Ir tai, kaip žinote, nėra pats efektyviausias būdas dirbti su informacija.

Kitas reikšmingas pačios idėjos, įgyvendintos HTML, trūkumas yra ribotas jos žymų rinkinys. DTD taisyklės HTML apibrėžia fiksuotą deskriptorių rinkinį, todėl kūrėjas neturi galimybės įvesti savo specialių žymų. Nors karts nuo karto atsiranda naujų kalbos plėtinių (šiandien naujausia HTML versija yra HTML 4.0), ilgas kelias iki jų standartizavimo, lydimas nuolatinių nesutarimų tarp pagrindinių naršyklių gamintojų, daro beveik neįmanomas greitai pritaikyti kalbą, jos naudojimą. specializuotos informacijos (pavyzdžiui, daugialypės terpės, matematinių, cheminių formulių ir kt.) atvaizdavimui.

Apibendrinant visa tai, kas pasakyta, galima teigti, kad HTML šiandien visiškai neatitinka šiuolaikinių kūrėjų tokio pobūdžio kalboms keliamų reikalavimų. Ją pakeisti buvo pasiūlyta nauja hiperteksto žymėjimo kalba: galinga, lanksti ir tuo pačiu patogi XML kalba.

XML (Extensible Markup Language) yra žymėjimo kalba, apibūdinanti visą duomenų objektų, vadinamų XML dokumentais, klasę. Ši kalba naudojama kaip priemonė apibūdinti kitų kalbų gramatiką ir kontroliuoti dokumentų teisingumą. Tie. Pačiame XML nėra jokių žymėjimo žymų, jis tiesiog apibrėžia jų kūrimo tvarką. Taigi, jei, pavyzdžiui, manome, kad turėtume naudoti žymą rožių elementui dokumente nurodyti , tada XML leidžia laisvai naudoti mūsų apibrėžtą žymą ir į dokumentą galime įtraukti tokius fragmentus kaip toliau nurodyta:

rožė

Etikečių rinkinį galima nesunkiai išplėsti. Jei, tarkime, taip pat norime nurodyti, kad gėlės aprašymas turi prasmingai patekti į šiltnamio, kuriame ji žydi, aprašymą, tada tiesiog nustatome naujas žymas ir pasirenkame jų pasirodymo tvarką:

rožė

Jei norime ten pasodinti dar keletą gėlių, turime atlikti šiuos pakeitimus:

rožė

tulpė

kaktusas

Kaip matote, XML dokumento kūrimo procesas yra labai paprastas ir mums reikia tik pagrindinių HTML žinių ir supratimo apie užduotis, kurias norime atlikti naudodami XML kaip žymėjimo kalbą. Tai suteikia kūrėjams unikalią galimybę apibrėžti pasirinktines komandas, kurios leidžia efektyviausiai apibrėžti dokumente esančius duomenis. Dokumento autorius sukuria jo struktūrą, sukuria reikiamus ryšius tarp elementų, naudodamas tas komandas, kurios tenkina jo reikalavimus, ir pasiekia tokio tipo žymėjimą, kuris jam reikalingas dokumento peržiūros, paieškos ir analizės operacijoms atlikti.

Kitas akivaizdus XML pranašumas yra galimybė jį naudoti kaip universalią informacijos saugyklų užklausų kalbą. Šiandien W3C gilumoje svarstoma apie darbinę XML-QL (arba XQL) standarto versiją, kuri ateityje gali tapti rimta SQL konkurente. Be to, XML dokumentai gali veikti kaip unikalus duomenų saugojimo būdas, apimantis ir informacijos analizavimo priemones, ir jos pateikimą kliento pusėje. Šioje srityje viena iš perspektyvių sričių yra Java ir XML technologijų integravimas, leidžiantis išnaudoti abiejų technologijų galią kuriant nuo mašinų nepriklausomas programas, kurios taip pat naudoja universalų duomenų formatą informacijos mainams.

XML taip pat leidžia kontroliuoti dokumentuose saugomų duomenų teisingumą, tikrinti hierarchinius santykius dokumente, nustatyti vieningą dokumentų struktūros standartą, kurio turinys gali būti įvairus. Tai reiškia, kad jis gali būti naudojamas kuriant sudėtingas informacines sistemas, kuriose labai svarbus informacijos mainų tarp skirtingų toje pačioje sistemoje veikiančių programų klausimas. Sukūręs informacijos mainų mechanizmo struktūrą pačioje projekto darbo pradžioje, vadovas gali ateityje apsisaugoti nuo daugelio problemų, susijusių su įvairių sistemos komponentų naudojamų duomenų formatų nesuderinamumu.

Taip pat vienas iš XML privalumų yra tai, kad XML dokumentų apdorojimo programos yra paprastos, o šiandien laisvai platinami visi programinės įrangos produktai, skirti dirbti su XML dokumentais. XML šiandien palaikoma visose Microsoft Internet Explorer šeimos naršyklėse, pradedant nuo 4.0 versijos. Buvo paskelbta, kad jis bus palaikomas vėlesnėse Netscape Communicator, Oracle DBMS, DB-2 ir MS-Office programų versijose. Visa tai leidžia manyti, kad greičiausiai artimiausiu metu XML taps pagrindine informacinių sistemų keitimosi informacija kalba, taip pakeisdama HTML. XML pagrindu jau buvo sukurtos gerai žinomos specializuotos žymėjimo kalbos, tokios kaip SMIL, CDF, MathML, XSL, o W3C svarstomų naujų kalbų darbo juodraščių sąrašas nuolat auga.

Kaip atrodo XML dokumentas?

Jei esate susipažinę su HTML, mokytis XML nereikės daug pastangų. Nors XML savo galimybėmis ir tikslais tikrai labai skiriasi nuo hiperteksto žymėjimo kalbos, abi kalbos yra SGML poaibiai, todėl paveldi pagrindinius jos principus.

Dokumento struktūra

Paprastas XML dokumentas gali atrodyti kaip 1 pavyzdys

Pirmas

Antra 1 pastraipa

Trečias

Paskutinis

Atkreipkite dėmesį, kad šis dokumentas labai panašus į įprastą HTML puslapį. Kaip ir HTML, instrukcijos, pateiktos kampiniuose skliaustuose, vadinamos žymomis ir yra skirtos dokumento turiniui pažymėti. XML yra atidarymo, uždarymo ir tuščios žymos (HTML kalba taip pat egzistuoja tuščios žymos sąvoka, tačiau nereikia jokio specialaus žymėjimo).

XML dokumento korpusas susideda iš žymėjimo elementų ir tikrojo dokumento turinio – duomenų (turinio). XML žymės skirtos dokumento elementams, jų atributams ir kitoms kalbos konstrukcijoms apibrėžti. Plačiau apie dokumentuose naudojamus žymėjimo tipus pakalbėsime kiek vėliau.

Bet koks XML dokumentas visada turi prasidėti sakiniu, kurio viduje taip pat galite nustatyti kalbos versijos numerį, kodų lapo numerį ir kitus parametrus, reikalingus analizatoriaus programai analizuojant dokumentą.

XML dokumento kūrimo taisyklės

Paprastai XML dokumentai turi atitikti šiuos reikalavimus:

Dokumento antraštėje yra XML deklaracija, kuri nurodo dokumento žymėjimo kalbą, versijos numerį ir papildomą informaciją.

Kiekviena pradinė žyma, apibrėžianti tam tikrą dokumento duomenų sritį, turi turėti savo uždarymo „partnerį“, t. y., skirtingai nei HTML, uždarymo žymų negalima praleisti.

XML yra didžiosios ir mažosios raidės.

Visos žymų apibrėžimuose naudojamos atributų reikšmės turi būti pateiktos kabutėse.

Žymų įdėjimas į XML yra griežtai kontroliuojamas, todėl būtina stebėti žymų atidarymo ir uždarymo tvarką.

Visa informacija tarp pradžios ir pabaigos žymų yra traktuojama kaip duomenys XML formatu, todėl atsižvelgiama į visus formatavimo simbolius (ty tarpai, eilučių lūžiai, tabuliacijos neignoruojami kaip HTML).

Jei XML dokumentas nepažeidžia aukščiau nurodytų taisyklių, tada jis vadinamas formaliai teisingu ir visi analizatoriai, skirti analizuoti XML dokumentus, galės su juo tinkamai dirbti.

Tačiau, be formalaus atitikties kalbos gramatikai, dokumente gali būti ir dokumento turinio kontrolės priemonių, taisyklių, kurios nustato būtinus ryšius tarp elementų ir formuoja dokumento struktūrą, laikymosi. Pavyzdžiui, šis tekstas, nors ir visiškai tinkamas XML dokumentas, bus visiškai beprasmis:

Rusija Novosibirskas</country>

Siekiant užtikrinti, kad būtų patikrintas XML dokumentų teisingumas, būtina naudoti tokį patikrinimą atliekančius analizatorius, kurie vadinami tikrintojais.

Šiandien yra du pagrindiniai būdai kontroliuoti XML dokumento teisingumą: DTD apibrėžimai (Document Type Definition) ir duomenų schemos (Semantinė schema). Daugiau apie DTD ir schemų naudojimą pakalbėsime kitą kartą. Skirtingai nuo SGML, DTD taisyklių apibrėžti XML formatu nebūtina, ir ši aplinkybė leidžia mums sukurti bet kokius XML dokumentus, nekraipydami smegenų dėl gana sudėtingos DTD sintaksės.

Pagrindinis principas

Elementas yra pagrindinis XML dokumento struktūrinis vienetas. Žodžio rožė įtraukimas į žymes , apibrėžiame netuščią elementą, vadinamą , kurio turinys yra rožė. Bendruoju atveju elementų turinys gali būti tiesiog koks nors tekstas, arba kiti įdėtieji dokumento elementai, CDATA skyriai, apdorojimo instrukcijos, komentarai, t.y. beveik bet kuri XML dokumento dalis.

Bet kokį netuščią elementą turi sudaryti pradžios žyma, pabaigos žyma ir tarp jų esantys duomenys.

Visų elementų rinkinys, esantis dokumente, apibrėžia jo struktūrą ir nustato visus hierarchinius ryšius. Naudojant elementus, plokščias duomenų modelis paverčiamas sudėtinga hierarchine sistema su daugybe galimų ryšių tarp elementų.

Vėliau ieškodama dokumento kliento programa remsis į jos struktūrą įdėta informacija – naudodama dokumento elementus. Tie. jei, pavyzdžiui, norite rasti tinkamą universitetą reikiamame mieste, turėsite peržiūrėti konkretaus elemento turinį esantis konkretaus elemento viduje . Natūralu, kad paieška šiuo atveju bus daug efektyvesnė nei norimos sekos paieška visame dokumente.

XML dokumente, kaip taisyklė, yra apibrėžtas bent vienas elementas, vadinamas šaknimis, ir analizatoriai pradeda skenuoti dokumentą nuo šio elemento. Pateiktame pavyzdyje šis elementas yra .

Kai kuriais atvejais žymos gali pakeisti ir patikslinti tam tikrų dokumento fragmentų semantiką, skirtingai apibrėždamos tą pačią informaciją ir taip šį dokumentą analizuojančiai programai suteikdamos informaciją apie aprašytų duomenų naudojimo kontekstą. Pavyzdžiui, perskaičius fragmentą Holivudas, galime spėti, kad ši dokumento dalis yra apie miestą, bet fragmente Holivudas– apie užkandinę.

Išvada

Tinklalapio formatavimo kalba HTML iš pradžių buvo pristatyta kaip SGML programa. Vėliau, sparčiai tobulėjant WWW, HTML ėmė visokeriopai plėstis, kad autorius galėtų labiau kontroliuoti išorinį informacijos pateikimą. Nauji elementai ir atributai, pvz arba , orientuota į vizualinį formatavimą. Atsirado ir buvo pradėti aktyviai naudoti įrankiai, kurie nėra pačios žymėjimo kalbos dalis: vaizdų žemėlapiai, Java ir JavaScript, papildiniai ir kt. Taip pat yra daug HTML elementų, kuriuos palaiko tik tam tikros naršyklės arba kurie skirtingose ​​naršyklėse veikia skirtingai. Todėl dabar sunku pasakyti, ar HTML yra SGML programa, ar ne. Labai nedaug puslapių sukuriami pagal HTML specifikacijas ir atitinkamus DTD.

Šią problemą iš dalies siekiama sumažinti naudojant pakopinius stilius, kurių standartą priėmė W3 konsorciumas. CSS1 atskiria stilių, apibrėžiantį vaizdinę elementų išvaizdą, nuo elemento žymėjimo.

Labai domina XML kalba, kuri turėtų pakeisti HTML kaip tinklalapių žymėjimo kalbą. Tai SGML variantas, pirmiausia skirtas naudoti WWW. Tam nereikia DTD, o pati kalba yra supaprastinta dėl retai naudojamų sudėtingų struktūrų. Tai padarys analizatorius paprastus, o tai leis aktyviai naudoti XML naršyklėse. (To tikimybė yra gana didelė, atsižvelgiant į abiejų pagrindinių naršyklės žaidėjų linktelėjimą į XML).


SPAUSDINTA VERSIJA>>
Skaitytas straipsnis:kartą.