![]() | Počítač je jako politický činitel na státní návštěvě, který má číst projev v jazyce kterému vůbec nerozumí. Nadpisy, odstavce a interpunkční znaménka jsou jediné body, kterých se zmatená a trémou ztrápená mysl může přidržet. Naše stroje sice trémou netrpí, ale ... |
Mezi počítačovým a jiným zápisem textu existuje jeden zásadní rozdíl - u mechanického (bráním se slovu analogový) zápisu je předem jasné, jak bude text prezentován, u elektronického dokumentu je např. možné že bude interpretován hlasovou čtečkou, jakou používají nevidomí. Toto je první důvod proč se zabýváme sémantikou elementů textu - použijeme-li formátovací prvek, který je sémanticky neutrální, nebude mít žádné uplatnění při interpretaci na zařízení bez možnosti vizuálního formátování.
![]() | To že ve zobrazeném (tištěném) textu přebírají sémantické elementy vlastnosti elementů čistě formátovacích hraje důležitou roli - zatímco v prezentační úloze mohou sémantické elementy zastoupit elementy formátovací, v úloze narativní jsou sémantické elementy nezastupitelné |
Sémantika je jedním z pohledů na informační struktury a je určující při dalším vrstvení informací - větvení, násobení úložišť, redundance (nikoli na úrovni binární informatiky). Sémanticky hodnotné elementy jsou použitelné např. pro automatické rešerše. Hodnocení sémantické hodnoty elementů a odhad důveryhodnosti zdroje patří k základním pilířům tvorby systémů postavených na bázi popisovaných zdrojů - tedy metainformací. Kromě elementů které jsou sémantické (chcete-li samopopisné) implicitně, nabývají na významu i další elementy (jazykové jednotky) - svým použitím a začleněním do struktury. Toto je druhý důvod a tím se budeme zabývat dále.
Z našeho pohledu je zajímavý moment, kdy se z pouhého textu, zápisu jazyka, stává informace - z jazykové jednotky jednotka informační. Tehdy se stává že některé textové elementy - skutečné i ty logické (whitespaces jsou v analogovém světě čistě "technickými" znaky, zatímco ve světě diskrétních textů mají své číslo ve znakové sadě a dají se vyhledat a nahradit) přebírají nové funkce a získávají nový význam, jiné naopak význam pozbudou.
Jako obsahové (sémantické) se jeví ty elementy, které vytvářejí kontejnery - nenechte se ovšem mýlit , sémantika elementů není podmíněna nějakým objektovým modelem - byla zde vždy. Struktura tištěného dokumentu je přímo určena rozvržením textu na médiu o předem známém formátu (A4 např.). Jediným způsobem konzumace (interpretace) tištěného textu je - přečíst ho.
Dokument na papíře obsahuje jenom znaky, které jsou vidět (printable). Naproti tomu - počítačový dokument obsahuje i takové znaky, které suplují chování vozíku psacího stroje - přeskok o znak - mezerník, přeskok o zarážku - tabulátor a návrat vozíku - konec řádku.
Na psacím stroji je mezerník běžná (a jediná pomůcka) na tvorbu asymetrických horizontálních mezer. V počítačové praxi je mezerník určen pouze pro tvorbu mezery mezi slovy o délce jednoho znaku. Znak konce odstavce přirozeně vytváří datový kontejner (odstavec - který ve 2D zobrazení může být interpretován jako blokový). Naproti tomu - tabulátor je znak, který ztratil své uplatnění v okamžiku kdy text migroval z papírového média na obrazovku (počítače, či mobilního telefonu) o rozměrech které předem neznáme. Byl vytlačen skutečnými tabulkami, jichž byl doteď náhražkou a v textových dokumentech bychom se s ním setkávat neměli.
Tabulátor je tedy znak, který sice může mít podíl na strukturálním členění textového dokumentu, je však "prezentačně nezpůsobilý", významově bezobsažný a svou podstatou kolizní (z tohoto důvodu také prohlížeče www tabulátor ignorují), je v podstatě pouhou typografickou - nikoli jazykovou - jednotkou. Mnohem zajímavější je pro nás buňka tabulky, jejíž povaha kontejneru je naprosto zřetelná, nám i stroji. A je zajímavá nejen jako kontejner - buňka má totiž naprosto zřetelný význam i jako jazyková jednotka - přesto že to někteří odborníci (a konsorcium W3C) popírají. Stroj jednoznačně určí její poslání.
![]() | Stroji je to ovšem jedno - zatímco můžeme chtít po akustické čtečce, aby ignorovala prázdpou buňku, můžeme naopak chtít, aby např. za koncem odstavce udělala krátkou pomlku. Jak krátkou, a jak dlouhá by byla, pokud pisatel textu použije 15 prázdných odstavců pro mezeru? A co teprve u sémanticky plnohodnotných elementů. Pokud bychom za sebou zanechali v textu několik prázdných elementů STRONG, mohla by se čtečka významně odmlčet... |
![]() | Z hlediska našeho dalšího zkoumání - zrcadlení obsahu v metainformacích - jsou právě tyto elementy s proměnlivou sémantickou hodnotou nejzajímavější. Uvědomte si že pojmenovaný element zdroje na který se odkazujeme ze zdroje jiného nabývá na významu ve všech ohledech. |
