Chemická informatika

Kapitola 25. Publikování

1. Datové publikační formáty

1.1. Texty

1.1.1. PDF

Adobe Portable Document Format. De facto standard, otevřený formát.

Výhody:

  • "Vše v jednom" (dokument = 1 soubor). Obsahuje texty i obrázky.

  • Vhodný např. k archivaci nebo k zaslání informací "jen pro čtení".

Nevýhody:

  • binární formát

  • velikost (bývají např. přibaleny fonty apod.)

  • prohledávání není úplně snadné, k editaci jsou nutné speciální nástroje

Další vlastnosti:

  • lze šifrovat

  • povolit pouze určité operace (např. zakázat tisk, úpravy, ...)

1.1.2. PostScript

(Programovací) jazyk pro popis stránky. Využíván hlavně v elektronickém a DTP publikování.

"PostScriptové" tiskárny obsahují interpreter, který výrazně snižuje zatížení procesoru počítače při tisku.

Dnes často nahrazován formátem PDF.

1.1.3. HTML

HyperText Markup Language. Standard W3C (otevřený, zdarma)

Výhody:

  • textový formát

  • snadná editace v jakémkoli textovém editoru

  • strukturovaný text ideální pro prohledávání

Nevýhody:

  • Nevhodné pro věrný tisk (každý prohlížeč tiskne jinak, problémy s fonty)

  • Ne zcela jednoduché uložení kompletního dokumentu (obrázky jsou často odkazovány apod.).

Další vlastnosti:

  • obrázky a další objekty (např. multimediální data) jsou uloženy "vedle"

Ukázka kódu HTML:

<html>
 <head><title>Demo page</title></head>
 <body>
  <p>Hello world!</p>
 </body>
</html>

1.2. Datový formát umožňující i sémantický popis: XML

Extensible Markup Language

  • standard W3C (otevřený, zdarma)

  • textový formát

  • striktnější než HTML, použití pro sdílení dat i dokumentů

Ukázka dat uložených v XML:

<SeznamKnih>
 <Titul>
  <Zahlavi>FOGLAR, Jaroslav</Zahlavi>
  <Nazev>Rychlé šípy 1</Nazev>
  <OCH>A4</OCH>
  <Rok>1991</Rok>
  <Signatura>AA 30530/1</Signatura>
  <Druh>kniha</Druh>
 </Titul>
</SeznamKnih>

1.3. Grafika

1.3.1. Grafika — základní pojmy

  • bitmapa, bitová mapa, rastrová grafika — obrázek popsán pomocí jednotlivých barevných bodů (pixelů).

  • vektorová grafika — obrázek definován jako křivky, kružnice, úsečky, elipsy, ...

  • pixel — nejmenší jednotka rastrové grafiky

  • DPI = dots per inch — udané rozlišení v počtu bodů (pixelů) na inch. Typické hodnoty:

    • běžné monitory: 72 dpi, 96 dpi

    • běžné kancelářské tiskárny: 150 dpi, 300 dpi, 600 dpi

    • lepší laserové tiskárny: až 1800 dpi

Obrázek 25.1. Ukázka obrázku typu 'bitmapa'

Ukázka obrázku typu 'bitmapa'

Tabulka 25.1. Rozdíl mezi rastrovou a vektorovou grafikou

ZoomRastrová grafikaVektorová grafika
100 %
200 %
400 %
800 %

1.3.2. Grafické datové formáty používané v publikační činnosti

Tabulka 25.2. Přehled nejběžnějších grafických datových formátů používaných v publikační činnosti

PrincipFormátTypická příponaPozn.Hlavní využití
BitmapovéJPEGjpeg, jpgJPEG = Joint Photographic Experts Group. Typická ztrátová komprese.Fotografie
PNGpngPNG = Portable Network Graphics, též PNG is Not Gif. Vznikl jako svobodná varianta reakcí na vymáhání poplatků za užívání formátu GIF. Barvy: 24-bit RGB color. Bezztrátová komprese.Schémata, kresby, grafy s popiskami.
GIFgifGIF = Graphics Interchange Format. Omezení počtu barev v obrázku.Podobně jako PNG.
TIFFtiff, tifTIFF = Tagged Image File Format. Může kombinovat ztrátovou i bezztrátovou kompresi, částečně používat i vektorovou grafiku.Bezztrátové uložení bitmapových dat (např. scanovaných) pro další zpracování (grafické úpravy, sazba).
VektorovéEPSepsEPS = Encapsulated Post ScriptSazba — grafy, schémata, kreslené obrázky.
SVGsvg, svgz (komprimovaný)SVG = Scalable Vector Graphics.Zatím zejména pro WWW. Založen na XML.

Vektorové formáty mají obvykle mechanismy pro vkládání bitmapových obrázků.

1.3.3. Ukázka vektorového formátu

Ukázka obrázku v SVG formátu (černý obdélník):

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<svg
   xmlns:svg="http://www.w3.org/2000/svg"
   xmlns="http://www.w3.org/2000/svg"
   version="1.0"
   width="744.09448"
   height="1052.3622"
   id="svg2">
  <defs
     id="defs4" />
  <g
     id="layer1">
    <rect
       width="262.85715"
       height="160"
       x="120"
       y="140.93361"
       style="fill:none;fill-opacity:0.75;stroke:black;stroke-width:8;stroke-opacity:1"
       id="rect1872" />
  </g>
</svg>

Ukázka obrázku ve formátu EPS (černý obdélník):

%!PS-Adobe-3.0 EPSF-3.0
%%Creator: inkscape 0.44.1
%%Pages: 1
%%Orientation: Portrait
%%BoundingBox: 92 597 310 733
%%HiResBoundingBox: 92.8 597.94286 309.48572 732.34286
%%DocumentMedia: plain 596 842 0 () ()
%%EndComments
%%Page: 1 1
0 842 translate
0.8 -0.8 scale
gsave [1 0 0 1 0 0] concat
0 0 0 setrgbcolor
[] 0 setdash
8 setlinewidth
0 setlinejoin
0 setlinecap
newpath
120 140.93361 moveto
382.85715 140.93361 lineto
382.85715 300.93361 lineto
120 300.93361 lineto
120 140.93361 lineto
closepath
stroke
grestore
showpage
%%EOF

1.3.4. Porovnání vhodnosti rastrových formátů

Zdrojový obrázek:

Export do PNG (detail):

Export do JPEG (detail):

1.3.5. Ztrátovost komprese ve formátu JPEG

KvalitaVelikost v KB 
původní75 KB
0.5036 KB
0.2523 KB
0.1012 KB
0.057.2 KB

1.4. Cvičení

  • Najděte článek: M. R. Eden, S. B. Jørgensen, R. Gani and M. M. El-Halwagi, A novel framework for simultaneous separation process and product design, Chemical Engineering and Processing, Volume 43, Issue 5, May 2004, Pages 595-608. v digitální podobě.

  • Uložte na disk lokální kopii HTML verze.

  • Uložte na disk lokální kopii PDF verze.

  • Pokuste se pomocí textového editoru (notepad) změnit nadpis v obou verzích. Srovnejte.

2. Způsob a forma publikování

2.1. Současná forma publikování

  • Přechod od čistě tištěných verzí na elektronické

  • Problémy elektronických verzí:

    • Časopisy již nejsou fyzicky v knihovně

    • Jak archivovat - např. JSTOR, "moving wall"

    • Placení (každoročně vs. jednou pro vždy)

2.2. Problém stažení článku

3. Preprint servery

3.1. Co je preprint?

Článek zveřejněný před formálním publikováním v peer-reviewed časopisu, převážně po peer-review procesu.

3.2. Výhody preprintu

  • Rychlejší šíření informací širšímu publiku

  • Lepší archivace vědeckých dat

  • Rychlejší komunikace mezi výzkumem a průmyslem

  • Rychlejší publikační čas

3.3. Problémy preprintu

  • Zajištění kvality

  • Někteří vydavatelé nedovolují preprinty (např. ACS)

  • Problém s copyrightem a plagiátorstvím

3.4. Otázky kolem preprint serverů

  • Archivace

  • Zajištění kontinuity

  • Jak sledovat revize jednotlivých článků?