De technische kant van een ePUB

Wat is nu eigenlijk een ePUB? Hoe zit het in elkaar? In deze post zal ik dit uit de doeken doen. Een ePUB bestand is een container. In deze container zitten allemaal bestanden die samen het boek vormen. Denk hierbij aan hoofdstukken, stijlenbestanden, afbeeldingen en nog meer. Deze container is eigenlijk een ZIP-bestand, maar wel een speciale. De opbouw van dit bestand moet op een speciale manier gebeuren. Zo moet een specifiek bestand het eerste bestand zijn en deze mag niet gecomprimeerd (verkleind) worden. De volgorde en compressie voor de andere bestanden is geen probleem.

Nu de structuur van het ePUB bestand. Sommige bestanden moeten aanwezig zijn en andere kunnen aanwezig zijn.

  • mimetype – Dit verteld de reader/leesprogramma wat dit is.
  • META-INF map – Deze map bevat standaard maar een bestand. Echter, voor het Apple iBooks programma moeten hier soms ook andere bestanden ingezet worden. Dit is echter niet volgens de standaard.
    • container.xml – Dit bestand verteld de software waar het boek te vinden is.
  • OEBPS map – Deze map bevat alle andere bestanden. Dit is de aanbevolen mapnaam, maar mag afwijken. De mapnaam OPS wordt ook wel aangetroffen.
    • Images map – niet verplicht, wel aanbevolen. Uiteraard zou dit dan de afbeeldingen bevatten.
    • Text map – niet verplicht, wel aanbevolen. Dit zou de tekstbestanden bevatten.
    • Style – niet verplicht, wel aanbevolen. Dit zou de stijlenbestand(en) bevatten.
    • content.opf – XML bestand die een lijst bevat van alle bestanden in het zip bestand. Ook bevat dit bestand metadata en andere stuurgegevens. Een fout in dit bestand kan ervoor zorgen dat het boek niet meer leesbaar is.
    • toc.ncx – Dit bestand kun je beschouwen als een inhoudsopgave. Veel readers zullen deze ook gebruiken als inhoudsopgave.
    • xhtml bestanden – Deze bevatten werkelijk de bestanden die het boek vormen, zoals hoofdstukken.

Een waarschuwing is op zijn plaats. De bestandsnamen zijn hoofdlettergevoelig. Zo is het bestand ‘Hoofdstuk1.html’ een ander bestand als ‘hoofdstuk1.html’. Dat moet dus we correct zijn in het content.opf en toc.ncx bestand.

Toxaris © 2015 Frontier Theme