Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
* Formát textu: Plain textový súbor (napríklad `.txt`) bude oveľa menší ako formátovaný súbor (napríklad` .doc`, `.docx`,` .pdf` alebo epub). Formátované súbory obsahujú ďalšie údaje pre veci, ako sú štýly písma, obrázky, zlomy stránok atď.
* Kódovanie: Kódovanie znaku (napr. ASCII, UTF-8, UTF-16) ovplyvňuje počet bajtov na znak. UTF-8 je kódovanie s premenlivou dĺžkou, čo znamená, že niektoré znaky berú viac bajtov ako iné.
* Konkrétna kniha: Rôzne vydania tej istej knihy môžu mať mierne odlišné dĺžky.
Urobme niekoľko rozumných predpokladov:
* dĺžka: Kniha Harryho Pottera je zhruba 300 000 slov.
* znaky na slovo: Predpokladajme priemerne 5 znakov za slovo (vrátane priestorov).
* bajty na znak: Pomocou UTF-8 predpokladáme v priemere 1 bajt na znak (toto je zjednodušenie; niektoré znaky vyžadujú viac).
Výpočet:
1. Celkové znaky: 300 000 slov * 5 znakov/slovo =1 500 000 znakov
2. Celkový bajt (obyčajný text): 1 500 000 znakov * 1 bajt/znak =1 500 000 bajtov (približne 1,5 MB)
Toto je však * veľmi * nízky odhad. Formátovaná elektronická kniha (napríklad EPUB) alebo naskenovaný PDF tlačenej knihy budú výrazne väčšie v dôsledku zahrnutia informácií o formátovaní, obrázkoch (ilustrácie) a potenciálne vložených písma. PDF môže byť ľahko 5-10 MB alebo ešte viac, zatiaľ čo epub môže byť okolo 2-5 MB.
Preto by primeraný odhad knihy Harryho Pottera v spoločnom digitálnom formáte bol medzi 2 a 10 MB .