* počítačové znalosti >> Softvér >> Kompresia dát >> .

Ako je súbor počítača zip s množstvom informácií?

Počítač zipsuje súbor (alebo zbierku súborov) obsahujúci veľa informácií pomocou algoritmov bezstratových kompresov . Tieto algoritmy fungujú tak, že identifikujú a odstránia redundanciu v údajoch bez straty ktorejkoľvek z pôvodných informácií. Keď rozbalíte súbor, pôvodné údaje sú dokonale zrekonštruované.

Tu je rozpis procesu:

1. Detekcia redundancie: Kompresný algoritmus analyzuje údaje, hľadá opakujúce sa vzorce, sekvencie podobných údajov alebo predvídateľné informácie. Napríklad textový súbor môže mať veľa opakovaných slov alebo fráz, obrázok môže mať veľké oblasti podobnej farby a program môže mať bloky opakujúceho sa kódu.

2. Transformácia údajov: Po identifikácii redundancie algoritmus transformuje údaje na kompaktnejšiu reprezentáciu. To často zahŕňa techniky ako:

* Run-Dengthing Coding (RLE): Nahrádza opakované sekvencie znakov alebo bajtov počtom a opakovaným prvkom. Napríklad „AAABBBCC“ sa stáva „3A3B2C“.

* Huffman Coding: Priraďuje kratšie kódy častejším dátovým prvkom a dlhším kódom menej častým. To znižuje celkovú veľkosť údajov.

* Slovník kódovanie (LZ77, LZ78, Lempel-Ziv): Zostavuje slovník predtým vyskytovaných dátových sekvencií. Namiesto opakovaného ukladania sekvencie algoritmus odkazuje na vstup sekvencie v slovníku, čo výrazne znižuje redundanciu. Toto je základná súčasť mnohých populárnych kompresných algoritmov, ako je deflate (používaný v zipsu).

* Burrows-Whoeler Transformácia (BWT): Znovu zopakuje údaje, aby vytvorili dlhé zjazdovky podobných znakov, čo uľahčuje efektívnu prácu iným kompresným technikám. Používa sa v algoritmoch ako BZIP2.

3. Kódovanie údajov: Transformované údaje sa potom kódujú v binárnom formáte, často vrátane hlavičky, ktorá obsahuje metadáta, ako sú pôvodné názvy súborov, veľkosti, časové pečiatky a použitá metóda kompresie.

4. Komprimované údaje vrátane hlavičky sú zapísané do súboru ZIP.

Prečo je to efektívne s veľkými súborom?

Čím viac údajov je, tým je pravdepodobnejšie, že bude obsahovať redundanciu. Kompresné algoritmy sú vysoko účinné pri využívaní tejto redundancie. Veľký súbor pravdepodobne bude mať veľa opakujúcich sa vzorcov alebo predvídateľné sekvencie, čo umožňuje významné zníženie veľkosti. Napríklad veľký textový súbor obsahujúci opakovanú frázu bude komprimovať oveľa efektívnejšie ako krátky, jedinečný textový súbor.

Stručne povedané, zapnutie súboru magicky nezmenšuje obsah * Informácie *, iba robí * efektívnejšiu * reprezentáciu týchto informácií odstránením redundancie. Čím väčšia redundancia, tým väčší je kompresný pomer.

Predchádzajúca strana: Aký typ súboru obrazu už bol komprimovaný?
Ďalšia strana: Čo je dátové marshalling?

Ako je súbor počítača zip s množstvom informácií?

Odporúčané články

Najnovšie články

Kompresia dát