Az adatmennyiség definíciója
Az adatmennyiség az egyik legegyszerűbb fogalom az informatikában, mégis könnyű összetéveszteni az információmennyiség fogalmával. Ennek oka, hogy mindkét mennyiség mértékegységét bit-tel jelöljük.
Az adatmennyiség az a mennyiség, mérőszám és mértékegység, amely a jelek számát méri valamely alapul választott jelrendszerben és ennek megfelelő mértékegységben. Szokásos egysége a bit (binary digit), amely egy darab bináris jel adatmennyisége.
A bináris jel a mai digitális kultúrában jól ismert jelfajta. A bináris jel olyan jel, amelyből (definíciószerűen) kétféle van. Például + és – , pont és vessző, sötét pont és világos pont, 0 és 1 a kettes számrendszerben, igaz és hamis a bináris logikában, és sorolhatnánk a végtelenségig, különösen, ha a technikai jelekre is gondolunk.
A bit természetes egységnek tekinthető. Természetesen adódik a nulla pont is, nevezetesen a (bináris) jel hiánya. Végül a mennyiség skálája is kézenfekvő, hiszen a mennyiség értéke a bináris jelek száma. Nyilvánvaló, de mégis érdekes, hogy az adatmennyiség nem lehet tetszőleges valós szám, csak pozitív egész, ill. nulla.
Megjegyzés. A fizikában is léteznek természetes egységek. Az elméleti fizikusok ilyennek tekintik például a fénysebességet, a Planck-féle hatáskvantumot, az elektron töltését stb. Létezik természetes nulla pont is. Például a hőmérséklet abszolút zéruspontja ilyen kitüntetett állapot. A kvantummechanika felfedezései óta ismert, hogy a fizikai mennyiségek jelentős része kvantumos természetű. (Ez távolról emlékeztet arra, hogy az adatmennyiség mindig egész szám, de ennek nem tulajdonítunk különösebb jelentőséget.)
Egy tetszőleges szám ábrázolható kettes számrendszerben is, aminek az adatmennyisége annyi bit ahány bináris számjegyet használunk az ábrázolására. Lásd a konkrét számábrázolásokat a számítástechnikában.
A karakterek digitalizálása (kódolása) esetében a jelrendszerben használatos minden karakternek egy bináris számot kell megfeleltetni. Ha ezek a számok azonos darabszámú számjegyet tartalmaznak, akkor a kódot blokk-kódnak nevezzük. Például a jól ismert (kiterjesztett) ASCII kódtáblázat is hasonló hozzárendelés, megadja, hogy a különböző karaktereknek (betűknek, számjegyeknek, írásjeleknek ...) milyen nyolc bites egész számok felelnek meg, 0-tól 255-ig. Általában, ha a karakterkészlet N darab különböző karakterből áll, akkor (blokk-kód esetében) a kódbitek száma kettes alapú logaritmus N egész része plussz 1. Ennyi bináris számjeggyel kódolunk minden egyes karaktert. Például 26 féle karakter esetében Int(log2(26))+1=4+1=5.
A fenti gondolat igaz véges számú (N) tetszőleges diszkrét jelekből álló jelkészletre is. E jelek lehetnek például ikonok, piktogramok, jelzőtáblák, zászlójelek, füttyjelek, szavak ... a lényeg, hogy jól elkülönülő (különálló) azaz diszkrét jelek legyenek. Tulajdonképpen a diszkrét jelek véges (N) számú készlete, kis túlzással már digitális jelkészletnek tekinthető.
Az adatmennyiség azért tekinthető informatikai szempontból hasznos fogalomnak, mert gyakorlatilag mindenféle jel átalakítható digitális jellé, amely bináris egységekben már egyszerűen mérhető. Természetesen meg kell adni a digitalizálás paramétereit, (például hang esetében a mintavételi frekvenciát és a kvantálási szintek számosságát) ezek arra jellemzőek, hogy az eredeti analóg jelnek milyen hűen felel meg a digitálizált változata.
Tulajdonképpen itt arról van szó, hogy egy térbeli vagy időbeli tetszőleges folytonos, folyamatos jelet (például egy ceruzarajzot vagy éneket) N féle és megfelelően sok darab elemi jellé bontunk, amelyek együtt jól közelítik az eredeti jelet és (jó közelítéssel) diszkrét jeleknek tekinthetőek és így számokkal könnyen kódolhatóak.
A számok és általában a jelek, digitális ábrázolása különböző pontossággal történhet. Ha nagyobb pontosságot kívánunk, az több adatmennyiséget eredményez a digitális változatnál (ugyanolyan digitalizáló eljárást feltételezve). Szerencsére a műszaki gyakorlatban, mindig találhatunk egy megfelelő pontosságú, de nem túl sok bitet használó számábrázolást, illetve általánosabban fogalmazva jelkódolást.
Az adatmennyiségnek gyakran használt nagyobb egysége a byte (röviden B): 1 byte = 8 bit.
(Az eredeti, ma már kevéssé használt felfogás szerint 1 byte lehet 8-nál több vagy kevesebb, de adott számú bit is.) Amikor egy memória kapacitását vagy egy fájl, adatmennyiségét adjuk meg, általában ennél nagyobb egységeket használunk, például KiB, MiB.
(Az informatikában célszerű bináris prefixumokat alkalmazni. Ezek 2 hatványaiként fejezhetők ki. Az IEC ajánlása szerint az elnevezésük kibi jele Ki=2^10, mebi jele Mi=2^20, gibi jele Gi=2^30, tebi jele Ti=2^40. Részletesebben megtalálható például a Wikipédia byte szócikkénél.)
Végh András
Ez az írás a szerző és a hely feltüntetésével szabadon felhasználható.
{CC-BY-ND-3.0}
Felhasznált források
Végh András, Számítástechnika (12-13 éveseknek), 22. oldal, Műszaki Könyvkiadó, Budapest, 1997., ISBN 963 16 1292 9
Devecz Ferenc – Juhász Tibor - Makány György – Végh András, Informatika 9, 30-43. oldal, Nemzeti Tankönyvkiadó, Budapest, 2005., ISBN 963 19 5563 X
Négyjegyű függvénytáblázatok, összefüggések és adatok, Nemzeti Tankönyvkiadó, Budapest, 2004., ISBN 963 19 3506 X