Az adat
Az informatika egy tudományág, ami az adatok feldolgozásával és az adatokból kinyerhető információ kezelésével foglalkozik. Manapság az informatika szó szorosan összefügg a számítógépek használatával, és ebben a fejezetben mi is ebből a szemszögből közelítjük meg az adathoz kapcsolódó ismereteket.
Adat és információ
Adatnak nevezzük egy objektum egy tulajdonságának állapotát. Vegyük egyszerű példának az embert! Minden ember egy önálló objektum, ami tulajdonságokkal rendelkezik. Mindenkinek van magassága, hajszíne, neve, életkora, stb. Így lesz adat például a barna hajszín vagy a 170 cm-es magasság.
Az információ az adathoz társított jelentés. Ebből két dolog következik. Egyrészt ugyanaz az adat két különböző személynek nem biztos, hogy ugyanazt az információt hordozza. Az előző példánál maradva, a "Tamás" név egy adat. Ez az adat viszont nem ugyanazt az információt jelenti Andinak, aki szerelmes Tamásba, és Bélának, aki Tamás ellenfele volt a focimeccsen.
Másrészt lehet, hogy ugyanaz az adat az egyik személy számára hordoz információt, a másik számára viszont nem. Ha Dénes nem ismeri Tamást, akkor számára az az adat, hogy Tamás milyen méretű cipőt hord, nem információ.
Adatmennyiségek
A Neumann-elvek alapján tudjuk, hogy a számítógép kettes számrendszerben működik. Ez azt jelenti, hogy az adatok feldolgozását, tárolását és továbbítását is kettes számrendszerbeli számokra alakítva végzi.
Az informatikában az adatmennyiség legkisebb mértékegysége a bit. A bit szó az angol binary digit, magyarul kettes számrendszerbeli számjegy kifejezés rövidítése. Mivel a kettes számrendszerben összesen kétféle számjegyünk van, így a bit értéke is csak 0 vagy 1 lehet.
Átváltás
A bit manapság használt legkisebb többszöröse a byte (kiejtés: bájt). A bit rövidítése a kis "b" betű, a byte rövidítése a nagy "B" betű. A történlem során több váltószám is létezett, de végül az 1 byte = 8 bit vált szabványossá. Emelett a bitnek léteznek más többszörösei is, például a nibble (4 bit), a blokk vagy a lap (ezek mérete rendszerenként eltérő lehet), de ezeket a hétköznapi életben nem szoktuk használni.
Érték | Előtag | Rövidítés | Érték | Előtag | Rövidítés |
---|---|---|---|---|---|
10000 | — | b / B | 10240 | — | b / B |
10001 | kilo- | kb / kB | 10241 | kibi- | Kib / KiB |
10002 | mega- | Mb / MB | 10242 | mebi- | Mib / MiB |
10003 | giga- | Gb / GB | 10243 | gibi- | Gib / GiB |
10004 | tera- | Tb / TB | 10244 | tebi- | Tib / TiB |
10005 | peta- | Pb / PB | 10245 | pebi- | Pib / PiB |
10006 | exa- | Eb / EB | 10246 | exbi- | Eib / EiB |
10007 | zetta- | Zb / ZB | 10247 | zebi- | Zib / ZiB |
10008 | yotta- | Yb / YB | 10248 | yobi- | Yib / YiB |
tízes (balra) és kettes (jobbra) számrendszerben
A bit és a byte viszont nagyon kicsi mennyiségek. Kevés olyan adat van, amit 1 bit vagy 1 byte adatmennyiséggel le tudunk írni. Szükségessé vált, hogy ezek többszöröseinek is nevet adjunk, ahogy azt például a tömeg vagy a távolság esetén is tesszük. Kézenfekvő volt az SI mértékegységek előtagjait használni, így létrejött a kilobyte (1024 byte), a megabyte (1024 kilobyte) és a többi adatmennyiség. A választás azért esett az 1024-re, mert az a 2 tizedik hatványa, így a kettes számrendszerben kerek számnak minősül.
A látszólag jól működő megoldással azonban van egy jelentős probléma. Az SI előtagok a tíz hatványai, ebben az esetben viszont a kettő hatványaként használjuk őket. A kilo- előtag jelentése 103, de az adatmennyiségek esetében 210 értelemben használjuk. Az eltérés kicsi, mindössze 24 (2,3%), de nagyobb előtagok esetén az eltérés is növekszik.
A probléma megoldására létrehoztak egy másik előtag rendszert, ami hasonlít az SI előtagokra, de kettes számrendszerben értelmezhető. Ezek az előtagok viszont a köznapi beszédben nem terjedtek el, még manapság is a félrevezető SI előtagokat használjuk. A hétköznapokban ez nem jelent különösebb problémát, de mégis érdemes rá odafigyelni a félreértések elkerülése végett.
Adattípusok
Az adatbázisban tárolt adatokat alapvetően aszerint oszthatjuk két nagy csoportra, hogy lehet-e velük matematikai műveletet végezni, vagy nem.
Szöveges
A szöveges adatokkal nem tudunk matematikai műveletet végezni. (Relációs műveleteket viszont igen, hiszen az ábécé sorrendet el tudjuk dönteni.)
A szöveges adatok tartalmazhatnak számjegyeket is, és állhatnak csupán számjegyekből is. Például az irányítószámot vagy a telefonszámot tárolhatjuk szövegként is, hiszen matematikai műveletet úgysem akarunk velük végezni.
A szöveges adatokat csak akkor lehet számszerű adatokká konvertálni, ha nem tartalmaznak olyan karaktert, ami a számszerű adatoknál nem megengedett. A szöveg méretét, hosszát a karakterek számával szoktuk megadni.
Számszerű
A számszerű adatokkal matematikai és relációs műveleteket is tudunk végezni.
A számjegyeken kívül néhány egyéb karaktert is tartalmazhatnak. Például előjelet, törtjelet, tizedes vesszőt vagy tizedes pontot, a komplex számok képzetes részét (i) vagy a normálalak mérnöki jelölését (E).
A számszerű adatokat minden esetben könnyen szöveges adatokká lehet alakítani. Méretüket a tároláshoz szükséges byte-ok számával szoktuk megadni.
A számszerű adatokat többféle altípusba soroljuk.
Szám
A számokon belül megkülönböztetünk egészeket és tizedestörteket. Értelem szerint egész számokat tudunk tört formában tárolni, fordítva viszont adatvesztés léphet fel, mert a törtrész elveszik, és csak az egészrész marad meg.
Dátum és idő
A számítógép a dátumot és időt valamilyen kezdődátum óta eltelt időegység (nap, másodperc, ezredmásodperc) formájában tárolja. Például a Microsoft Excel az 1900. január 1-et tekinti kezdődátumnak. Így az 1900. február 1. megfelel a 32-es számnak.
Az idő jelölésére egyes programok tizedestörteket is használnak. Például ha az éjfél 1, akkor az adott nap dél 0,5-ként írható le.
Logikai
A logikai adattípus igen-nem értékeket tartalmaz. Megegyezés szerint a hamis értéket 0, az igaz értéket pedig 1 vagy -1 jelképezi.
NULL érték
Egy adatbázis létrehozásakor előfordulhat, hogy valamilyen adatot még nem ismerünk vagy nem akarunk megadni. Ebben az esetben jelölni kell, hogy az adat hiányzik. Erre szolgál a NULL érték, ami a gyakorlatban üres cellaként jelenik meg.
A NULL érték nem egy újabb adattípus. A hiányzó adat típusát mindig az adott oszlop típusa határozza meg.
Fontos, hogy a NULL érték nem egyenlő a 0-val. Például ha az a kérdés, hogy "Hány könyvet olvastál el a nyári szünetben?", akkor a válasz lehet "Egyet sem." (0) vagy "Nem tudjuk." (NULL).
Az adatok kezelése
Tárolás
Az adattárolásról a Háttértárak fejezetben olvashatsz bővebben.
Feldolgozás
Az adatok feldolgozásáról a szoftveres fejezetekben olvashatsz bővebben.
Továbbítás
Feldogozás alatt...