Tartalom
„Az elméleti fizika módszerei a gondolkodás minden olyan területén használhatók, ahol a lényeges dolgokat kifejezhetjük számokkal.”
Paul Dirac
Jelen fejezet első felében a jelfeldolgozás alapvető fontosságú eredményével, a Shannon–Nyquist-féle mintavételezési tétellel[16], illetve ehhez kapcsolódóan a Shannon–Whittaker-féle interpolációs formulával ismerkedünk meg. A mintavételezési tétel választ ad arra, hogy milyen sűrűséggel kell mintákat vennünk egy függvényből (jelből) ahhoz, hogy azt a mintákból hibátlanul rekonstruálni tudjuk. A Shannon–Whittaker-formula a jel rekonstrukciójának módját adja meg. A fejezet második felében azt vizsgáljuk, hogy hogyan torzul a mintavételezett jel információtartalma, spektruma, ha a mintavételezést az ideális, végtelen sok helyett csak véges számú időpillanatban végezzük.
A fejezet befejeztével eljutunk oda, hogy a jelfeldolgozás eredményei által megalapozott módon tudunk egy jelből számunkra megfelelő tulajdonságokkal rendelkező diszkrét, kvantált számsorozatot, azaz egy vektort előállítani. A jegyzet hátralévő részében a folytonos függvények vizsgálatáról áttérünk a mintavételezett vektorok vizsgálatára, s bemutatjuk, hogy a Fourier-transzformáció kapcsolódó alkalmazásait.
A mintavételezési folyamatot matematikailag az ún. Dirac-fésű függvénnyel történő pontonkénti szorzással modellezzük.
7.1.1. Definíció. (Dirac-fésű függvény) A Dirac-fésű függvény adott T periódussal eltolt Dirac-delta függvények végtelen összege, azaz
A későbbiekben T jelöli majd a mintavételezési időt, azaz azt az időtartamot, amely két egymást követő minta vételezése között telik el.
7.1.1. Tétel. (A Dirac-fésű Fourier-sorfejtése és transzformáltja) A Dirac-fésű függvény Fourier-sorfejtése
és Fourier-transzformáltja
Bizonyítás. Mivel a Dirac-fésű függvény periodikus T periódussal, azaz
, alkalmazhatjuk rá a periodikus függvények Fourier-sorfejtését. Ekkor a Fourier-sorfejtés alakja a következő
ahol
és
-t
módon definiáljuk. Az
szorzó faktorra nyilvána azért van szükség, mert a függvény nem
szerint, hanem T szerint periodikus. A felírásban
természetesen konstans, amely csak a T értéktől függ. Kihasználva, hogy a Fourier-együtthatókat tetszőleges T hosszúságú intervallumon kiszámíthatjuk, válasszuk a
intervallumot:
Mivel a transzformációban használt ortogonális függvények az
komplex hullám függvények, behelyettesítve a
Fourier-együtthatókat a Fourier-sorfejtésbe,
adódik. A Dirac-fésű Fourier-transzformáltja a Fourier-transzformáció linearitását kihasználva
Kihasználva az idő eltolásra és a Dirac-delta Fourier-transzformáltjára vonatkozó állításokat,
Ebből
Vessük össze az utóbbi Fourier-transzformáltat a Dirac-fésű Fourier-sorfejtésével. Azt kll látnunk, hogy a kifejezések hasonló alakúak. Egészen pontosan a Fourier-sorfejtés n változója a Fourier-transzformált n változójának felel meg, a sorfejtésben szereplő függvény t paramétere a transzformált
paraméterének felel meg, míg a
konstans a transzformált T konstansának. Így tekintve a Fourier-transzformáltat, tekinthetjük azt egy Dirac-fésű sorfejtéssel történő előállításának, ahol a komplex hullámfüggvények az egyes Dirac-delták eltolásából származnak, azaz
Az előző állítás legfontosabb következménye hogy egy Dirac-fésű függvény Fourier-transzformáltja is egy Dirac-fésű függvény. Vegyük észre, mekkora különbség van egy periodikus és nem-periodikus függvény Fourier-transzformáltja között: egy Dirac-delta Fourier-transzformáltja egy konstans, míg végtelen sok Dirac-delta összegének, azaz a Dirac-fésűnek a Fourier-transzformáltja már egy Dirac-fésű.
Az időtartományban növelve a Dirac-delták sűrűségét, a Fourier-térben csökkenni fog a sűrűségük, azaz nő a távolságuk, és fordítva. Ezen tulajdonság analóg a Fourier-transzformáció idő és frekvenciaskálázásra vonatkozó tulajdonságával, illetve a Gauss-féle sűrűségfüggvény Fourier-transzformációjánál megfigyelt jelenséggel: ha megfelelő paraméterezéssel egy függvényt időtartományban az origó köré húzunk össze, akkor Fourier-transzformáltja elnyúlik az
tengely mentén és fordítva.
A konvolúciót, mint műveletet már az előző fejezetben bevezettük. Vizsgáljuk meg, hogy mi történik, ha egy függvényt a Dirac-deltával, vagy Dirac-fésűvel konvolválunk.
Emlékeztetőül a konvolúció definíciója
A Dirac-deltával történő konvolúció eredménye könnyen meghatározható, ha arra gondolunk,
hogy a függvény integrál kifejezésben az integrandus függvényértékét
eredményezi azon a helyen, ahol
értéke zérus. Ennek megfelelően
A függvénnyel történő konvolúció esetén
azaz a konvolúció egy a értékkel történő eltolásnak felel meg.
Vizsgáljuk meg, hogy mi történik ha egy függvényt egy
függvénnyel konvolválunk! Az
integrál linearitását kihasználva
azaz a függvényből két másolat készül, az egyik a-val, a másik -val eltolva, mitöbb, a
másolatok összeadódnak. Példaként tekintsük az
és
függvénnyel történő
konvolúció eredményét, amit a 7.1. ábrán vizualizáltunk.
7.1. ábra. A Dirac-deltával történő konvolúció szemléltetése
7.1-a. A konvolválandó függvények
7.1-b. A konvolúció eredménye
Vizsgáljuk meg, mi történik, ha egy függvényt a
függvénnyel konvolváljuk!
vagyis az f függvényből végtelen sok másolat készül, s ezek értékei pontonként összeadódnak.
Példaként tekintsük az és
függvények
konvolúcióját, aminek eredményét a 7.2. ábrán vizualizáltuk.
7.2. ábra. A Dirac-fésűvel történő konvolúció eredménye
7.2-a. A konvolválandó függvények
7.2-b. A konvolúció eredménye
7.1.2. Definíció. (Mintavételezés) Mintavételezésnek nevezzük azt a folyamatot, amikor egy folytonos függvényt diszkrét függvénnyé redukálunk. Az
függvény T mintavételezési idővel történő mintavételezésével kapott függvényt
módon jelöljük.
A mintavételezés témakörének fő kérdése az, hogy milyen körülmények között
lesz az eredeti függvénye visszaállítható a mintákból, azaz milyen körülmények
között, mely feltételek teljesülése esetén tudjuk hibátlanul visszaállítani
-ből?
7.1.3. Definíció. (Körfrekvencia-korlátos függvény) Jelölje
a
függvény Fourier-transzformáltját, ha létezik olyan
, szám, amelyre
, ha
, akkor az
függvényt körfrekvencia-korlátosnak nevezzük B korláttal.
Egy frekvenciakorlátos függvény tehát azzal a tulajdonsággal rendelkezik, hogy Fourier-transzformáltja csak egy véges origó körüli környezetben vesz fel nullától különböző értéket.
7.1.2. Tétel. (Shannon–Nyquist-féle mintavételezési tétel) Legyen f egy körfrekvencia-korlátos függvény B korláttal. Ekkor a függvény hiba nélkül előállítható a mintáiból, ha a mintavételezés
körfrekvenciájára
teljesül, azaz a mintavételezési időköz
. Körfrekvencia helyett frekvenciával kifejezve
és
.
Bizonyítás. Az előző fejezetben megismerkedtünk a Fourier-transzformációval, s beláttuk, hogy egy
függvény az
Fourier-transzformáltjából egyértelműen előállítható,
és
a függvénytérben használt metrika tekintetében kölcsönösen egyértelműen meghatározzák egymást, az
-ból inverz Fourier-transzformációval előálló függvény és
távolsága zérus. Egy mintavételezett függvényből az eredeti függvényt rekonstruálhatjuk, ha a mintavételezett függvény Fourier-transzformáltjából valamilyen módon ki tudjuk szűrni az eredeti függvény Fourier-transzformáltját. Erre ugyanis inverz Fourier-transzformációt alkalmazva visszakapjuk az eredeti függvényt.
Nézzük, mi történik frekvenciatérben a mintavételezés során.
A konvolúciós tétel alapján az eredeti függvény és a Dirac-fésű pontonkénti szorzatának Fourier-transzformáltja a függvények Fourier-transzformáltjainak konvolúciójaként is megkapható, azaz
ahol
-vel jelöltük
Fourier-transzformáltját.
Feltételeztük, hogy az f függvény körfrekvencia-korlátos, azaz Fourier-transzformáltja csak a
intervallumban tartalmaz nem 0 együtthatókat. A Dirac-fésű Fourier-transzformáltjáról pedig tudjuk, hogy az is egy Dirac-fésű lesz. Ismerve a Dirac-fésűvel vett konvolúció tulajdonságait, a mintavételezett függvény Fourier-transzformáltja az eredeti függvény Fourier-transzformáltjainak másolataiból fog állni. A másolatok a Dirac-fésű Fourier-transzformáltjának Dirac-deltáiba lesznek eltolva, ezek pedig éppen
periódussalhosszal követik egymást a frekvenciatérben.
Az eredeti és mintavételezett függvény Fourier-transzformáltjai tehát abban különböznek, hogy a mintavételezett függvény Fourier-transzformáltja az eredeti függvény periodikus másolatainak összegeként áll elő.
A mintavételezett függvény Fourier-transzformáltjából (
) úgy nyerhetjük ki az eredeti függvény Fourier-transzformáltját (
), hogy annak másolatai közül kimaszkolunk egyet, azaz pontonként szorozzuk egy olyan függvénnyel, amely a
tartományban 1-et, azon kívül pedig 0-t vesz fel. Másként fogalmazva pontonként szorozzuk egy megfelelően paraméterezett
függvénnyel.
Legyen
a mintavételező Dirac-fésű körfrekvenciája Fourier-térben. Frekvenciatérben az
másolatai éppen
távolságra kerülnek egymástól. Optimális esetben, ha a másolatok nem érnek össze, így nem fednek át, a
függvénnyel történő pontonkénti szorzás éppen
egy példányát fogja eredményezni, azaz
teljesül, így az
függvényt inverz Fourier-transzformációt alkalmazva visszakaphatjuk, nevezetesen
Ahhoz azonban hogy ez működjön, teljesülnie kell annak a feltételnek, hogy frekvenciatérben az
másolatai nem fednek át. Ennek pedig az a feltétele, hogy a körfrekvenciakorlátra
teljesül, azaz
. Körfrekvenciáról frekvenciára áttérve a reláció nem változik:
,
, így
kell, hogy teljesüljön. Időtartományban a mintavételezési időre
adódik.
A Shannon-Nyquist-féle mintavételezési tétel a jelfeldolgozás elméletének egyik legfontosabb eredménye, mivel ismerve egy jel fizikai tulajdonságait, a tétel segítségével meghatározhatjuk azt a mintavételezési időt, mely használata esetén az eredeti jel hibátlanul visszaállítható.
Megjegyezzük, hogy a Shannon-Nyquist tétel nem ad szükséges feltételt egy jel visszaállíthatóságára, a
csak elégséges feltétel. Ha a feltétel teljesül, a jel biztosan hibátlanul rekonstruálható. Speciális esetekben azonban akkor is rekonstruálható a jel, ha a feltétel nem teljesül.
A tétel csak alsó korlátot ad a mintavételezési körfrekvenciára, így végtelen sok olyan mintavételezési idő van, ami teljesíti ezt a feltételt. Ugyanakkor általában a korláthoz közel eső, a feltételnek még éppen megfelelő körfrekvenciákat szoktunk választani, ugyanis minél nagyobb mintavételezési frekvenciát választunk, annál kisebb lesz a mintavételezési idő, azaz annál több mintát kell vennünk egységnyi idő alatt. Mivel számítógépes mérőrendszerek esetén a rendelkezésre álló tárkapacitás véges, ezért célszerű egységnyi idő alatt a lehető legkevesebb mintát vételezni, így a lehető legnagyobb mintavételezési időt és legkisebb mintavételezési frekvenciát választani.
7.1.4. Definíció. (Aliasing) Azt a jelenséget, amikor a rosszul megválasztott mintavételezési frekvencia miatt a mintavételezett függvény Fourier-transzformáltjában az eredeti függvény Fourier-transzformáltjának másolatai összeérnek, aliasing-nak nevezzük.
Aliasing esetén nem tudjuk előállítani az eredeti függvény spektrumát a
mintavételezett függvény spektrumából, mert az átfedő részeken a spektrum másolatai
a konvolúció miatt összeadódnak és ezek szétválasztásához nem rendelkezünk
információval.
7.1.5. Definíció. (Nyquist-(kör)frekvencia) A Shannon-Nyquist-tételben szereplő, megengedett mintavételezési (kör)frekvenciák alsó korlátját Nyquist-(kör)frekvenciának nevezzük.
A Shannon–Nyquist-tételt és bizonyítását sematikusan a 7.3. ábrán szemléltetjük. Tegyük fel az egyszerűség kedvéért, hogy a függvény, melyből mintavételezni kívánunk a
függvény (7.3-a. ábra). Tudjuk, hogy a függvény Fourier-transzformáltja a
amit a 7.3-c. ábrán vizualizáltunk. Emlékeztetőül a háromszögfüggvény explicit alakja:
így könnyen látható, hogy a függvény körfrekvenciakorlátos
korláttal. Ennek megfelelően a mintavételezési körfrekvenciára
kell, hogy teljesüljön. Válasszuk a Nyquist-frekvenciát,
azaz
, s így a mintavételezési időre
adódik. Ebből kifolyólag a
mintavételező Dirac-fésű
lesz (7.3-b. ábra). A mintavételező Dirac-delta Fourier-transzformáltja
amit a 7.3-d. ábrán jelenítettünk meg. A mintavételezés eredményeként előálló
pontokat a 7.3-e. ábrán reprezentáljuk, míg a mintavételezett függvény
Foureir-transzformáltját a 7.3-f. ábrán. Jól látható, hogy a Nyquist-frekvencia
kiválasztása miatt a Fourier-transzformált másolatai éppen nem érnek össze, így egy
megfelelően paraméterezett függvénnyel pontonként szorozzuk, ki tudunk nyerni egyet
közülük. A 7.3-g. ábrán az említett
függvény
látható, míg a 7.3-h. ábrán a pontonkénti szorzás eredményeként megkapott
egyetlen
függvény. A szemléletesség kedvéért a 7.3-h. ábrán szaggatott
vonallal ábrázoltuk azon
másolatokat, amelyek a
-tel való pontokkénti szorzás
hatására eltűnnek.
7.3. ábra. A mintavételezés szemléltetése
7.3-a. A mintavételezendő
függvény
7.3-b. A mintavételező Dirac-fésű
7.3-c. A
Fourier-transzformáltja
7.3-d. A Dirac-fésű Fourier-transzformáltja
7.3-e. A mintavételezés
7.3-f. A mitnavételezés hatása frekvenciatérben
7.3-g. A maszkolásra használt
függvény
7.3-h. A maszkolás eredményeként csak a középső
függvény marad.
Az előző szakaszban a Shannon–Nyquist tétellel elégséges feltételt adtunk arra, hogy mikor rekonstruálhatunk egy függvényt pontosan annak mintáiból. A feltétel kimondásához nem kellett a függvény rekonstrukciójának módját megfogalmaznunk, elegendő volt felvázolni annak menetét. Jelen fejezetben megvizsgáljuk, hogy pontosan hogyan is rekonstruálhatunk egy függvényt annak mintáiból, feltéve, hogy teljesült a mintavételezési tételben megfogalmazott feltétel.
Első lépésként azonban be kell látnunk egy újabb összefüggést egy függvény Fourier-transzformáltja és Fourier-sorfejtése között.
7.1.3. Tétel. (Poisson-összegzés) Legyen
egy olyan függvény, melynek létezik
Fourier-transzformáltja, s tegyük fel, hogy a Fourier-transzformáltból
inverz Fourier-transzformációval előállítható. Ekkor
és
teljesül, ahol
.
Bizonyítás. Definiáljuk a
függvényt
módon. Könnyen látható, hogy ezen G függvény periodikus
periódussal. Határozzuk meg a Fourier-sorfejtésből adódó Fourier-együtthatóit:
Az utolsó előtti lépésben kihasználtuk a Fourier-transzformáció dualitás tulajdonságát, és azt, hogy az exponenciális kifejezés úgy értelmezhető, mintha Fourier-transzformációval az eredeti függvény értékét szeretnénk meghatározni az
helyen.
Felhasználva a Fourier-sorfejtés
együtthatóit, a G függvényt előállíthatjuk az alábbi alakban:
Ezzel az állítás második részét beláttuk, a maradék három eset analóg módon bizonyítható.
7.1.3. Megjegyzés. A Poisson-összegzésről szóló állítás szerint ha adott egy
függvény, melynek értékeit periodikusan összegezzük, akkor az így kapott összeget megkaphatjuk a Fourier-transzformált súlyozott periodikus összegzésével is. Másként fogalmazva, ha periodikusan összegzünk egy
függvényt, az így kapott periodikus függvény Fourier-együtthatói rendre az
függvény Fourier-transzformáltjának periodikusan elhelyezkedő értékeiként adódnak.
7.1.4. Tétel. (Shannon–Whittaker-formula) Az f függvényt a mintavételezett
függvényből az alábbi formula alapján állíthatjuk elő:
Bizonyítás. Ha a mintavételezési tételben megfogalmazott feltétel teljesül, akkor az eredeti függvény spektrumából egy megfelelő maszkolást követően inverz Fourier-transzformációval kapjuk vissza az eredeti függvényt. Jelölje
a mintavételezett függvény Fourier-transzformáltját. A Dirac-fésűvel történő konvolúció tulajdonságaiból látható, hogy
Ahogy azt a Shannon–Nyquist tétel bizonyításában levezettük, az eredeti f függvényt
módon kaphatjuk vissza. Alkalmazzuk a Poisson-összegzés formuláját az állításban szereplő
periodikus függvényre:
Hajtsuk végre az inverz Fourier-transzformációt. Tudjuk, hogy a
függvény a
függvény Fourier-transzformáltja, így az inverz Fourier-transzformációt követően a
függvény
függvénnyé transzformálódik. Az
szorzó faktor az idő paraméter
-vel történő eltolásának felel meg, így a szögletes szárójelben szereplő kifejezés inverz Fourier-transzformáltja
paraméter jelenik meg. A
függvény körfrekvencia paramétere azonban skálázva van. A Fourier-transzformáció skálázásra vonatkozó tulajdonsága alapján tudjuk, hogy a
függvény inverz Fourier-transzformáltja
lesz. Kihasználva, hogy
,
ahol a
függvényt normalizált
függvénynek nevezzük, és
módon értelmezzük.
A Shannon–Whittaker interpolációs formula használatának szemléltetésére folytassuk az
előző szakaszban bemutatott példát a függvény mintáiból történő
visszaállításával.
7.4. ábra. A Shannon–Whittaker-formula használatának szemléltetése
7.4-a. A Shannon–Whittaker-formulában megjelenő
függvények (kék) és az eredeti
függvény (piros).
7.4-b. A Shannon-Whittaker-formulában összege
Mivel a mintavételezési idő volt, a A Shannon–Whittaker formula szerint
a
módon vissza kell kapnunk az eredeti, mintavételezett függvényt. Vegyük
észre, hogy a formulában a
függvénynek csak diszkrét mintáit
használjuk.
Hogy könnyebb legyen a formula működésének elképzelése, a 7.4-a. ábrán az
eredeti függvényt pirossal, míg a (7.38) összegzésben szereplő
súlyozott
függvényeket kékkel ábrázoltuk. Az egyes
függvények
látszólag változatosan hullámzanak, azonban ha pontonként kiszámítjuk ezen függvények
összegét (7.4-b. ábra), akkor látható, hogy pontosan a
függvényt kapjuk, melyből mintavételeztünk.
A teljesség és a félreértések elkerülése végett megjegyezzük, hogy annak, hogy az
interpolációs formulában függvények szerepelnek, semmi köze sincs
ahhoz, hogy mi most éppen a
függvényből mintavételeztünk.
Azért a
függvényt választottuk, mert a frekvenciatérben megjelenő
háromszög függvénnyel könnyű volt szemléltetni a Shannon-féle mintavételezési tétel
állítását.
A Shannon-féle mintavételezési tételt számtalan helyen alkalmazzák a gyakorlatban:
Közismert, hogy az emberi fül hallóképessége a 20-20000 Hz-es tartományra terjed ki (a zenei A hang frekvenciája 440 Hz). A 20000 Hz fölötti frekvenciájú akusztikus hangokat nem vagyunk képesek érzékelni. A 20000 Hz természetesen csak egy közelítő érték, emberről-emberre, illetve a életkorral is változik. Ahhoz, hogy 20000 Hz alatti frekvenciákat hibátlanul vissza tudjunk állítani, a mintavételezési tétel szerint 40000 Hz frekvenciától nagyobb mintavételezési frekvenciával kell dolgoznunk. A gyakorlatban ezt túlbecsülték, hogy többé-kevésbé minden, emberek által érzékelt hangot rekonstruálni tudjanak, így az audiótechnikában elfogadott szabványos mintavételezési ráta 44.1 kHz CD minőséghez, és 48 kHz professzionális audió felvételekhez. Előbbi azt jelenti, hogy 22.05 kHz-es frekvenciáig lehet minden komponenst hibátlanul rekonstruálni, utóbbi esetén pedig 24 kHz-ig.
Telefonokon azért nem lehet megfelelő minőségben például zenét továbbítani, mert az emberi beszéd fő frekvenciakomponensei az 3-4000 Hz tartományba esnek. Ennek megfelelően a telefonok mintavételezése csak 8kHz mintavételezési frekvenciával történik a G.711 szabvány szerint.
Digitális fényképezőgépek, videókamerák esetén térbeli, valamint térben és időben változó jelek jelennek meg, s ezek jellege befolyásolja azt, hogy milyen képeket, struktúrákat tudunk a számunkra szükséges részletességgel rögzíteni. Mivel a fényképezés vagy videofelvétel tárgyát képező szcénáról nincs általános információnk, így a mintavételezés pontosságát a hardver lehetőségei korlátozzák elsősorban. Ezen területeken is találkozhatunk azonban aliasing jelenségekkel, ilyen például a szekérkerék-effektus, amikor egy forgó kerék vagy propeller egy videófelvételen úgy tűnik, hogy lassabban és esetenként visszafelé forog. Hasonlóan, aliasing jelenség van a háttérben, mikor egy sűrű, apró mintázatú tárgyról képfelvételt készítünk, s a mintavételezés pontosságának köszönhetően az apró minták nem értelmezhetők, viszont nagyobb struktúrákat, ún. de Moire mintázatot alkotnak. Az ??. ábrán[17] két különböző felbontásban készült kép látható egy téglafalról. A bal oldali kép megfelelően nagy felbontású ahhoz, hogy a téglafal mintázatát visszaadja, a jobb oldali kép azonban kisebb felbontású, azaz nem megfelelő mintavételezési frekvenciával készült ahhoz, hogy a téglamintázatot láthassuk rajta. Az apró téglák mintázata helyett azonban megjelenik egy nagyobb, hullámzó de Moire mintázat.
[16] A tétel nevét megalkotóiról, Harry Nyquist (1889 – 1976) svéd villamosmérnökről és Claude Shannon (1916 – 2001) matematikusról kapta. Bár a tétel eredménye Nyquist önálló munkájában jelent meg előbb 1928-ban, azt még nem a mintavételezéshez kapcsolódóan fogalmazta meg. Shannon 1949-ben publikálta a tételt, s máig homály fedi, hogy hogyan kapcsolódott össze végül Shannon és Nyquist neve a tétel megnevezésében.
[17] A képek a Wikipedia Aliasing oldaláról származnak.