6.4. A génképzés modellezése

A génképzés művelete a mikronukleuszból a fenti három művelet segítségével makronukleuszt készít, az IES-ek a fokozatosan kivágódnak a sorozatból az ld művelettel, az MDS-ek pedig összeillesztődnek a kívánt sorrendben. A három transzformációs műveletben a mutatók a döntők. Így, a jelölés egyszerűsítéseként a mutatókra pozitív számokkal fogunk hivatkozni , a mutatók inverzeit pedig a fogják jelölni. Ezen kívül megtartjuk a (mint első és . mutató helyetti szakaszokat) és jelölést ezek inverzére.

A génképzési folyamat modellezésében a fő ötlet az, hogy csak a mutatókat és a jelzőket tartjuk meg. A mutatók megfelelő sorrendbe transzformálása, illetve az azonos mutatók egymás melletti direkt ismétlésbe kerülése a cél. Az ld pedig ekkor a mutató két előfordulása közti (IES) szakaszt kivágva a két egymás mellé illő MDS-t összeilleszti. Ekkor tulajdonképpen a felhasznált mutató megszűnik mutatónak lenni (a génképzésben további szerepe nincs, és végül már nem is fordul elő kétszer a láncban), a létrejött MDS szakaszt másik két mutató (vagy jelző) határolja. A génképzés tulajdonképpen akkor ér véget, ha az MDS-ek egy folytonos szakaszt alkotnak, a és jelzők határolják, vagyis létrejött a makronukleusz. Ha a műveletek eredményeként a makronukleusz létrejött, akkor azt mondjuk a génképzés stratégiája sikeres volt.

Számítási szempontból tehát maguk az MDS-es és IES-ek nem érdekelnek minket, a műveletek a mutatók helyétől és egymáshoz viszonyított elhelyezkedésétől függnek, és azokon dolgoznak. Használjuk tehát az jelölést az . MDS-re. Így az inverze: . (Ahol a , pedig az ; a többi érték a mutatót jelöli.)

Nézzünk egy példát:

Ekkor tekintsük a kóddal leírt mikronukleuszt, ez tehát egy lehetséges MDS sorozatot leíró sorozat.

Három művelet is használható erre a sorozatra: ld a mutatóra, a hi a -re, míg a dlad az mutatópárra.

Az ld -t végrehajtva: -t kapunk. Itt a azt rövidíti, hogy a 3. és a 2. MDS már egymás mellé került, nincs köztük IES szakasz a láncban.

Az eredeti sorozatra a hi végrehajtásával a -es mutatóra, az sorozatot kapjuk.

Az eredeti sorozatra az alkalmazható dlad művelettel a lesz az eredmény.

Ha a dlad , hi , ld sorrendben alkalmazzuk a műveleteket, akkor: a dlad után folytatva a hi -vel a 4-es mutatóra: , végül az ld a 3-asra: . Ez azt jelenti, hogy minden MDS a helyére került a és közt helyezkednek el a helyes sorrendben a közbülső IES-ek nélkül (a jelen esetben a kettős láncot a végéről olvasva). Tehát a génképzési stratégia sikeres volt.