7.2. Elméleti leírás

A szétvágás és összeillesztés műveletét egy közös matematikai művelettel írhatjuk le:

Legyenek adottak a

1. w1 = w'1u1xu3w1"

2. w2 = w'2u2xu4w2"

DNS molekulák (amiket, ebben a modellben a továbbiakban sztringekkel reprezentálunk).

Tekinthetjük úgy, hogy az első molekula esetén egy u1xv1 felismerési mintával rendelkező (u1,x,v1)i enzimmel vágunk, ahol i ∈ {L,F}. A második molekula esetén pedig az (u2,x,v2)i enzim képes a vágást végrehajtani. Ennek megfelelően a vágás során ugyanolyan típusú x-szel jelölt ragadós végek jönnek létre, amelyek segítségével a két eredeti molekulából két másik molekula keletkezhet.

A szétvágó-összeillesztő műveletet végrehajtva a következő molekulák jöhetnek létre:

1. z1 = w'1u1xu4w2"

2. z2 = w'2u2xu3w1"

Mivel az x minden sztringben előfordul elméleti szempontból beolvaszthatjuk pl. az u1 és u2 sztringekbe: u'1 = u1x és u'2 = u2x jelöléssel, az u1x helyett mindenhol u'1, az u2x helyett pedig mindenhol u'2 írható.

Tehát legyen adott egy V ábécé, ekkor az előző okfejtésnek megfelelően, általában a tömörebb írásmóddal élve, egy lépést a következő szabállyal írhatunk le:

r = u1u2 $ u3u4,

ahol u1, u2, u3, u4V*. Egy ilyen r szabály (erős) alkalmazása a (x,y) párra adja a (z,w) párt:

(x,y) ⊨r (z,w),

ahol

x = x1u1u2x2,

y = y1u3u4y2,

z = x1u1u4y2,

w = x1u3u2x2,

ahol x, y, z, wV*.

Az r : u1u2 $ u3u4 szabály alkalmazása az (x,y) párra annak felel meg, hogy ha x és y molekulák (sztringek) már előálltak az oldatban, és ezek felírhatóak x = x1u1u2x2 és y = y1u3u4y2 alakban, akkor a z = x1u1u4y2 és w = x1u3u2x2 szavak is elemei lesznek az oldatnak, ők is létrehozhatóak a rendszerben.

Megjegyezzük, egyes modellekben a két létrehozható sztring közül csak az egyiket, a z-t tekintik a szabály (gyenge) alkalmazását követően eredménynek, ezt a (x,y) ⊢r z alakban szokás írni, így is megkülönböztetve az eredeti esettől, amiben a w = x1u3u2x2 sztringet is képeztük a szabály alkalmazásakor. Habár az elméleti modellekben nem feltétlenül szokták tekinteni a w sztringet, viszont valódi DNS molekulákkal dolgozó rendszerekben általában ezek a molekulák is létrejöhetnek/jönnek.

7.2.1. Szétvágó-összeillesztő művelet nyelvekre

A szétvágó-összeillesztő műveletet szokás kiterjeszteni formális nyelvekre. Egy rendszer megadásához szükség van egy kezdeti kiindulásnyelvre, axiómahalmazra (vagy a DNS-ek ábécéjével a nukleotidokkal, vagy általában bármilyen ábécé felett). Ez a kiindulási nyelv megfelel annak, hogy milyen DNS molekuláink vannak eredetileg az oldatban, a kísérlet kezdetekor. Ezen kívül meg kell adnunk a számítási lépések műveleteit, a használható operátorokat.

Formális modellként a következőképpen definiálhatjuk ezeket a rendszereket:

12. Definíció. Egy S = (V,R,A) rendezett hármas egy szétvágó-összeillesztő rendszer, ahol

  • V egy véges, nemüres ábécé,

  • RV*V* $ V*V* alakú szabályok halmaza (♯, $ ∉ V speciális szimbólumok),

  • AV* pedig egy kiindulási nyelv, az axiómák (nem feltétlenül véges) halmaza.

Figyeljük meg, hogy a szabályhalmazt ugyancsak nyelvként definiáltuk, ami olyan szavakat tartalmaz, amikben vannak speciális szimbólumok (adott számban és adott sorrendben).

28. Példa. Legyen S = ({a,b,c},{rb = b ♯ λ $ b ♯ λ, rc = c ♯ λ $ c ♯ λ}, {abaca, acaba}). Ekkor a következőképpen alkalmazhatjuk a szabályokat (a függőleges vonalak jelzik a vágási helyeket):

(abaca,acaba) ⊨rb (aba,acabaca),

hiszen az rb szabály bármely b előfordulás után vágja szét mindkét argumentumot. Hasonlóan

(abaca,acaba) ⊨rc (abacaba,aca).

36. Feladat. Legyen S = ({a,c,g,t}, {r = ggatcc & agatct}, {aaaggatccgg, ttagatctccc}).

Írja fel az (aaaggatccgg, ttagatctccc) ⊨r eredményét.

Lehet-e alkalmazni az r operátort a (ttagatctccc,aaaggatccgg) sorrendű párra?

13. Definíció. Jelölje R(L) azt a V feletti nyelvet, ami az L nyelvből a lehetséges szabályok egyszeri alkalmazásával létrejön, vagyis

R(L) = {wV*van olyan u,vL, és rR, hogy (u,v) ⊢r w}.

Jelölje (ahol J, K ∈ {FIN, REG, LIN, CF, CS, RE}) azon nyelvek családját, amik előállíthatóak a J nyelvcsaládba eső L kiindulási nyelvből a K nyelvcsaládba eső R szabályhalmaz segítségével, a szabályok egyszeri alkalmazásával.

Legyen R0 (L) = L, továbbá minden i ∈ ℕ, i > 0 esetén legyen Ri (L) = Ri-1 (L) ∪ R (Ri-1 (L)).

Így R1 (L) = LR (L).

Jelölje az R szabályhalmazzal az L nyelvből iterálva előállítható nyelvet.

Egy S = (V, R, A) rendszer által generált nyelv L (S) = R* (A).

A szétvágó-összeillesztő szabályokat a nyelvekre alkalmazva, mint nyelvművelet segítségével a kiindulási nyelvből egy új nyelvet kaphatunk (a szabályok nyelvétől függően). Az így létrehozható nyelvosztályokra teljesül a következő tétel, ami számos eredményt foglal össze.

20. Tétel. A szétvágó-összeillesztő szabályok egyszeri, nem iterált alkalmazásával előállítható nyelvek családjai és a Chomsky hierarchia viszonya:

minden X ∈ {FIN, REG, LIN, CF, CS, RE} esetén.

REGLIN.

REGCF.

REGRE.

REGRE.

LINCF.

LINCF.

Minden egyéb, a tételben eddig fel nem sorolt esetre

Világos, hogy véges nyelvekből csak véges nyelv kapható. Érdekesebb eredmény, hogy a reguláris nyelvekből reguláris szabályokkal csak reguláris nyelvek állnak elő. A környezetfüggetlen nyelvek is zártak még a reguláris nyelvekkel leírható szabályhalmazokkal elvégezhető műveletre is. Viszont minden RE-beli nyelv előállítható pl. lineáris nyelvből lineáris nyelvvel leírható szabályokkal.

Az, hogy pl. a CS nyelvcsaládból véges szabályhalmazzal már minden RE-beli nyelv létrehozható azzal bizonyítható, minden V ábécé feletti L RE-beli nyelvhez van olyan V ∪ {@} feletti (ahol @ ∉ V) L' környezetfüggő nyelv, ami abban különbözik az eredeti nyelvtől, hogy annak minden szava elé valahány @ betű van beszúrva (éppen annyi, hogy már legyen elég tárhelye a lineárisan korlátozott Turing-gépnek kiszámolnia az adott szót).

7.2.2. Iterált H-rendszerek

29. Példa. Tekintsük a 28. példát, és határozzuk meg a generált nyelvet.

R = {rb = b ♯ λ $ b ♯ λ, rc = c ♯ λ $ c ♯ λ} és A = {abaca,acaba}).

(abaca,acaba) ⊢rb aba (acaba,abaca) ⊢rb acabaca,
(abaca,acaba) ⊢rc abacaba, (acaba,abaca) ⊢rc aca,

és az így létrejött hosszabb molekulákból:

(abacaba,abaca) ⊢rb abacabaca,

(acabaca,acaba) ⊢rc acabacaba,

az ugyanezekkel a molekulákkal fordított sorrendben történő szabályalkalmazásokkal az aba és aca állítható elő. Általánosan, minden n ≥ 1-re

((abac)n aba,abaca) ⊢rb (abac)n abaca,

((acab)n aca,acaba) ⊢rc (acab)n acaba,

a művelet végrehajtásával a szavak egy ac, illetve egy ab taggal bővültek, így már n + 1-szer tartalmazzák az abac, illetve az acab részszót egymás után. Továbbá, az ilyen típusú szavak felhasználásával:

((abac)na,acaba) ⊢rc (abac)n aba,

((acab)na,abaca) ⊢rb (acab)n aca.

(A fordított sorrendben vett szavakra ugyancsak az aba és aca áll elő.)

A fentiek alapján, a rendszer által generált nyelv:

(abac)* abaca + (acab)* aca + (abac)* aba + (acab)* acaba.

Figyeljük meg, hogy az előző példában mindkét szabály „szimmetrikus", vagyis mindkét molekulát ugyanott, és ugyanúgy képesek elvágni. Emiatt ebben az esetben, ha csak a gyenge szabályalkalmazást használjuk, akkor is ugyanazt a nyelvet tudjuk előállítani, mintha az erős szabályalkalmazással definiálnánk a nyelvet. A gyenge szabályalkalmazásban a két argumentumként levő molekula szerepét felcserélve éppen az erős szabályalkalmazással létrehozott másik molekulát állíthatjuk elő.

30. Példa. Legyen R = {ac $ λ♯ ac, ca ♯ λ $ ca}.

Ekkor L = {c,ac,ca} esetén R (L) felírható az a*c + ca* reguláris kifejezéssel. A vágási helyek miatt a különböző szabályok csak a különböző alakú szavakra használhatóak (az egyikkel az aa*c alakúakat lehet hosszabbítani a-kal a c előtt, míg a másik szabállyal a caa* alakú szavak hosszabbíthatóak megfelelően).

Ha L = {c,ac,ca, aca}, akkor R (L) az a*ca* reguláris nyelvvel egyezik meg. Az aca szó hozzáadása a nyelvhez lehetővé teszi, hogy ezt a szót mindkét irányban továbbépíthetjük a-kkal a két szabályunk alkalmazásával. Figyeljük meg, hogy olyan szó így sem jöhet létre, amiben a c-k száma eltérne az egytől.

37. Feladat. Legyen V = {a,c,g,t}, A ={aa, aacgcgaacgcgaa}, R = {r = cgcg $ cgcg} és S = (V, R, A). Ekkor mutassa meg, hogy az R*(A), vagyis az L (S) nyelv a következő: (aacgcg)*aa.

38. Feladat. Adjon meg olyan S = ({a}, R, {a}) szétvágó-összeillesztő rendszert, amely az a* nyelvet generálja. (Az ábécé és az axiómahalmaz adottak, csak az operátorokat kell megadnia.)

14. Definíció. Egy S = (V, R, A) rendszerről akkor mondjuk, hogy véges, ha mind R, mind A végesek.

Általában pedig, jelölje azon nyelvek családját, amik előállíthatóak olyan szétvágó-összeillesztő rendszerekkel, amelyekben az A kiindulási nyelv a J nyelvcsaládba esik, az R szabályhalmaz (mint nyelv) pedig a K nyelvcsaládba esik, ahol

J, K ∈ {FIN, REG, LIN, CF, CS, RE}.

Véges szétvágó-összeillesztő rendszerekkel csak reguláris nyelvek generálhatóak, de nem minden reguláris nyelv generálható ily módon (pl. az a*ca*ca* nyelv nem). Vagyis

FINREG.

Ezen rendszerekkel kapcsolatban bizonyítás nélkül közöljük a következő alapvető fontosságú tételt, ami a Regularitás Megőrzésének Lemmájaként ismert:

21. Tétel. Véges szabályhalmazzal reguláris nyelvből kiindulva csak reguláris nyelvek generálhatóak szétvágó-összeillesztő rendszerekkel:

További fontos eredmények a szétvágó-összeillesztő rendszerekkel iteratívan generált nyelvek osztályaival kapcsolatban: A Chomsky-féle nyelvosztályokkal összevetve a H-rendszerekkel generálható nyelvek osztályait, azokat a következőképpen helyezhetjük be a hierarchiába:

LINCF,

CSRE.

Továbbá,

minden K ∈ {FIN, REG, LIN, CF, CS, RE} esetben, hiszen formális rendszerrel RE-n kívüli nyelvet nem tudunk előállítani, és már a kiindulási halmaz lehet tetszőleges RE-beli nyelv.

A lineáris és a környezetfüggő nyelvosztályok tehát nem zártak, míg a reguláris, környezetfüggetlen és rekurzívan felsorolható nyelvek osztályai zártak az iterált szétvágó-összeillesztő műveletekre (ha azokból csak véges sok van).

Érdekesebb a helyzet, ha végetlen sok szabállyal dolgozunk:

XRE,

ahol X ∈ {FIN, REG, LIN, CF, CS}, és K ∈ {FIN, REG, LIN, CF, CS, RE}.

Ez azt jelenti, hogy bármilyen bonyolult (de kiszámítható, vagyis RE-beli) szabályrendszert megengedve sem tudunk minden RE nyelvet generálni, sőt pl. véges kiindulási nyelvből kiindulva még minden reguláris nyelvet sem.

7.2.3. Kiterjesztett H-rendszerek

Láthatjuk tehát, hogy a H-rendszerek, bár nagyon érdekes modelljei a számításoknak, csak nagyon korlátozottan használhatóak ebben a formában. Az egyik szokásos módszer ezen akadály leküzdésére, az ábécé bővítése:

15. Definíció. Egy S = (V, T, R, A) rendezett négyes egy kiterjesztett szétvágó-összeillesztő rendszer, ahol

  • V egy véges nemüres ábécé (teljes ábécé),

  • TV terminális ábécé,

  • RV*V* $ V*V* alakú szabályok halmaza (♯, $ ∉ V speciális szimbólumok),

  • AV* pedig a kiindulási nyelv, az axiómák halmaza.

Tekintsük az S' = (V, R, A) szétvágó-összeillesztő rendszert, ekkor az S által generált nyelv csak azokat az S'-ben létrehozott szavakat tartalmazza, amik csak terminálisokat tartalmazhatnak, vagyis L(S) = L(S') ⋂ T*.

Az S rendszer akkor véges, ha a belőle származtatott S' véges.

Azért hívjuk kiterjesztettnek az így definiált rendszert, mert megengedi nemterminális VT-beli szimbólumok használatát is azokkal a rendszerekkel szemben, amiket eddig vizsgáltunk, (az eddigiek ennek speciális esetei V = T választással).

16. Definíció. Jelölje azon nyelvek családját, amik előállíthatóak olyan kiterjesztett szétvágó-összeillesztő rendszerekkel, amelyekben az A kiindulási nyelv a J nyelvcsaládba esik, az R szabályhalmaz (mint nyelv) pedig a K nyelvcsaládba esik, ahol J, K ∈ {FIN, REG, LIN, CF, CS, RE}.

22. Tétel. A kiterjesztett szétvágó-összeillesztő rendszerekkel generálható nyelvcsaládok és a Chomsky hierarchia viszonya:

LINCF,

Minden egyéb esetre vagyis már a véges nyelvekből reguláris szabályrendszerrel minden rekurzívan felsorolható nyelv előállítható.

Bizonyítás: A tétel első állításának egyik részéhez, a mutatunk egy konstrukciót.

Legyen adott egy reguláris nyelv L, és legyen hozzá adott a G = (N, T, S, H) reguláris nyelvtan, ami L-et generálja. Ekkor legyen

S = (NT ∪ {Z}, T, R1R2, A1A2A3),

ahol ZNT, és

A1 = {S},

A2 = {ZaYXaYH, X, YN, aT},

A3 = {ZZaXaH, XN, aT},

R1 = {λ ♯ X $ ZaYXaYH, X, YN, aT},

R2 = {λ ♯ X $ Z ZaXaH, X,N, aT}.

Ha egy ZxX sztringet (pl. az A2 halmaz egy elemét) használunk fel egy R1-beli szabállyal, akkor ZxaY alakú sztring jön létre. A Z nemterminális nem küszöbölhető ki, így nem folytatható a levezetés sikeresen. Másrészt egy ZxX alakú szó ∣x∣ ≥ 2 esetben nem használható fel. Az egyetlen lehetőség, hogy terminális szót állítsunk elő, ha az S axiómából indulunk ki. Ekkor R1-beli szabályokat alkalmazhatunk akárhányszor egymás után, végül pedig egy R2-beli szabályt. Minden szabálynál az első argumentum az előző lépésben létrejött sztring, a második pedig az A2 egy eleme, ha R1-beli szabályt alkalmazunk, és A3-beli az utolsó lépésben, amikor R2-beli szabályt alkalmazunk. Ennek megfelelően az alkalmazott szabályok éppen a G reguláris nyelvtan egymást követő levezetési szabályait szimulálják, vagyis L(S) = L(G).

A tétel többi részének bizonyítását mellőzzük.

QED.

39. Feladat. Legyen G = ({S, A, B}, {a,b,c}, S {SaS, SaA, Ab, AbA, AaB, AcS, Ba}) reguláris nyelvtan, készítse el az ezzel ekvivalens kiterjesztett szétvágó-összeillesztő rendszert.

Érdekes, hogy a REG nyelvekből véges szabályhalmazokkal nem lehet kitörni még kiterjesztett rendszer esetén sem, vagyis, hogy a reguláris nyelvek halmaza zárt a véges szabályhalmazzal történő iterált szétvágó-összeillesztő szabályalkalmazásokra ez esetben is.

A kutatókat nagyon foglalkoztatta, hogy hogyan lehetne véges H-rendszerekkel több nyelvet, akár minden RE-beli nyelvet előállítani. A következő alfejezetben ilyen rendszercsaládra mutatunk példát.

7.2.4. Multiplicitásos H-rendszerek

Tekintsük most véges kiterjesztett rendszerek (vagyis, ahol mind az axiómahalmaz, mind a szabályhalmaz végesek) egy speciális változatát, ahol tulajdonképpen molekulák multihalmazaival dolgozunk.

17. Definíció. Legyen S = (V, T, R, A) egy véges kiterjesztett szétvágó-összeillesztő rendszer. Legyen m : V* → ℕ ∪ {∞} multiplicitásfüggvény, ami a V* minden eleméhez megadja kb. hogy az adott szót az S rendszerben (még) hányszor használhatjuk fel. Kezdetben minden u axiómához adott egy m (u) > 0 érték, minden más szóhoz rendelt érték 0. Ekkor S-t multiplicitásos kiterjesztett H-rendszernek nevezzük.

Jelölje M0 = m ezt a kezdeti multiplicitás értéket minden V*-beli szóra.

Minden egyes (x,y) ⊨r (z,w) szabályalkalmazásnál mind az x, mind az y multiplicitása eggyel csökken, a z és w sztringeké pedig eggyel nő (∞ ± 1 = ∞ konvencióval). Minden lépésben csak olyan sztringekkel végezhető el valamely rR-rel leírt művelet, aminek a multiplicitása nem 0.

Egy adott Mi-vel leírható állapotban az (x,y) ⊨r (z,w) pontosan akkor alkalmazható, ha (az eredeti multiplicitás nélküli kiterjesztett) S-ben alkalmazható az r szabály ily módon, és Mi(x) > 0, valamint Mi(y) > 0 fennállnak. Abban az esetben, ha x = y a feltétel Mi(x) ≥ 2.

Ekkor a művelet végrehajtásakor az Mi+1-gyel leírható állapot áll elő, amiben

  • Mi+1 (x) = Mi (x)-1 és Mi+1 (y) = Mi (y)-1, ha xy;

    illetve Mi+1 (x) = Mi (x)-2, ha x = y;

  • Mi+1 (z) = Mi (z)+1 és Mi+1 (w) = Mi (w)+1, ha wz;

    illetve Mi+1 (z) = Mi (z)+2, ha z = w;

  • Mi+1 (v) = Mi (v) minden egyéb vV* szóra, vagyis v ∉ {x,y,z,w} esetén.

Ekkor azt mondjuk, hogy az S multiplicitásos kiterjesztetett H-rendszerben Mi-ből Mi+1 közvetlenül elérhető (az r szabály alkalmazásával). Jelekben: MiMi+1. A reláció reflexív és tranzitív lezártját ⇒* jelöli.

Ekkor az S-t multiplicitásos kiterjesztett H-rendszer által generált nyelv tartalmazza az összes olyan T*-beli szót, amely az axiómákból levezethető a fenti megszorítás alkalmazásával. Formálisan:

L(S) = {wT*van olyan M, hogy M0 ⇒* M és M(w) > 0 }.

Könnyen belátható, hogy a multiplicitásos H-rendszerek a korábban bemutatott kiterjesztett rendszerek általánosításaként foghatóak fel: ha eredetileg minden axiómához a ∞ értéket rendeljük az M0-ban, akkor minden, egyébként a rendszerben előállítható sztringet akárhány példányban le tudunk gyártani, és így pontosan azokat a levezetéseket tudjuk előállítani, mint az eredeti kiterjesztett rendszerrel.

23. Tétel. A multiplicitásos kiterjesztett H-rendszerek generálóereje megegyezik a rekurzívan felsorolható nyelvek RE osztályával.

A tétel bizonyítása konstruktív és a rekurzívan felsorolható nyelvek Kuroda normálformáján alapul. Egy speciális axiómából (a startaxiómából) egyetlen egyet, a többiből pedig ∞ sokat engedünk meg a rendszer kiindulási állapotában, így éppen az eredeti nyelvtan lehetséges levezetései lesznek szimulálhatóak. A formális bizonyítást mellőzzük.

7.2.5. További H-rendszer modellek

Szokás a rendszerekben a szabályok sugarát definiálni:

Egy r szabály sugara alatt a szabályt alkotó sztringek hosszának maximumát tekintjük:

r∣ =def max(∣u1∣, ∣u2∣, ∣u3∣ ∣u4∣).

Érdekes probléma az olyan rendszerek vizsgálata, amikben a szabályok mérete korlátozott.

Felnőtt nyelvek

A DNS rendszerekben mindig előfordulhat, hogy a rekombináció során az eredeti molekula jön létre, vagyis olyan molekulák kapcsolódnak össze, amilyeneket szétvágtunk. Viszont előfordulhat, hogy más létrejövő molekulákra a felismerési minta már nem egyezik egyik az oldatban levő vágóenzimre sem, míg azok a molekulák amik újra létrejöttek megint szétvághatóak ugyanazzal az enzimmel. Egy idő után így nagy valószínűséggel már csak olyan (új) molekulák lesznek az oldatban, amiket nem vágnak a felhasznált enzimek. Az így létrejövő molekulákkal definiálható nyelvet, ami az eredeti szétvágható láncokat már nem tartalmazza felnőtt nyelvnek nevezzük.

31. Példa. Tekintsük a következő kísérletet. Egy oldatban egy 500 nukleotidból álló molekula található (természetesen hatalmas példányszámban). A kísérletben egyféle vágóenzimet használunk. A molekula olyan, hogy az adott enzim egyetlen helyen tudja elvágni: egy 400 és egy 100 nukleotidpár hosszúságú darabra. Mind a 400, mind a 100 hosszúságú molekula egyforma ragadós véggel rendelkezik, ennek köszönhetően bármelyik képes bármelyikkel összekapcsolódni. Legyen az eredeti molekula és a felhasznált vágóenzim olyan, hogy az azonos molekulákból létrejött molekulát ne tudja szétvágni. (Ez tipikusan akkor fordul elő, ha maga a felismerési minta nem palindrom, de a szétvágott rész palindrom, pl. ilyen az (A,AATT,C) kóddal leírható vágóenzim.)

Vizsgáljuk, hogy bizonyos idő elteltével milyen hosszúságú láncok vannak az oldatban.

A kiinduláskor tehát csak 500 hosszúságú molekulák voltak jelen. A folyamat megkezdésekor a vágóenzim működésének köszönhetően 100 és 400 hosszúságúak is megjelennek. Egy ideig a kiindulási nyelvet követően, az ún. aktív nyelvben 100 és 400 hosszúságú, valamint az 500-on kívül a 200 és 800 hosszúságú molekulák is megjelennek. Mivel viszont az oldatban levő enzim a 200 és 800 hosszúságú molekulákat nem tudja szétvágni, egy bizonyos idő eltelte után ezek lesznek abszolút többségben, majd később már csak a 800 és a 200 hosszúságú molekulákból lesz az oldatban.

DNS gyűrűk

Tekinthetünk olyan kétszálú DNS láncokat, amelyek egyik vége a másikkal kapcsolódott össze. Az ilyen körkörös molekulák könnyen létrejöhetnek szétvágás-összeillesztés művelet során: a molekulalánc két ragadós vége egymáshoz ragadhat, így saját magával gyűrűvé kapcsolódik össze a molekula. Az ilyen gyűrűs molekulákkal, amiket körszavakkal lehet leginkább leírni, foglalkoznak a körkörös H-rendszerek. Gyakorlatban az ilyen molekulák információ tárolására is alkalmasak lehetnek, pl. oly módon, hogy egy enzimmel szétvágjuk, kiegészítjük egy rövid DNS résszel (a tárolni kívánt információval), majd újra zárjuk; ezt hívják CEL (cut - extend - lock) technológiának. Ezekben a rendszerekben olyan rövid a gyűrű, hogy a saját végét hamar megtalálja, és könnyen gyűrűvé formálódik újra a toldás után.

Univerzális H-rendszerek

Vannak olyan szétvágó-összeillesztő rendszerek, amelyek más ilyen rendszerek szimulálására képesek, így akár univerzálisak is lehetnek (hasonlóan az univerzális Turing-géphez). Az ilyen H-rendszerek „programozhatóak", a programjuk, vagyis a szimulálandó S H-rendszer az univerzális rendszer axiómáiba van bekódolva.

Itt jegyezzük meg, hogy az itt közölt modelleken kívül rengeteg egyéb változata van a H-rendszereknek, pl. a [Păun et al.] könyvnek majdnem a fele csak ilyen rendszerekkel foglalkozik közel 200 oldalon keresztül.