Követhető példák

CDS: CERN Document Server

A CERN (Európai Nukleáris Kutatási Szervezet) több mint ötven éve a részecskekutatás fellegvára. Ez idő alatt a preprintek megosztása bevett gyakorlattá fejlődött az ott dolgozó kutatók között, mely az utóbbi tíz évben a CERN könyvtára által gondozott intézményi repozitórium formájában manifesztálódott.

A CERN dolgozóinak tudományos termése évente körülbelül kétezer cikk és tízezer konferenciákhoz kapcsolódó dokumentum (bemutatók, poszterek, előadás-jegyzetek, stb.). Ezeknek a anyagoknak a tárolására és szolgáltatására 1993-ben létrehozták a CDS nevű intézményi repozitóriumot, mely 1996-ban összeolvadt a könyvtár katalógusával, így ma közös felhasználói felületen érhetők el.

Az adatbázis jelenleg közel egymillió rekordot, közöttük 450 ezer nyílt hozzáférésű preprintet tartalmaz, s napi átlagos gyarapodása 280 tétel. A keresés hatékonyságának növelésére a fizikailag hasonló tételeket, illetve az egyes kutatócsoportok számára fontos anyagokat több száz (!), önállóan is kereshető gyűjteménybe sorolják.

A CERN dolgozói számára kötelező leadni publikációikat a Könyvtárba, ám ez a gyakorlatban kevesebb mint 50%-os adatszolgáltatást jelent. A publikációk nagy részét rendszeresen lefuttatott webes keresések során azonosítják és gyűjtik be, így a kurrens dokumentumok feldolgozottsága közel 100%-os.

A retrospektív digitalizálási projektek eredményeként a CERN alapítása (1954) óta publikált tudományos anyagok 54%-a teljes szöveggel elérhető a CDS adatbázisban.

A már említett (és nem teljesen hatékony) önarchiválási rendelet mellett közvetlen emailekkel és reklámkampányokkal igyekeznek növelni a szerzők adat- és dokumentumszolgáltatási aktivitását. Indirekt módon ugyanezt a célt szolgálja a repozitórium fejlesztési stratégiája: a felhasználói igényeket követő, folyamatosan bővülő szolgáltatásokkal törekednek az archívumot nélkülözhetetlenné tenni a kutatók mindennapi munkájában.

Természetesen a könyvtári szolgáltatások középpontjában is a repozitórium áll: a sokféle és bonyolult objektum leírására az adatbázis a rendkívül rugalmas MARCXML formátumot használja, automatikus tárgyszógenerálást és bibliográfia-kivonatoló szolgáltatást dolgoztak ki.

 Az egyes tételek népszerűségének mérésére a Google PageRank és a Citebase módszereinek alkalmazásával, a szerver logfájljaiból generált használati statisztika alapján készülnek a nézettségi és letöltési toplisták, valamint az automatikus ajánlások („azok, akik ezt a cikket megnézték, megnézték a következőket is:”).

Különböző szociális alkalmazásokkal (wiki, fórumok és üzenőfalak, automatikus értesítés feltöltésekről, kosár használata, tartalomértékelés), valamint az adatfeltöltéshez és fájlkonverzióhoz vezető gyorslinkek segítségével lopják be a szolgáltatást a kutatók desktopjára.

TARDis: University of Southampton e-Prints

Az intézményi repozitóriumok jelentőségét felismerve az Egyesült Királyságban a JISC (Joint Information Systems Committee), az információs rendszerek finanszírozásáért felelős bizottság FAIR (Focus on Access to Institutional Repositories) nevű programjában 2002 és 2005 között több egymást kiegészítő projektet finanszírozott (DAEDALUS, ePrints UK, HaIRST, RoMEO, SHERPA, TARDis, Theses Alive!).

A University of Southampton TARDis (Targeting Academic Research for Deposit and Disclosure) projektje révén a könyvtár intézményi repozitóriumával különböző funkciókat egyesítő, az egyetem vezetésének támogatását élvező szolgáltatást hozott létre.

A projekt során létrejött egy multidiszciplináris intézményi repozitórium (e-Prints Soton: http://eprints.soton.ac.uk) az egyetemen egy korábbi projekt során kifejlesztett ePrints szoftver alkalmazásával, mely a nyílt hozzáférés támogatása és alkalmazása mellett jól használható a rendszeres akkreditációhoz (RAE: Research Assessment Exercise) szükséges jelentések előállításánál, s egyben az egyetem szellemi termésének számbavételére szolgál.

A projekt fontos csomagja volt a szolgáltatás népszerűsítése és a felhasználóképzés. A feltöltést maguk a kutatók (self-deposit), vagy minimális metaadat-információ és a dokumentum elektronikus beküldése után a projekt munkatársai végzik (mediated deposit).

Kitüntetett figyelemmel gondoskodtak az interoperabilitás lehetőségeiről az ePrints szoftvert használó intézményekkel együttműködve.

A projekt eredményeként publikált TARDis Routemap (3. kép) a projekt folyamatát, átalakulását meséli el négy ciklusra osztva (Simpson 2005):

  1. Az eredeti elképzelés szerint a JISC a helyben fejlesztett ePrints szoftver alkalmazásával, a nyílt hozzáférés szellemében épülő teljesszöveges intézményi repozitórium létrehozását finanszírozta volna.

    A projekt első lépéseként projektismertető előadásokat tartottak a kutatóknak és az egyetem vezetőségének a nyílt hozzáférés és az intézményi repozitórium előnyeiről. Már az első bemutatók tapasztalata alapján felismerték, hogy a munkafolyamat és az eredmények szemléltetésére szükséges egy tesztadatbázis építése. Az egyetem vezetésével történt egyeztetések során kiderült: az intézményben hagyományosan gyűjtik a publikációk adatait akkreditációs és promóciós célokból. A vezetőség csak abban az esetben támogatta a TARDis projektet, ha egyúttal korszerűsítheti a bibliográfiai adatok begyűjtésének mechanizmusát is anélkül, hogy a szerzőknek kétszer kellene leadniuk publikációik adatait.

    A projekt teljes újragondolására volt szükség: a nyílt hozzáférés eszméjére épülő intézményi repozitórium helyett teljes szöveg feltöltésére és tárolására is alkalmas publikációs adatbázis jön majd létre. A demo adatbázis építése során átdolgozták, újratervezték a meglevő ePrints szoftvert, s felvetődött az elhelyezett anyagok tárgyi besorolásának szükségessége is.

  2. A következő tanszéki, intézeti szintű bemutatók célja az egyes egységek sajátos igényeinek felmérése volt. Számos tanszék saját publikációs, illetve teljesszöveges adatbázissal rendelkezett. Egyértelművé vált, hogy előre kidolgozott modellekkel nem fognak boldogulni, teljesen egyénre szabott együttműködésekben kellett gondolkozni. Minden egység maga óhajtotta definiálni az adatbázisban regisztrált publikációk körét, s teljesen eltérő volt az adatbevitel preferált módja is: egyes tanszékek közvetlen adatbevitelt, míg mások meglevő adatbázis tartalmának konverzióját választották. A próbafeltöltések bizonyították a metaadatok minőségi ellenőrzésének szükségességét, ám a helyes rekordok előállítására szánt időt reális határok között kellett tartani.

    Hozzáadott szolgáltatásként a rekordokban megjelent az egyetem könyvtára által előfizetett cikkek elektronikus változatának linkje.

  3. A 3. szakaszban részletesen átgondolták, hogyan lehetne a szolgáltatást akkreditációs jelentések előállítására használni.

    Biztosították az önálló tanszéki adatbázisok kialakításának lehetőségét, és a projekt végéhez közeledve előtérbe került a szolgáltatás fenntarthatóságának kérdése.

  4. A projekt végére az e-Prints Soton 5000 rekordjából 1500 tartalmazott teljes szöveget. 2005 februárjában Stevan Harnad neve alatt megjelent a University of Southampton open access politikája („az intézmény publikációs adatainak teljes körű számbavétele promóciós és akkreditációs célból, lehetőség szerint a teljes szöveg tárolásával”), melyhez az e-Prints Soton biztosítja az infrastrukturális hátteret.

    Az adatbázis akkreditációs jelentésekhez használt szolgáltatása rendkívüli módon ösztönzi a feltöltési kedvet és az adatbázis használtságát.

    2004 decemberében az egyetem sajtóközleményben tette nyilvánossá határozatát az egyetemi könyvtár által működtetett intézményi repozitórium finanszírozásáról. Ezzel a döntéssel a repozitórium az egyetem kutatási infrastruktúrájának központi részévé vált.

A TARDis Routemap esettanulmány és útmutató: hogyan telepítsünk sikeres repozitóriumot egy nagy multidiszciplináris egyetemre. A sikeresség fenntarthatóságot jelent: élő szolgáltatást, melyet elfogad és használ az egyetem kutatói közössége, és „megvesz”, vagyis költségvetésileg támogat az egyetem vezetése. A sikeresség titka, vagyis a projekt konklúziói:

  • a repozitóriumot szolgáltatásként és nem projektként kell kezelni

  • hatékony technikai-informatikai támogatás a felhasználói igények azonnali lereagálásához

  • közvetett feltöltés szükséges, és egyben biztosítja a kutatók és könyvtárosok közötti párbeszédet

  • nagyarányú és sokrétű, valamennyi érintett csoportra irányuló ismertető-bemutató rendszer

  • a metaadatok minőségi ellenőrzése fontos és erőforrás-igényes, ám mindenképpen bizonyos határok között tartandó feladat

  • a kutatók az egyszer elkészített adatrekordot többször, különféle célokra szeretnék használni.

Az ePrints Soton a University of Southampton kutatási eredményeinek digitális repozitóriuma, mely tudományos cikkeket, könyveket, könyvfejezeteket, konferenciaanyagokat, monográfiákat, szürke irodalmat, posztereket, prezentációkat, PhD dolgozatokat tartalmaz, de tervezik 3D-, audio- és multimédia fájlok befogadását is.

A TARDis projekt során jelentős fejlesztést hajtottak végre a GNU EPrints szoftveren, s a metaadat- és bibliográfiai formátumokkal folytatott munka új funkciókkal bővítette a keretrendszert.

A projekt eredményeképpen létrejött tanulmányok (környezettanulmány, kutatási körülmények felmérése, az intézményi repozitóriumok által használt „tárgyszórendszerek” listája) haszonnal forgatható ajánlott olvasmányok az intézményi repozitóriumokkal és nyílt hozzáféréssel foglalkozó szakemberek, könyvtárosok számára.

A tudományos kommunikáció változása és a nyílt hozzáférés kezdeményezés fejlődése párhuzamos, egymással kölcsönhatásban levő folyamat. A fejlesztők az OA alkalmazásokat a kutatói szokások figyelembe vételével, azok kiszolgálására alakítják. A tudományos kommunikáció pedig a technikai, infrastrukturális és ideológiai lehetőségeket maximálisan kihasználva, egyre nagyobb mértékben alakul át. A hatás-kölcsönhatás két jól működő példája a CERN-ben és a University of Southampton-ban végzett munka. Ma mindkét intézményben központi rendelet kötelezi a kutatókat cikkeik elhelyezésére az intézményi archívumban.

Az Interneten nyíltan elérhető információk átalakítják a kutatók információszerző szokásait, megváltozik a publikációs platform: az OA kiadóknál lerövidül a közlemény megjelenésének ideje, az önarchiválás fokozatosan a munkafolyamat részévé válik. A nyílt elérésű dokumentumok megjelennek a citáció- és hatásvizsgálatok tárgyaként a tudományos munka értékelésében. Az új információforrások szétfeszítik a zárt adatbázisok szabta keretet, ezért az alkalmazásokban, módszerekben gyökeres változás, szemléletváltás következik be.

Mit tehet a könyvtár? Azt, hogy változtat: szerepet, szemléletet, stratégiát. A megváltozott terep megismerése, felmérése után egyértelmű, hogy a kutatási-publikálási folyamatban a könyvtárnak továbbra is helye van. Ez egy új szerep, mely nagyfokú aktivitást igényel: naprakész információkkal, folyamatos felhasználói kapcsolatokkal koordinálhatjuk az anyaintézményben folyó tudományos munkát egy megfelelően kialakított publikációs adatbázis és/vagy intézményi archívum kialakításával. Magyarországon talán nem egyformán befogadóképes még a tudóstársadalom ezekre az újdonságokra. Ám úgy gondolom, tudatosan készülnünk kell, hogy a megfelelő helyzet kialakulása esetén kész tervvel, javaslattal állhassunk elő.

NARCIS

A NARCIS egy nemzeti keresőportál, amelyen keresztül bepillantást nyerünk a holland kutatók tudományos életébe. Létrehozásának elsődleges célja a holland tudományos eredmények láthatóságának és elérhetőségének növelése. A Művészetek és Tudományok Holland Királyi Akadémiája (KNAW) által kezdeményezett fejlesztések szoros együttműködésben történtek az NWO-val (Holland Tudományos Kutatási Szervezet), a holland egyetemekkel és más kutatóintézetekkel.

A NARCIS a következő források tartalmaihoz biztosít hozzáférést: a holland egyetemek repozitóriumai, a KNAW, NWO és számos más kutatóintézet adattára, a DANS Intézet adathalmazai. Tartalmaz még leírásokat és ismertetőket kutatási projektekről, intézetekről és kutatókról. A tartalomszolgáltatás mellett naprakész tudományos hírekkel látja el a felhasználókat, amelyekhez teljes szövegű elérést is biztosít a honlapján. Tartalomfigyelő és RSS szolgáltatása révén a felhasználó azonnal értesül a megadott szakterület legújabb open access és kutatási eredményeiről.

A NARCIS szerkezeti felépítésének alapköve a dokumentumhoz kapcsolódó XML hordozó, amely tartalmazza az állandó azonosítót, mint kiemelt metaadatot, egy közvetlen linket a dokumentum eléréséhez és szemantikus leírásokat. Ez az XML konténer OAI-PMH protokoll alapján jut el a NARCIS rendszerébe, a linkfeloldóhoz és az eDepot-nak nevezett elektronikus archívumba (a csomag formátuma MPEG21-DIDL, a metaadat formátuma MODS, az állandó azonosító URN:NBN, a szemantikus leírások forrása az info:eu-repo szótár)A NARCIS proxiként is szolgál a Google, Google Scholar, DRIVER és OpenAIRE keresőkhöz.

A linkfeloldó megadja a dokumentum legfrissebb hosszútávú megőrzési helyét az állandó azonosító alapján, így a felhasználó bármikor elérheti a dokumentumot.Az eDepot hosszútávú megőrzést biztosít a dokumentumok számára.

8. ábra: NARCIS működése

8. ábra: NARCIS működése