2021. november 18-án online tartottuk meg a Könyvtári Intézet Könyvtári Minőségfejlesztési Osztályának idei második „3 lépésben” konferenciáját, amely ezúttal a könyvtár eredményeit reprezentáló adatok méréséről, azok bemutatásáról szólt. A rendezvényt mintegy 120 résztvevő hallgatta meg, a meghívott előadók a témát három nézőpontból közelítették meg.
Elsőként Vastagh Zoltán a Könyvtári Intézet Kutatási és Elemző Osztály osztályvezetőjének a Mire (lenne) jó a statisztika? című elméleti jellegű előadását hallhattuk. Az előadó tapasztalatai szerint az adatgyűjtéskor gyakran elnagyolják az adatgyűjtés előkészítését, például az adatgyűjtés céljának a meghatározását, vagy annak átgondolását, hogy a kapott eredmények valójában mire adnak majd választ, és azokat mire fogják használni. Fontos meghatározni azt is, hogy kik lesznek az adatok felhasználói. A statisztikai adatok gyűjtésének szempontjából a potenciális felhasználók négy csoportját különböztette meg az előadás: ágazati irányítás, könyvtárvezetők, kutatók és nagyközönség.
Az ágazati irányításnak többnyire pontos adatokra van szüksége; egyszerű kérdésekre keres választ. Ezek az adatok hasznosak lehetnek az ágazati döntések alátámasztásához. A könyvtárvezetők szempontjai közé tartozik, hogy a könyvtár teljesítményét másokkal össze tudják hasonlítani, hogy a könyvtár a saját maga által mért teljesítményét a fenntartónak számokkal bizonyíthassa, illetve azokat pályázatokhoz felhasználhassa. A mért adatok a szolgáltatásfejlesztésben és a szervezetfejlesztésben is hasznosulhatnak. A statisztikai adatok a kutatók számára nemzetközi összehasonlításhoz, illetve speciális témakörök vizsgálatához, mint például hatásvizsgálatok, nyújthatnak támpontot. A nagyközönséget alapvetően nem érdeklik a statisztikai adatok, de a könyvtárak jól felhasználhatják adataikat sikerlisták készítéséhez vagy reklámként. A statisztikai adatgyűjtésnél fontos szempont, hogy nem szabad leterhelni a válaszadókat, csak olyan adatokat szabad gyűjteni, amelyeket valóban felhasználunk.
Az adatszolgáltatóknak szintén négy csoportját különböztette meg az előadó: szervezetek, szervezeti egységek, dolgozók, használók. Az adatgyűjtéskor bizonyos körülmények minőségi és mennyiségi problémákat okozhatnak mindegyik adatszolgáltató csoport esetében. Felmerül például az a kérdés, hogy gyengébb teljesítés esetén kell-e retorziótól tartania a könyvtáraknak? Vagy mennyire összehasonlíthatók a dolgozói teljesítményre vonatkozó adatok? A mennyiségi vagy a minőségi teljesítmény-e a fontosabb? A használók valóban valós adatokat közölnek-e? Nincsenek-e adatvédelmi aggályaik? A felsorolt tényezők mind befolyásolhatják az adatok hitelességét.
Mindezek miatt fontos a mérési rendszer alapos előkészítése. Azaz meg kell pontosan fogalmazni, hogy mit akarunk tudni, hogy kit, miről akarunk megkérdezni. Végig kell gondolni az adatelemzés módját is. Fontos a fogalmak definiálása, olyan fogalmak használata, amelyeket mások is használnak. Fontos, hogy a mérési módszeren, a kérdések megfogalmazásán és a mérési körön (a megkérdezettek száma) ne változtassunk menet közben, s az adatokat strukturáltan tároljuk. A megbízható és hasznos mérési rendszer felépítése időbe telik és aprólékos munkával jár, melyet elrontani könnyű, de ha körültekintően készül el,, megtérül.
Petró Leonárd a Debreceni Egyetem Egyetemi és Nemzeti Könyvtár közönségkapcsolati főigazgató-helyettese sok-sok konkrét példával szemléltetve mutatta be a mérőszámok általuk használt gyűjtési módszertanát. Az adatvezérelt működés a DEENK gyakorlatában nem a statisztika miatt szükséges, hanem a belső működés alapját képezi – kapcsolódva a stratégiához. A működés minden területén keletkeznek adatok, amelyeket felhasználnak mind a gyorsan változó használói szokások figyelemmel kísérésére, mind helyzetképek alkotására, tendenciák figyelésére, eredmények mérésére, értékelésére és promóciós tartalmak készítésére, valamint döntéselőkészítésre.
Az előadó az alábbi adatgyűjtési alapelveket fogalmazta meg:
Nem azért kell adatokat gyűjteni, mert kötelező, hanem, mert az a működés minden aspektusában fontos, ezért mi magunk is elkészíthetjük a saját statisztikai rendszerünket. Fontos, hogy mindig konkrét céllal mérjünk, tudnunk kell, hogy az adatokat mire akarjuk használni, hiszen a mérés és az eredmények feldolgozása erőforrásigényes feladat. Ezért, amit lehet, automatizáltan gyűjtsünk. Az automatizált rendszerekben folyamatosan létrejönnek az adatok, amelyek bármikor lekérdezhetők. Ugyanakkor ezekere csak időszakosan van szükség.
Meghatározhatunk kvantitatív és kvalitatív adattípusokat. A kvantitatív adatok a mit, mennyit, mikor kérdésre adnak választ, a kvalitatívak pedig a miértekre. Egy mérési rendszerben e kétféle adattípust keverve érdemes használni, hogy lefedjük a működés minden elemét. Nemcsak az adatok gyűjtése, hanem a megfelelő értelmezése is fontos.
Az előadás további részében az adatalapú döntéshozatalra számos példát hallhattunk. Ilyen volt a szabadpolcos részlegek folyamatos, használói igények szerinti alakítása: figyelemmel kell kísérni, hogy az olvasók milyen dokumentumokat kérnek ki a raktárból, így akár félévente is átrendezhető a szabadpolc – az aktuális igények szerint. Szintén a mérés eredményeként tudták megállapítani, hogy megtérült-e a könyvkölcsönző automatára fordított beruházás. Kiderült, hogy az önkölcsönzések száma háromszorosa a pultnál történő kölcsönzéseknek. A kollégák a felszabadult időben más, nagyobb hozzáadott értékű feladatot tudnak végezni.
A szombati nyitvatartás igénye két beérkezett panasz kapcsán merült fel. Ezt követően egy alaposabb mérés alátámasztotta ezt a használói igényt, így gyorsan reagálva módosították a nyitvatartási időt.
A használói szokások megfigyelése nem mindig elég. Bizonyos esetekben, például honlapfejlesztésnél szükséges a felhasználói tesztelés alkalmazása is. A jól felépített kvalitatív adatgyűjtéssel megvalósítható a szolgáltatások finomhangolása, a felhasználói élmény növelése.
A harmadik előadó, Gyüre Aliz adatvizualizációs szakértő az adatvizualizálás alapjaiba vezette be a hallgatóságot. Előadását Andy Kirk definíciójával kezdte, amely szerint az adatvizualizáció „az adatok oly módon való ábrázolása és prezentálása, ami az [adatok] megértését segíti elő.” Az adatok megjelenítése függ attól, hogy milyen történtet akarunk elmesélni általuk, hogy milyen hatást szeretnénk elérni. Viszonylag apró változtatásokkal (pl. színválasztás, a diagram iránya) egész más érzelmi hatást lehet kiváltani. Ezért mindenképpen érdemes tisztázni, hogy ki a közönség, amely számára a vizualizáció készül, s hogy milyen előzetes ismerete lehet a témában. Meg kell határozni azt is, hogy mit szeretnénk elérni az ábrával: le akarjuk-e nyűgözni a szemlélőt, vagy általános képet szeretnénk adni a témáról, esetleg azt szeretnénk, ha a néző maga fedezné fel a mintázatot, illetve szeretnénk-e kiegészítő magyarázattal segíteni a megértést?
Az oszlop- és a kördiagramon kívül számos más típust is lehet alkalmazni. Alternatíva lehet például a buborékdiagram, amelyben a buborék mérete, színe is jelentéstartalommal bírhat. Az ún. hőtérkép abban lehet segítségünkre, hogy általános mintázatokat ábrázolhassunk. A kördiagram alkalmazásánál nehézséget jelenthet az egyes körcikkek arányainak megbecslése. Használhatjuk abban az esetben, ha két változónk van, vagy akkor, ha változóink 25, 50 vagy 75%-ot mutatnak. Olyankor azonban, ha fontos a precíziós értelmezés, inkább az oszlopdiagram javasolt.
Mivel a színekkel és kontrasztokkal hatékonyan irányítható a figyelem, ezért fontos, milyen színeket választunk. Hasznos gyakorlat, ha először a vizualizációnkat szürkeárnyalatosan tervezzük meg, akár papírlapon, s a színeket csak később választjuk ki. Színekkel kódolható a sorrendiség, jelölhetők az összetartozó kategóriák, kihasználhatók a természetes asszociációk, vagy játékos hatás is elérhető. A színhasználatnál figyelni kell a konzisztenciára, azaz, ha több vizualizációt készítünk a témában, ugyanazt a változót mindig azonos színnel kell jelölni. Fontos figyelni arra, hogy a legfontosabb információk azoknak is értelmezhetők legyenek, akik színtévesztési problémával küzdenek: kontrasztok használatával, feliratok kiemelésével segíthetjük a megértést. Vizualizáció készítésekor csapdát jelent: a túl sok kategória, a torzított arányok, a függőleges tengely levágása, a sztereotip ábrázolás használata, az önkényes skálaválasztás, a tartalmi rezonancia félreértelmezése, színek használata akkor, amikor valójában nincs szerepük, valamint ha akkor is vizualizálunk, amikor az felesleges.
Az előadó bemutatta egy könyvtári statisztikai példa segítségével a Power BI vizualizációs szoftver alkalmazását, amely magyar nyelven is és ingyenesen érhető el.
Az elhangzott előadások:
Vastagh Zoltán: Mire (lenne) jó a statisztika?
Petró Leonárd: Adatvezérelt működés a DEENK gyakorlatában
Gyüre Aliz: Adatvizualizációs alapok