Új technológiák, hagyományos konferencialátogatás

A KDK az év első felében három jelentős nemzetközi konferencián képviseltette magát személyes jelenléttel járó formában. A három alkalomban közös, hogy megannyiszor egy évek óta zajló, nagyszabású, a KDK és A 20. Század Hangja Archívum és Kutatóműhely megújulását, felhasználóbarátabbá tételét célzó munkafolyamatunk különféle vetületeit mutattuk be. A két archívum együttesen sok ezer interjúleiratot őriz; állományunk folyamatosan bővül. Ezen állomány megfelelő és részletes tartalmi leírása (tárgyszavakkal való gondos és alapos ellátása—egyebek között ezt is metaadatolásnak nevezzük) rendkívül erőforrásigényes vállalkozás, még a megfelelő tudás és segédeszközök, pl. magyar nyelvű társadalomtudományos tezaurusz megléte esetén is. A részben a MILAB projekt keretei között megvalósuló törekvésben a SZTAKI DSD munkatársaival együttműködésben interjús állományunk gépi algoritmus általi tárgyszavazásának előkészítése, majd iteratív formában az algoritmus munkájának és a saját, az archívumainkra szabott tárgyszókészlet folyamatos finomítása révén interjús anyagaink bővebb metaadatolását tűztük ki célul.

Márciusban Aachenben, az európai tudományszociológia egyik legnagyobb konferenciáján, az STS (Science and Technology Studies) Hubon vett részt a KDK három munkatársa. Előadásunkban arra a dilemmára hívtuk fel a figyelmet, ami az efféle munkafolyamatok – részben azok újdonságából, a kialakult jó gyakorlatok hiányából adódóan – központi kérdése: hogyan tudunk egyszerre egy valamilyen szempontból átfogó, a témákat lefedő, „objektív”, és könnyen átlátható tárgyszókészletet kialakítani, de úgy, hogy a kutatói interpretációs sokrétűséget is figyelembe vesszük, méghozzá egy olyan tezauruszt használva, amelyet elsődlegesen a nyugat-európai társadalomtudományokra találtak ki?

2023 júniusában Budapesten rendezték a DARIAH éves gyűlését. A DARIAH (Digital Research Infrastructure for the Arts and Humanities) egy európai kutatási infrastruktúra (Research Infrastructure), melynek célkitűzése a humántudományok és művészetek területén a digitálisan elérhető és hasznosítható kutatási anyagok létrejöttének, terjesztésének a támogatása, és a kutatás segítése. A DARIAH Annual Eventen egy poszter formájában mutattuk be a nagymennyiségű interjús anyagaink gépi feltárására és leírására létrejött projektet, az annotálás egyes folyamatait részletesebben is taglalva.

A 2023 júliusában, Milánóban rendezett ESRA (European Survey Research Association) éves konferenciáján a TK több kutatócsoportja mellett a KDK munkatársai is jelen voltak. A kérdőíves szociológiai módszereket sokféle szempontból tárgyaló, több mint 800 fős rendezvényen a gyűjteményeink gépi feldolgozással segített tematikus katalogizálásáról tartottunk előadást egy olyan szekcióban, amelyben gépi segítséggel végzett metaadatolással foglalkozó kutatókkal találkoztunk. A konferencia ezen, és számos más, hasonló témájú szekcióján kiderült, hogy a kérdőíves és az interjús kutatásoknál végzett ilyesfajta munka lényegében nem nagyon különbözik egymástól: nemzetközi sztenderdeken, főleg a European Language Social Science Thesaurus-on alapuló, de az egyes archívumokban kiegészített szókészletből válogatnak a repozitóriumok munkatársai és a kifejlesztett gépi algoritmus tematikus metaadatokat. A munka komplexitását és nehézségét az emberi interpretációk sokrétűsége, sokfélesége adja, amely nem feltétlen egyeztethető össze azzal, hogy a kutatási adatrepozitóriumokban fellelhető metaadatokról valamiféle objektivitást feltételeznek és várnak el a használók. A mesterséges intelligencia és a rendelkezésre álló digitális eszközök gyors fejlődése egy plusz löketet ad ennek a folyamatnak.