2024 év végén indult el a nemzetközi konzorciumban, a finnországi Tampere University Finnish Social Science Data Archive, a francia SciencePo Fondation Nationale des Sciences Politiques Centre for Sociopolitical Data, valamint a TK PTI poltextLAB közreműködésével megvalósuló, a KDK által koordinált kétéves ONTOLISST projekt az Európai Unió finanszírozásában. A projektben kutatási archívumokban használt társadalomtudományos ontológiákat újfajta algoritmusokkal kombinálunk, hogy optimalizáljuk a témák hozzárendelését a többnyelvű kutatási adatgyűjtemények tartalmát leíró metaadatokban. Azt is vizsgáljuk, hogy a tematikus metaadatok közé hogyan lehet olyan standard háttérváltozókat bevonni, mint a nem vagy az életkor.
A projekt során megvizsgáljuk a fő európai kutatási infrastruktúrák/adatgyűjtési programok által alkalmazott kategorizációs rendszereket (kontrollált szótárak, ontológiák) és ezekből kiindulva létrehozunk egy egyezményes használatra szánt egyszerűsített fogalomtárat, egy ezen alapuló, gépi segédlettel történő annotálási módszert, és egy irányadónak szánt gold standard korpuszt.
A végső cél az, hogy többnyelvű, költséghatékony digitális eszközöket hozzunk létre a társadalomtudományos (ezen belül survey-) adatok könnyebb kereshetősége és összekapcsolhatósága érdekében, javítva a társadalomtudományi kutatásokhoz való hozzáférést és azok láthatóságát a felhasználók sokféle csoportja számára, a szakértői közönségtől a politikai döntéshozókig.
A projektet az EU az OSCARS négyéves, nagy összegű Horizont Európa projekt alprojektjeként támogatja. Az OSCARS a nyílt tudomány európai elterjedését segíti elő olyan kutatási projektek támogatásával, amelyek a nyílt, FAIR tudományos alapelveken nyugszanak.
Az OSCARS-ról bővebben: https://oscars-project.eu/
A projekt információs oldala: https://oscars-project.eu/projects/ontolisst-thematic-ontologies-social-science-research-data
Projektpartnerek:
- TK Kutatási Dokumentációs Központ (projektvezető)
- TK Politikatudományi Intézet poltextLAB
- TAU-FSD Tampere University Finnish Social Science Data Archive
- SciencesPo Fondation Nationale des Sciences Politiques Centre for Sociopolitical Data
További információk: Gárdos Judit, a TK Kutatási Dokumentációs Központ vezetője (E-mail: gardos.judit@tk.hu)
Konferencia-előadások:
LoveData25: International Love Data Week 2025. AI and social sciences data. Mari Kleemola (FSD), Sebők Miklós (HUN-REN), Vajda Róza (HUN-REN): The ONTOLISST project and its preliminary results on using NLP for automated topic assignment, 2025.02.10. https://www.icpsr.umich.edu/web/about/cms/3799
1st OSCARS Annual General Meeting. Annotation of data & type of data. Vajda Róza: ONTOLISST (SSHOC), 2025.03.03. https://oscars-project.eu/events/1st-oscars-annual-general-meeting