Tematikus ontológiák a társadalomtudományokban - az ONTOLISST projekt

2024 év végén indult el a nemzetközi konzorciumban, a finnországi Tampere University Finnish Social Science Data Archive, a francia SciencePo Fondation Nationale des Sciences Politiques Centre for Sociopolitical Data, valamint a TK PTI poltextLAB közreműködésével megvalósuló, a KDK által koordinált kétéves ONTOLISST projekt az Európai Unió finanszírozásában. A projektben kutatási archívumokban használt társadalomtudományos ontológiákat újfajta algoritmusokkal kombinálunk, hogy optimalizáljuk a témák hozzárendelését a többnyelvű kutatási adatgyűjtemények tartalmát leíró metaadatokban. Azt is vizsgáljuk, hogy a tematikus metaadatok közé hogyan lehet olyan standard háttérváltozókat bevonni, mint a nem vagy az életkor.

A projekt során megvizsgáljuk a fő európai kutatási infrastruktúrák/adatgyűjtési programok által alkalmazott kategorizációs rendszereket (kontrollált szótárak, ontológiák) és ezekből kiindulva létrehozunk egy egyezményes használatra szánt egyszerűsített fogalomtárat, egy ezen alapuló, gépi segédlettel történő annotálási módszert, és egy irányadónak szánt gold standard korpuszt. 

A végső cél az, hogy többnyelvű, költséghatékony digitális eszközöket hozzunk létre a társadalomtudományos (ezen belül survey-) adatok könnyebb kereshetősége és összekapcsolhatósága érdekében, javítva a társadalomtudományi kutatásokhoz való hozzáférést és azok láthatóságát a felhasználók sokféle csoportja számára, a szakértői közönségtől a politikai döntéshozókig.

A projektet az EU az OSCARS négyéves, nagy összegű Horizont Európa projekt alprojektjeként támogatja. Az OSCARS a nyílt tudomány európai elterjedését segíti elő olyan kutatási projektek támogatásával, amelyek a nyílt, FAIR tudományos alapelveken nyugszanak.

Az OSCARS-ról bővebbenhttps://oscars-project.eu/

A projekt információs oldalahttps://oscars-project.eu/projects/ontolisst-thematic-ontologies-social-science-research-data

Projektpartnerek:

További információk: Gárdos Judit, a TK Kutatási Dokumentációs Központ vezetője (E-mail: gardos.judit@tk.hu)

Konferencia-előadások:

LoveData25: International Love Data Week 2025. AI and social sciences data. Mari Kleemola (FSD), Sebők Miklós (HUN-REN), Vajda Róza (HUN-REN): The ONTOLISST project and its preliminary results on using NLP for automated topic assignment, 2025.02.10. https://www.icpsr.umich.edu/web/about/cms/3799 

1st OSCARS Annual General Meeting. Annotation of data & type of data. Vajda Róza: ONTOLISST (SSHOC), 2025.03.03. https://oscars-project.eu/events/1st-oscars-annual-general-meeting