Генеративний фреймворк для побудови візуально-текстових датасетів на основі онтологій

dc.contributor.authorЧоловський, Сергійuk_UA
dc.contributor.authorЗдирко, Владиславuk_UA
dc.date.accessioned2026-02-06T11:05:26Z
dc.date.available2026-02-06T11:05:26Z
dc.date.issued2025
dc.descriptionThis work presents a general framework for generating VQA (Visual Question Answering) datasets across arbitrary knowledge domains. Logically complex questions are derived from OWL-ready formatted ontologies, and correct answers are obtained using SPARQL queries. The diversity of generated questions is enhanced through paraphrasing with a large language model. Relevant scenes are generated using Stable Diffusion with CLIP-score–based post-filtering. We believe this hybrid approach enables efficient creation of high-quality, semantically rich datasets.
dc.description.abstractОдним з напрямків комп’ютерного зору є візуально-лінгвістична обробка зображень, він включає в себе, зокрема, такі задачі як опис(captioning), відповіді на питання за зображенням(далі VQA - visual question answering), та загальне розуміння(visual common sense reasoning). Задача VQA полягає в тому, щоб на основі зображення надати коротку відповідь на розгорнуте питання (в common sense задачах відповідь може бути довільною).uk_UA
dc.identifier.citationЧоловський С. О. Генеративний фреймворк для побудови візуально-текстових датасетів на основі онтологій / Чоловський С. О., Здирко В. В. // Теоретичні та прикладні аспекти побудови програмних систем : праці 16 Міжнародної науково-практичної конференції, 23-24 листопада 2025 року, Київ / [за заг. ред. М. М. Глибовця, Т. В. Панченка та ін. ; Факультет інформатики Національного університету "Києво-Могилянська академія" та ін.]. - Київ : НаУКМА, 2025. - С. 80-81.uk_UA
dc.identifier.urihttps://ekmair.ukma.edu.ua/handle/123456789/38281
dc.language.isoukuk_UA
dc.publisherНаціональний університет "Києво-Могилянська академія"uk_UA
dc.relation.sourceТеоретичні та прикладні аспекти побудови програмних систем : праці 16 Міжнародної науково-практичної конференції, 23-24 листопада 2025 року, Київuk_UA
dc.statusfirst publisheduk_UA
dc.subjectкомп’ютерний зірuk_UA
dc.subjectVQA-датасетиuk_UA
dc.subjectонтологічні моделіuk_UA
dc.subjectгенеративні нейронні мережіuk_UA
dc.subjectматеріали конференціїuk_UA
dc.titleГенеративний фреймворк для побудови візуально-текстових датасетів на основі онтологійuk_UA
dc.typeConference materialsuk_UA
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Cholovskyi_Zdyrko_Materialy_konferentsii.pdf
Size:
1.15 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: