Статьи
2024
FAIR Statistics: Semantically Rich Environment for LOSD Creation and Interpretation
Yury Akatkin, Konstantin Laikam and Elena Yasinovskaya
The application of FAIR principles offers new perspectives for the modernization of statistics, but at the same time, it imposes high requirements on the disseminated (meta)data. Currently, the preparation of FAIR data has a strong academic and industry basis, proved by stable implementations. However, FAIR metadata and development methods still require additional study. It is important to provide a semantically rich interpretation environment for the creation of smart (rich) metadata. This paper presents the CIS Statcommittee experience in building a semantic-oriented knowledge management system and creating smart metadata using it.
The Challenges of Linked Open Data Semantic Enrichment, Discovery, and Dissemination (GRID)
Akatkin Yu., Yasinovskaya E., Bich M., Shilin A.
Linked open data is crucial for Semantic Web development due to the ability to provide both unambiguous computer interpretation and human understanding of information. Despite the active growth, it is still not easy to discover linked data (LD), difficult to link them, and rather hard to use for collaborative processing. The implementation FAIR principles, designed to counteract semantic chaos and provide information sharing remains the most challenging. In this paper, the authors consider the possibility of data semantic enrichment based on an open LD interpretation environment. Special attention is given to technical solutions aimed at improving the LD exploring capabilities.
Управление знаниями и формирование связанных данных в Статкомитете СНГ
Ю. М. Акаткин, Е. Д. Ясиновская, А. В. Шилин, М. Г. Бич
В данной статье представлены решения, реализованные Статкомитетом СНГ в информационных системах управления знаниями, подготовки связанных данных и «умных» (богатых смыслом, семантикой) метаданных в составе строящегося датахаба СНГ. Анализ международного опыта и проведение собственных многолетних исследований позволили предложить новые подходы и технологии, к построению системы управления знаниями на базе семантической сети, позволившие связать семантические модели, интерпретируемые машинами, с человекочитаемыми представлениями знаний. Систематизация знаний о статистической методологии играет ключевую роль для повышения потенциала использования связанных данных и обеспечения совместной обработки статистических данных. Сформированный в соответствии с предложенным подходом контекст предметной области используется для разработки связанных данных и генерации «умных» метаданных, а также обеспечивает новые возможности для работы потребителей со статистическими данными и метаданными – их интерпретации, содержательного анализа, сопоставления и совместной обработки. Наряду с описанием рабочего цикла систем в статье проведен анализ проблем гармонизации статистической терминологии, выявленных в результате практической работы с доменом «Статистика труда». Отдельное внимание уделено роли экспертного сообщества в развитии системы управления знаниями.
Перейти
2023
Управление знаниями и формирование связанных данных в Статкомитете СНГ
Акаткин Ю.М., Ясиновская Е.Д., Шилин А.В., Бич М.Г.
В данной статье представлены решения, реализованные Статкомитетом СНГ в информационных системах управления знаниями, подготовки связанных данных и «умных» (богатых смыслом, семантикой) метаданных в составе строящегося датахаба СНГ. На основе анализа международного опыта и проведения собственных многолетних исследований была сформулирована цель работы – повышение эффективности и потенциала использования статистических данных за счет обеспечения однозначной содержательной интерпретации данных, в том числе в информационных системах потребителей. Для достижения этой цели авторы предложили новые подходы и технологии к построению системы управления знаниями на базе семантической сети, позволившие связать семантические модели, интерпретируемые машинами, с человекочитаемыми представлениями знаний. Решение задачи систематизации знаний о статистической методологии играет ключевую роль для повышения потенциала использования связанных данных и обеспечения совместной обработки статистических данных. Предложенный методический и технологический подход направлен на формирование контекста предметной области, который используется для разработки связанных данных и генерации «умных» метаданных, а также обеспечивает новые возможности для работы потребителей со статистическими данными и метаданными – их интерпретации, содержательного анализа, сопоставления и совместной обработки. Наряду с описанием рабочего цикла систем в статье проведен содержательный анализ проблем гармонизации статистической терминологии, выявленных в результате практической работы с доменом «Статистика труда». Отдельное внимание уделено роли экспертного сообщества в развитии системы управления знаниями.
The Concept and the Roadmap to Linked Open Statistical Data in the Russian Federation
Akatkin Yu., Laikam К., Yasinovskaya Е.
Statistics is the main domain of government data. It represents the important information and should meet customer requirements, including simple navigation and search, enriched visualization, and deep analysis. Linking helps improve the quality and accessibility of statistical data, ensuring its unambiguous interpretation due to the implementation of semantic methods. Russian Federal Statistics Service targets to provide data as LOAD. The Concept and the Roadmap for Development and Dissemination of Linked Open Statistics in Rosstat, presented in this paper, is the first step to achieve the assigned task.
2022
Collaboration At The Stage Of Semantic Assets Development
Yury M. Akatkin, Elena D. Yasinovskaya, Michail G. Bich, Andrey V. Shilin
To provide the ability for information systems to interact on a semantic level, it is necessary to join the efforts of IT-specialists and various domain experts to develop semantic assets (SA). However, during their collaboration a paradigm gap in the interaction of the developers often appears, coming from a problem of cross-disciplinary misunderstanding and resulting in multiple revisions and unsatisfactory solutions. Therefore, to achieve the outcome of SA development, adequate methodological and instrumental support of collaboration is required. The analysis of the limitations existing in standard SA management methods has led the authors to propose the approach ensuring collaboration, based on managing the workflow (WF) development. To support WF at the development stage of semantic assets life cycle, the authors suggest extending ADMS-AP (Asset Description Metadata Schema Application Profile) with a set of classes and properties, which form the ADMS-WF application profile. The process of EuroVoc localization for Russia is represented as the example demonstrating the implementation of suggested methods and tools using ADMS-WF. The proposed approach was tested in the CSI (Centre of Semantic Integration) project and its semantic integration platform.