Use Case

  • 공공
  • 기타

재현 데이터 생성 기술 및 평가지표 개발

재현자료 생성 기술 및 평가지표 개발을 통해 안전한 데이터 활용 기반을 마련합니다.

재현 데이터 생성 기술 및 평가지표 개발

Business Problem

디지털 대전환 시대에 데이터는 핵심 자산이지만, 개인정보 보호와 데이터 유용성 간의 균형이 어려운 상황입니다. 특히 안전한 데이터 공유와 활용을 위한 기술적 기반이 미흡해 데이터 경제 활성화에 제약이 발생하고 있습니다.

Goals

재현자료 생성 및 평가 기술을 개발하여 통계 데이터의 안전한 활용을 가능하게 하고, 이를 통해 데이터 기반 경제 활성화에 기여합니다. 또한, 기술의 시장 안착을 위한 기반을 마련해 지속적인 확산을 도모합니다.

Analysis

통계청 등 주요 수요처의 요구를 반영한 통계 마이크로데이터 및 서베이 데이터 등을 수집하고, 위치정보(SGIS)와 같은 외부 지리정보도 연계 분석에 활용합니다. 재현자료의 안전성과 유용성을 동시에 확보하기 위해 정량적 평가 지표를 개발하고, 다양한 형태와 변수 특성을 지닌 통계 데이터를 처리할 수 있는 재현자료 생성 기법을 고도화합니다. 위험도 및 유용성을 평가할 수 있는 총 6개의 지표를 설계하고, Score-based Generative Model, 베이지안 다중 대치 기법 등 5가지 생성 알고리즘을 개발하여 재현자료의 품질을 높입니다. 더불어, 생성 대상 데이터의 특성과 요구 수준에 따라 적절한 생성 기법을 자동으로 추천할 수 있도록 Cohen’s kappa 기반의 추천 알고리즘도 구축합니다.

Solution

이러한 통합적 분석 방법론은 실사용자 중심의 데이터 활용 환경을 조성하는 데 기여합니다. R 기반 공개 SW 개선 및 신규 개발을 통해 재현자료 생성 도구의 활용성을 높였습니다. 이를 통해 재현자료의 신뢰성과 접근성을 높이고, 데이터 보호와 활용의 조화를 달성했습니다.

이 홈페이지는 Chrome(크롬)과 Edge(엣지)에 최적화 되어있습니다.

Chrome(크롬)과 Edge(엣지) 브라우저의 사용을 권장드립니다.