PIPC Decision Insights

데이터 품질 Full Report

결측, 장르 품질, 검수 우선순위

원본 XML
3,990
결정문 본문
중복 ID
0
품질 점검
기타 장르
355
라벨 정제 대상
본문 0자
0
파서 기준

핵심 인사이트

전체 필드 결측률

main_text100%background_text100%monetary_amount82%objection_text79%case_type63%sanction_types60%violated_articles59%appendix_text40%meeting_type27%applicant11%agenda_no6%title5%signature_text4%summary_text4%factors3%agency1%order_text1%decision_date0%

장르별 주요 결측률

document_categorytitleapplicantorder_textreason_textsummary_text
complaint_or_interpretation00.1210.01720.01720
data_provision_request00.00787000
enforcement0.07890.2060.0230.005480.0559
other0.3550.4540.07040.005630.29
prior_review00.125000
privacy_impact_review00.00124000
public_system_inspection00.865000

추가 검수 우선순위

prioritytargetcountreason
1고액 제재 사건18금액 추출과 병합 사건 검수가 필요
2기타 장르355정책·해석·제공요청이 섞였을 가능성
3제목 결측198과거 XML 구조 보정 필요

데이터 품질 보고서는 RAG와 회귀분석 전에 반드시 확인해야 한다. 특히 제목 결측·기타 장르·고액 사건은 수작업 검수 가치가 높다.