본문 바로가기

# 미사용

[3-2-2]: 데이터 표준 정의

01. 표준 용어 사전

표준 단어, 도메인, 코드를 바탕으로

복합 단어(용어)에 대한 표준이 정의된 문서.

준비물

  • 표준 단어 사전
  • 표준 도메인 사전
  • 표준 코드 사전

    표준 단어 사전

모델 및 용어집을 이용하여 사용단어를 추출 후,

단어 표준에 따라 검토하고 사전에 기입.

표준 단어 기준

  • 표준성 : 현업에 친숙한 단어인지
  • 일반성 : 일반인도 이해할 수 있는 단어인지
  • 대표성 : 비슷한 의미를 가진 동의어를 대표할 수 있는지

표준 단어 사전 형식

  • 단어 정의
  • 단어 한글명, 영문명, 영문 약어명
  • 단어 종류 (단일어, 합성어, 접두사, 접미사)
  • 단어 유형 (금칙어, 유사어)

표준 단어 정의 절차

  • 현행 용어 수집
  • 단어 분할 → 주민등록번호 : 주민 + 등록 + 번호
  • 단어 정련 → 동음의이어, 동의어에서 대표단어, 영문약어 정의.

고려 사항

  • 사용빈도가 높은 단어는 분리하지 않는 것이 효과적일 수 있다.
  • 어떤 DBMS는 숫자로 시작하는 객체명을 지원하지 않는다.
  • 접두, 접미 포함 여부에 따라 전략(장단점)이 달라진다.

    표준 도메인 사전

각 데이터 타입 별로 표준 도메인을 정의.

예를들면 최대길이, 기본값, 최소값, 최대값, ...

표준 도메인 기준

  • 표준성 : 전사적으로 많이 사용되는 속성인지
  • 유일성 : 유일하게 해당 도메인 내용을 정의하고 있는지
  • 업무 지향성 : 업무의 특성을 충분히 반영하고 있는지. 

표준 도메인 사전 형식

  • 도메인 명
  • 데이터 타입
  • 데이터 정의

표준 도메인 정의 절차

  • 현행 용어 분석 및 그룹핑
  • 표준 도메인 이름, 데이터 타입 정의

고려 사항

  • 의미있는 도메인 이름을 부여한다. 
  • 기존 호환성을 위해 범위가 더 큰 도메인을 표준으로 한다.
  • 모든 용어를 포괄하는 도메인 사전은 현실적으로 어렵다.
  • 각 DBMS의 물리적 특성을 고려한다.

    표준 코드 사전

특정 상태를 표현하는 코드 값의 표준을 정의.

표준 코드 기준

  • 재사용성 :  여러 곳에서 주로 사용되는 코드를 주로 사용. (웹 상태 404)
  • 일관성 : 업무 범위 내에서 유일하게 존재해야 함.
  • 정보 분석성 : 분석 가치가 없는 데이터가 생성되지 않도록 한다.

표준 코드 사전 형식

  • 코드 이름
  • 코드 유형
  • 코드 구조
  • 코드 번호
  • 코드 값
  • 코드 소유자, 관리자
  • 코드 사용부서

코드 관리 형태

  • 단독 코드 테이블 → 하나의 코드를 하나의 테이블에서 관리. (부가정보가 있을 확률이 높음)
  • 통합 코드 테이블 → 복수의 코드를 하나의 테이블에서 관리.
  • 어플리케이션 내부 정의 → 프로그램 내부에서 코드를 관리.

표준 코드 정의 절차

  • 현행 코드 수집
  • 현행 코드 분석 (코드성 칼럼인지 데이터성 칼럼인지)
  • 현행 코드 사용 현황 분석 (누락된 코드 파악)
  • 현행 코드 상세 분석 (분류 후, 통합/분리 대상 결정)
  • 표준 코드 정의 (통합결정된 코드는 새로운 코드명 부여)

고려 사항

  • 전사적으로 사용되어야 함.
  • 향후 확장성을 고려해야 함.
  • 변경시 해당 코드를 사용중지로 설정하고, 새로운 코드를 생성.
  • 표준-현행 코드 간의 변환 매핑 정보를 별도로 기록해야 함. (데이터 이행시 참고)

02. 표준 용어 사전 정의

위에서 정의된 각종 표준 사전을 참고하여 정의한다.

표준 용어 기준

  • 표준성 : 다른 부서라도 같은 용어를 사용하도록 한다.
  • 일반성 : 이해하기 쉬운지,
  • 업무 지향성 : 업무의 특성을 충분히 반영하고 있는지,

표준 용어 사전 형식

  • 용어유형 (테이블, 칼럼, ...)
  • 표준 한글명
  • 표준 영문명
  • 설명
  • 데이터 타입
  • 표준 도메인

표준 용어 정의 절차

  • 현행 용어 분석 (표준 단어 도출)
  • 표준 단어에 대한 도메인, 코드 정의

고려 사항

  • 용어 길이가 길어지지 않도록 한다. (DBMS 이름 길이명의 한계)