2. Fixity Pro (2) 체크섬을 활용한 무결성 검증 실습

A. 필수 장비 및 자료

데스크톱(Windows 또는 Mac)
Fixity Pro(소프트웨어)
Fixity 사용자 가이드 버전 1.1 (2018-05-17)
Fixity Pro 문서

B. 지침

1.
학습 목표
a.
시나리오 1: 파일 무결성 검증
목적:
디지털 보존 환경에서 파일 내용이 의도치 않게 변경되는 상황을 시뮬레이션하고, 체크섬을 활용하여 이러한 변경을 탐지하는 과정을 경험합니다.
가정된 상황:
보존 중인 디지털 문서가 실수로 수정되거나, 하드웨어 오류로 인해 파일 내용이 손상된 경우를 가정합니다.
실습 목표:
체크섬을 활용한 파일 무결성 검증 방법을 이해합니다.
파일 변경이 체크섬 값에 미치는 영향을 직접 관찰합니다.
디지털 보존 과정에서 정기적인 무결성 검사가 중요한 이유를 인식합니다.
b.
시나리오 2: 중복 파일 식별
목적:
대규모 디지털 컬렉션에서 중복 파일을 효율적으로 식별하고 관리하는 방법을 경험합니다.
가정된 상황:
여러 부서에서 수집된 디지털 자료 중 일부가 중복되었거나, 백업 과정에서 중복 파일이 의도치 않게 생성된 경우를 가정합니다.
실습 목표:
체크섬을 활용하여 중복 파일을 식별하는 방법을 이해합니다.
파일명이 다르더라도 동일한 내용을 가진 파일을 찾는 방법을 배웁니다.
대규모 디지털 컬렉션에서 효율적인 저장 공간 관리 방법을 고려합니다.
이 두 가지 시나리오는 Fixity Pro를 활용하여 실제 파일을 다루며, 디지털 보존 실무에서 발생할 수 있는 문제 상황을 해결하는 경험을 제공합니다.
2.
시나리오 I: 파일 무결성 검증 (50분)
a.
프로젝트 설정 (10분)
데스크톱 또는 애플리케이션 폴더에서 Fixity Pro 실행
메인 창 상단 메뉴에서 "파일(File)"을 클릭한 후 "새 프로젝트(New Project)" 선택
팝업 창에서 프로젝트 이름 입력 (예: "무결성 검증")
체크섬 알고리즘 선택:
하단의 라디오 버튼을 클릭하여 SHA256 선택
"생성(Create)" 버튼 클릭하여 프로젝트 생성
Fixity Pro 메인 창에서 "스캔할 디렉터리 추가(Add Directories to Scan)" 섹션 찾기
"+ 디렉터리 추가(Add Directory)" 버튼 클릭 또는 폴더를 끌어다 놓기
저장소 유형 선택(내부, 외부 또는 네트워크) 후 ‘저장(Save)’ 버튼 클릭
강의용으로 제공된 'test-files' 폴더 선택
선택한 폴더를 프로젝트에 추가한 후 ‘저장 프로젝트(Save Project)’ 클릭
b.
초기 체크섬 생성 (10분)
메인 인터페이스에서 "지금 검사(Scan Now)" 버튼 클릭하여 체크섬 생성 시작
팝업 메시지가 나타나면 ‘허용(Allow)’ 버튼 클릭하여 Fixity Pro가 디렉터리에 접근할 수 있도록 허용
진행 상태 표시줄이 나타나며 체크섬 생성 진행 상황 표시
프로세스가 완료될 때까지 기다림 (파일 수와 크기에 따라 몇 분 소요)
"마지막 검사(Last Scan)" 섹션에서 "보고서 보기(View Report)" 클릭하여 검사 보고서 열기
.tsv 파일이 기본 애플리케이션(Excel 또는 텍스트 편집기)에서 열림
보고서는 지정된 디렉터리에 자동 저장됨
c.
파일 내용 변경 (10분)
스캔된 디렉터리에서 파일 하나 선택
해당 파일을 관련 애플리케이션에서 열기
파일 내용에 작은 변경 적용(예: 공백 추가, 단어 변경 등)
수정된 파일을 원본 파일로 덮어쓰기하여 저장
예시 변경 사항:
'test-files' 폴더에서 '84-0.txt' 파일 찾기
텍스트 편집기(Notepad++, Visual Studio Code 등)에서 '84-0.txt' 파일 열기
문서 상단 부근에서 "Release Date: June 17, 2008"을 찾기
"2008"을 "2009"로 변경
변경사항 저장 후 파일 닫기
d.
체크섬 재검증 (10분)
Fixity Pro로 돌아가기
"지금 검사(Scan Now)" 버튼 클릭하여 새로운 검사 실행
검사 완료까지 대기
e.
결과 분석 및 토론 (10분)
검사 완료 후 "보고서 보기(View Report)" 버튼 클릭
새로운 보고서 열기
보고서의 12번째 줄에서 ‘Changed Files’ 값이 1로 표시됨을 확인
41번째 줄에서 '84-0.txt' 파일이 ‘Changed File’ 상태로 변경됨을 확인
이전 체크섬 값과 새로운 체크섬 값을 비교. 초기 체크섬 값은 15:35이고, 변경된 체크섬 값은 16:23이다
'84-0.txt'의 체크섬 값이 변경되었음을 확인
Checksum generated time
Checksum Value
11/5/24 15:35
c29a4f56dd91aa894a3f17d5f96b356ccb499e3e2c5a27964de911845e39efab
11/5/24 16:23
10cc354ffa8ac2ff2e10ca29ed938cdf66a1fd09496f71081b279a633d627f9c
파일의 사소한 변경(연도 변경: 2008 → 2009)이 체크섬 값에 미치는 영향 관찰
다른 파일의 체크섬 값은 변하지 않았음을 확인
체크섬 변화의 의미에 대한 토론 진행
실제 디지털 보존 환경에서의 체크섬 활용 방법 탐색
3.
시나리오 II: 중복 파일 식별 (50분)
a.
새 프로젝트 설정
메인 창 상단 메뉴에서 "파일(File)"을 클릭한 후 "새 프로젝트(New Project)" 선택
팝업 창에서 프로젝트 이름 입력 (예: "중복 파일 식별")
체크섬 알고리즘 선택:
하단의 라디오 버튼을 클릭하여 SHA256 선택
"생성(Create)" 버튼 클릭하여 프로젝트 생성
Fixity Pro 메인 창에서 "스캔할 디렉터리 추가(Add Directories to Scan)" 섹션 찾기
"+ 디렉터리 추가(Add Directory)" 버튼 클릭 또는 폴더를 끌어다 놓기
저장소 유형 선택(내부, 외부 또는 네트워크) 후 ‘저장(Save)’ 버튼 클릭
강의용으로 제공된 'test-files' 폴더 선택
선택한 폴더를 프로젝트에 추가한 후 ‘저장 프로젝트(Save Project)’ 클릭
b.
초기 체크섬 생성
"지금 검사(Scan Now)" 버튼 클릭하여 체크섬 생성 시작
팝업 메시지가 나타나면 ‘허용(Allow)’ 버튼 클릭
진행 상태 표시줄이 나타나며 체크섬 생성 진행 상황 표시
검사 완료 후 "마지막 검사(Last Scan)" 정보 확인
c.
파일 복사 및 중복 생성
파일 탐색기에서 'test-files' 폴더 열기
'5_25_floppy.jpg' 파일 찾기
해당 파일을 복사하여 '5_25_floppy2.jpg'로 이름 변경 후 저장
d.
체크섬 재검증
Fixity Pro로 돌아가기
"지금 검사(Scan Now)" 버튼 클릭하여 새로운 검사 실행
검사 완료까지 대기
4.
Fixity Pro 보고서 분석 (20분)
a.
결과 분석 및 토론
검사 완료 후 "보고서 보기(View Report)" 클릭
보고서의 11번째 줄에서 ‘New Files’ 값이 1로 증가했음을 확인
44번째 줄에서 ‘5_25_floppy2.jpg’ 파일이 ‘New File’로 감지되었음을 확인
기록 폴더에서 체크섬 보고서 열기
보고서의 14번째 줄에 있는 ‘5_25_floppy.jpg’ 와 37번째 줄의 ‘5_25_floppy2.jpg’ 체크섬 값을 비교
파일 이름이 다름에도 체크섬 값이 동일함을 확인 (비트스트림이 동일하기 때문)
이 방법을 활용하여 시스템 내 중복 파일을 탐지할 수 있음
File Name
Checksum Value
5_25_floppy.jpg (Original File)
b8675012dc902383b6241a0c6541041940da1ab45f2227d64ce527ce612f0758
5_25_floppy2.jpg (New File)
b8675012dc902383b6241a0c6541041940da1ab45f2227d64ce527ce612f0758
5.
종합 토론 및 Q&A (20분)
a.
파일명이 달라도 대규모 컬렉션에서 중복 파일을 관리하는 방법 논의
b.
Fixity Pro의 장점 및 한계점, 실제 활용 사례에 대한 토론

C. 추가 참고사항

Fixity Pro의 가격, 오픈소스로 제공되지 않는 이유, 다른 컴퓨터에서 사용하는 방법 등에 대한 자세한 내용은 ‘Fixity Pro 문서’를 참조하세요.

D. 참고문헌

Anonymous. (2018, July 31). Digital Archiving at the University of York: Checksum or Fixity? Which tool is for me? Digital Archiving at the University of York. https://digital-archiving.blogspot.com/2018/07/checksum-or-fixity-which-tool-is-for-me_70.html
Archives, T. N. (n.d.). The National Archives—2. Ingest [Text]. Archives Sector; The National Archives. Retrieved November 1, 2024, from https://www.nationalarchives.gov.uk/advice-and-guidance/managing-your-collection/preserving-digital-collections/digital-preservation-workflows/2-ingest/
Fixity and checksums—Digital Preservation Handbook. (n.d.). Retrieved October 29, 2024, from https://www.dpconline.org/handbook/technical-solutions-and-tools/fixity-and-checksums
Fixity Pro. (n.d.). AVP. Retrieved October 29, 2024, from https://home.fixitypro.com/fixity-pro/
Fixity Pro | AVP | Aviary. (n.d.). Retrieved November 1, 2024, from https://weareavp.aviaryplatform.com/collections/1229
Kussmann, C. (n.d.). Research Guides: Digital Preservation Tool Guides: Checksum tools. Retrieved October 29, 2024, from https://libguides.umn.edu/dp-tool-guides/checksum
Which checksum algorithm should I use? (2020). Digital Preservation Coalition. https://doi.org/10.7207/twgn20-12
Wyk, C. S.-V. (n.d.). LibGuides: Digital preservation: Fixity. Retrieved October 29, 2024, from https://ufs.libguides.com/c.php?g=1113411&p=8118678