A. 필수 장비 및 자료
데스크톱(Windows 또는 Mac)
Fixity Pro(소프트웨어)
•
Fixity 사용자 가이드 버전 1.1 (2018-05-17)
•
Fixity Pro 문서
B. 지침
1.
학습 목표
a.
시나리오 1: 파일 무결성 검증
•
목적:
◦
디지털 보존 환경에서 파일 내용이 의도치 않게 변경되는 상황을 시뮬레이션하고, 체크섬을 활용하여 이러한 변경을 탐지하는 과정을 경험합니다.
•
가정된 상황:
◦
보존 중인 디지털 문서가 실수로 수정되거나, 하드웨어 오류로 인해 파일 내용이 손상된 경우를 가정합니다.
•
실습 목표:
◦
체크섬을 활용한 파일 무결성 검증 방법을 이해합니다.
◦
파일 변경이 체크섬 값에 미치는 영향을 직접 관찰합니다.
◦
디지털 보존 과정에서 정기적인 무결성 검사가 중요한 이유를 인식합니다.
b.
시나리오 2: 중복 파일 식별
•
목적:
◦
대규모 디지털 컬렉션에서 중복 파일을 효율적으로 식별하고 관리하는 방법을 경험합니다.
•
가정된 상황:
◦
여러 부서에서 수집된 디지털 자료 중 일부가 중복되었거나, 백업 과정에서 중복 파일이 의도치 않게 생성된 경우를 가정합니다.
•
실습 목표:
◦
체크섬을 활용하여 중복 파일을 식별하는 방법을 이해합니다.
◦
파일명이 다르더라도 동일한 내용을 가진 파일을 찾는 방법을 배웁니다.
◦
대규모 디지털 컬렉션에서 효율적인 저장 공간 관리 방법을 고려합니다.
이 두 가지 시나리오는 Fixity Pro를 활용하여 실제 파일을 다루며, 디지털 보존 실무에서 발생할 수 있는 문제 상황을 해결하는 경험을 제공합니다.
2.
시나리오 I: 파일 무결성 검증 (50분)
a.
프로젝트 설정 (10분)
•
데스크톱 또는 애플리케이션 폴더에서 Fixity Pro 실행
•
메인 창 상단 메뉴에서 "파일(File)"을 클릭한 후 "새 프로젝트(New Project)" 선택
•
팝업 창에서 프로젝트 이름 입력 (예: "무결성 검증")
•
체크섬 알고리즘 선택:
◦
하단의 라디오 버튼을 클릭하여 SHA256 선택
•
"생성(Create)" 버튼 클릭하여 프로젝트 생성
•
Fixity Pro 메인 창에서 "스캔할 디렉터리 추가(Add Directories to Scan)" 섹션 찾기
•
"+ 디렉터리 추가(Add Directory)" 버튼 클릭 또는 폴더를 끌어다 놓기
•
저장소 유형 선택(내부, 외부 또는 네트워크) 후 ‘저장(Save)’ 버튼 클릭
•
강의용으로 제공된 'test-files' 폴더 선택
•
선택한 폴더를 프로젝트에 추가한 후 ‘저장 프로젝트(Save Project)’ 클릭
b.
초기 체크섬 생성 (10분)
•
메인 인터페이스에서 "지금 검사(Scan Now)" 버튼 클릭하여 체크섬 생성 시작
•
팝업 메시지가 나타나면 ‘허용(Allow)’ 버튼 클릭하여 Fixity Pro가 디렉터리에 접근할 수 있도록 허용
•
진행 상태 표시줄이 나타나며 체크섬 생성 진행 상황 표시
•
프로세스가 완료될 때까지 기다림 (파일 수와 크기에 따라 몇 분 소요)
•
"마지막 검사(Last Scan)" 섹션에서 "보고서 보기(View Report)" 클릭하여 검사 보고서 열기
•
.tsv 파일이 기본 애플리케이션(Excel 또는 텍스트 편집기)에서 열림
•
보고서는 지정된 디렉터리에 자동 저장됨
c.
파일 내용 변경 (10분)
•
스캔된 디렉터리에서 파일 하나 선택
•
해당 파일을 관련 애플리케이션에서 열기
•
파일 내용에 작은 변경 적용(예: 공백 추가, 단어 변경 등)
•
수정된 파일을 원본 파일로 덮어쓰기하여 저장
•
예시 변경 사항:
◦
'test-files' 폴더에서 '84-0.txt' 파일 찾기
◦
텍스트 편집기(Notepad++, Visual Studio Code 등)에서 '84-0.txt' 파일 열기
◦
문서 상단 부근에서 "Release Date: June 17, 2008"을 찾기
◦
"2008"을 "2009"로 변경
◦
변경사항 저장 후 파일 닫기
d.
체크섬 재검증 (10분)
•
Fixity Pro로 돌아가기
•
"지금 검사(Scan Now)" 버튼 클릭하여 새로운 검사 실행
•
검사 완료까지 대기
e.
결과 분석 및 토론 (10분)
•
검사 완료 후 "보고서 보기(View Report)" 버튼 클릭
•
새로운 보고서 열기
•
보고서의 12번째 줄에서 ‘Changed Files’ 값이 1로 표시됨을 확인
•
41번째 줄에서 '84-0.txt' 파일이 ‘Changed File’ 상태로 변경됨을 확인
•
이전 체크섬 값과 새로운 체크섬 값을 비교. 초기 체크섬 값은 15:35이고, 변경된 체크섬 값은 16:23이다
•
'84-0.txt'의 체크섬 값이 변경되었음을 확인
Checksum generated time | Checksum Value |
11/5/24 15:35 | c29a4f56dd91aa894a3f17d5f96b356ccb499e3e2c5a27964de911845e39efab |
11/5/24 16:23 | 10cc354ffa8ac2ff2e10ca29ed938cdf66a1fd09496f71081b279a633d627f9c |
•
파일의 사소한 변경(연도 변경: 2008 → 2009)이 체크섬 값에 미치는 영향 관찰
•
다른 파일의 체크섬 값은 변하지 않았음을 확인
•
체크섬 변화의 의미에 대한 토론 진행
•
실제 디지털 보존 환경에서의 체크섬 활용 방법 탐색
3.
시나리오 II: 중복 파일 식별 (50분)
a.
새 프로젝트 설정
•
메인 창 상단 메뉴에서 "파일(File)"을 클릭한 후 "새 프로젝트(New Project)" 선택
•
팝업 창에서 프로젝트 이름 입력 (예: "중복 파일 식별")
•
체크섬 알고리즘 선택:
◦
하단의 라디오 버튼을 클릭하여 SHA256 선택
•
"생성(Create)" 버튼 클릭하여 프로젝트 생성
•
Fixity Pro 메인 창에서 "스캔할 디렉터리 추가(Add Directories to Scan)" 섹션 찾기
•
"+ 디렉터리 추가(Add Directory)" 버튼 클릭 또는 폴더를 끌어다 놓기
•
저장소 유형 선택(내부, 외부 또는 네트워크) 후 ‘저장(Save)’ 버튼 클릭
•
강의용으로 제공된 'test-files' 폴더 선택
•
선택한 폴더를 프로젝트에 추가한 후 ‘저장 프로젝트(Save Project)’ 클릭
b.
초기 체크섬 생성
•
"지금 검사(Scan Now)" 버튼 클릭하여 체크섬 생성 시작
•
팝업 메시지가 나타나면 ‘허용(Allow)’ 버튼 클릭
•
진행 상태 표시줄이 나타나며 체크섬 생성 진행 상황 표시
•
검사 완료 후 "마지막 검사(Last Scan)" 정보 확인
c.
파일 복사 및 중복 생성
•
파일 탐색기에서 'test-files' 폴더 열기
•
'5_25_floppy.jpg' 파일 찾기
•
해당 파일을 복사하여 '5_25_floppy2.jpg'로 이름 변경 후 저장
d.
체크섬 재검증
•
Fixity Pro로 돌아가기
•
"지금 검사(Scan Now)" 버튼 클릭하여 새로운 검사 실행
•
검사 완료까지 대기
4.
Fixity Pro 보고서 분석 (20분)
a.
결과 분석 및 토론
•
검사 완료 후 "보고서 보기(View Report)" 클릭
•
보고서의 11번째 줄에서 ‘New Files’ 값이 1로 증가했음을 확인
•
44번째 줄에서 ‘5_25_floppy2.jpg’ 파일이 ‘New File’로 감지되었음을 확인
•
기록 폴더에서 체크섬 보고서 열기
•
보고서의 14번째 줄에 있는 ‘5_25_floppy.jpg’ 와 37번째 줄의 ‘5_25_floppy2.jpg’ 체크섬 값을 비교
•
파일 이름이 다름에도 체크섬 값이 동일함을 확인 (비트스트림이 동일하기 때문)
•
이 방법을 활용하여 시스템 내 중복 파일을 탐지할 수 있음
File Name | Checksum Value |
5_25_floppy.jpg (Original File) | b8675012dc902383b6241a0c6541041940da1ab45f2227d64ce527ce612f0758 |
5_25_floppy2.jpg (New File) | b8675012dc902383b6241a0c6541041940da1ab45f2227d64ce527ce612f0758 |
5.
종합 토론 및 Q&A (20분)
a.
파일명이 달라도 대규모 컬렉션에서 중복 파일을 관리하는 방법 논의
b.
Fixity Pro의 장점 및 한계점, 실제 활용 사례에 대한 토론
C. 추가 참고사항
•
Fixity Pro의 가격, 오픈소스로 제공되지 않는 이유, 다른 컴퓨터에서 사용하는 방법 등에 대한 자세한 내용은 ‘Fixity Pro 문서’를 참조하세요.
D. 참고문헌
•
Anonymous. (2018, July 31). Digital Archiving at the University of York: Checksum or Fixity? Which tool is for me? Digital Archiving at the University of York. https://digital-archiving.blogspot.com/2018/07/checksum-or-fixity-which-tool-is-for-me_70.html
•
Archives, T. N. (n.d.). The National Archives—2. Ingest [Text]. Archives Sector; The National Archives. Retrieved November 1, 2024, from https://www.nationalarchives.gov.uk/advice-and-guidance/managing-your-collection/preserving-digital-collections/digital-preservation-workflows/2-ingest/
•
Fixity and checksums—Digital Preservation Handbook. (n.d.). Retrieved October 29, 2024, from https://www.dpconline.org/handbook/technical-solutions-and-tools/fixity-and-checksums
•
•
Fixity Pro | AVP | Aviary. (n.d.). Retrieved November 1, 2024, from https://weareavp.aviaryplatform.com/collections/1229
•
Kussmann, C. (n.d.). Research Guides: Digital Preservation Tool Guides: Checksum tools. Retrieved October 29, 2024, from https://libguides.umn.edu/dp-tool-guides/checksum
•
Which checksum algorithm should I use? (2020). Digital Preservation Coalition. https://doi.org/10.7207/twgn20-12
•
Wyk, C. S.-V. (n.d.). LibGuides: Digital preservation: Fixity. Retrieved October 29, 2024, from https://ufs.libguides.com/c.php?g=1113411&p=8118678