나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2024-04-13 05:03:53

Wayback Machine

<colbgcolor=#fff,#1f2023><colcolor=#373a3c> 웨이백 머신
Wayback Machine
파일:Wayback Machine 로고.svg
설립 1996년 5월 10일
공개 2001년 10월 24일
소유 Internet Archive
유형 저장, 미러
상태 사용 가능
광고 없음
회원가입 선택
작성 언어 C언어, Perl
링크 https://archive.org/
https://archive.org/web

1. 개요2. 기능3. 삭제 요청 확인4. 문제점
4.1. 법률적 문제4.2. 아카이빙 관련
5. 사건사고
5.1. 인터넷 아카이브 저작권 소송사건
6. 여담7. 관련 문서

[clearfix]

1. 개요

브루스터 케일이 창립한 미국의 비영리재단인 인터넷 아카이브(Internet Archive)에서 제작한 디지털 타임캡슐이다. 2023년 7월 29일 기준 현재 8150억 개의 페이지가 아카이브 되어있다. 알렉사 인터넷의 컨텐츠와 함께 유지되고 있다.

웨이백 머신에서 자체적으로 보존한 웹 페이지는 저장하고 6~12개월 후에 공개된다. 저장하는 주기가 다르기 때문에 업데이트 때마다 추적, 기록하는 건 아니다. 하지만 어떤 웹사이트는 몇 주 간격이나 또는 하루도 안되어 공개되는 경우도 있다. 게다가 해당 시간대의 들어간 사이트는 검색도 아예 못하게 되어 있다.

특정 웹 페이지의 아카이브를 원하는 경우 https://web.archive.orghttps://archive.org/web/으로 들어가서 자신이 아카이브 하기 원하는 페이지의 주소를 넣으면 된다.

이 방법으로 들어가는 사이트마다 자동으로 아카이브되게 할 수도 있다. 다만 회원제 사이트는 아카이브되지 않고, 방화벽이나 클라우드 플레어가 있는 경우도 아카이브되지 않을 수 있다. 물론 이는 개인정보를 어느 정도 보호할 수 있다는 뜻이기도 하다.

방대한 규모의 웹사이트들이 웹 크롤링을 통해 자동으로 아카이브에 저장된다.

robots.txt크롤링을 막아놓으면 크롤링하지 않는다. archive.is와 달리 자동화된 로봇으로 크롤링을 하여 아카이빙을 하기 때문이다.

PC 버전 웹페이지 주소를 입력했는데 자동으로 모바일 버전 웹페이지로 저장하는 경우가 있다.

URL의 날짜부분 끝에 fw_ 를 붙이면 툴바가 삭제된다.[예시][원본]

2. 기능

3. 삭제 요청 확인

삭제 요청을 한 경우 다음의 방법으로 자신의 요청이 어떤 상황인지 대략적으로 알 수 있다.
1. https://archivesupport.zendesk.com/ 으로 간다.
2. Sign in 을 클릭한 후 나오는 화면에서 Forgot password 를 입력.
3. 다음 화면에서, 삭제요청을 했을 당시의 본인의 이메일 주소를 입력한 후 Submit 를 클릭.
4. 그러면 본인의 이메일로 패스워드를 새로 설정하라는 메일이 archive.org 에서 오게 된다.
5. 링크를 클릭해서 나오는 화면에서 원하는 패스워드를 설정한다.
6. 다시 https://archivesupport.zendesk.com/ 로 가서 Sign in 을 클릭한 후, 본인의 이메일과 방금 설정한 패스워드로 로그인을 한다.
7. 로그인 후 https://archivesupport.zendesk.com/hc/en-us/requests 로 이동. My requests 항목에 자신의 요청이 있는 것을 확인. 내용을 클릭하면 요청이 제대로 들어간건지 알 수 있다. 만약 보낸 내용이 매우 길 경우 시스템에서 스팸으로 블락 했을수도 있으니 확인하는게 좋다.

로그아웃은 https://archivesupport.zendesk.com/access/logout 로 할 수 있다.

참고로 Status 항목에 open 이라고 써 있는것은 요청 처리중이라는 뜻 인데, Last activity 부분의 날짜가 한달을 넘었는데도 그대로면 무시당했다고 보면 된다. 또한 Status 가 solved 라고 나와있으면서 어두운 회색일 때는 처리 완료 되었다는 뜻인데, 그럼에도 불구하도 실제로 아무것도 해결되지 않았을 경우, 마찬가지로 무시당했다고 보면 된다.

4. 문제점

4.1. 법률적 문제

웨이백 머신, 나아가 인터넷 아카이브 전체가 단순한 박제를 위한 아카이브는 아니지만, 근본적으로 archive.today의 문제점 중 일부 문제(특히 저작권)를 공유한다.

DMCA 관련 문제는 '받아주는' 편이지만, 어지간한 이유나 법적 근거가 있지 않는 한 전부 받아줘야 한다. DMCA 요청 자체가 정확한 법 조항을 근거로 요청자의 법적 신분을 공개하고 선서를 동봉해서 보내는 것이므로 법적 효력이 있기 때문이다. 얼티밋 워리어의 옛 블로그가 이런 식으로 아카이빙에서 제외된 바 있다. # Gizmodo 뉴스

4.2. 아카이빙 관련

5. 사건사고

5.1. 인터넷 아카이브 저작권 소송사건


2020년 코로나19가 강타했을 때 미국 전역에 있는 도서관들이 문을 닫는 일이 생기자, 인터넷 아카이브는 동년 3월 24일부터 6월 16일까지 대출 시간을 1시간에서 2주로 늘리는 National Emergency Library을 운영하였다.[5] 그러다 동년 7월 1일에 Hachette Book Group, Inc외 3사에서 인터넷 아카이브 측에 공정사용이 아니라는 이유로 소송을 제기했다.[6]

약 3년 뒤인 2023년 3월 24일에 법원이 인터넷 아카이브가 Hachette사 외 3사의 저작권을 침했다는 판결을 내렸다.[7] 현재 인터넷 아카이브 측은 항소를 진행하고 있다.

샌프란시스코 시청 계단에서 집회를 하였다. 이유는 디지털 대출을 찬성해라는 집회였다.

소송 타임라인

6. 여담

7. 관련 문서



[예시] https://web.archive.org/web/20180101010338fw_/http://www.example.com:80/[원본] https://web.archive.org/web/20180101010338(비움)/http://www.example.com:80/[3] 대부분이 있다는 것은 꽤 신기한 내용인데, 없을 것 같으면서도 있는 경우가 꽤 있다. 나온 지가 엄청 오래되어 공식 홈페이지가 폐쇄되어 더 이상 패치를 받을 수 없게 된 수많은 고전게임들도 웨이백머신을 사용하면 웬만한 패치를 받을 수 있을 정도.[4] 단 Windows 95의 중요 업데이트 같은건 소스를 뜯어서 링크를 얻어내야 한다.[5] #[6] 뉴욕타임즈[7] 판결문 타임즈 보도[8] Toasty Tech의 운영자인 Nathan Lineback이 만들었다.[9] Protoweb에선 자체적으로 보관하고있는 웹페이지가 얼마 없는데다 수많은 웹페이지들을 다 보관하지 못한다. 거기다가 저작권 문제같은 변수도 있고.. 문제는 일부 URL에서 경로가 포함된 경우 좀 기다렸다가 새로고침을 하면 가능하지만 이렇게해도 불가능한 경우가 있다..[10] 당시 WWW의 크기는 2.5테라바이트에 불과했다.