<colbgcolor=#fffbe1><colcolor=#000> archive.today | |
종류 | 웹페이지 캡쳐, 미러, 아카이브 |
국가 | 알 수 없음 |
언어 | 영어, 한국어 등 |
회원가입 | 비회원 사이트 |
개설 | 2012년 |
영리 여부 | 영리 |
서버 위치 | 일정주기로 교체[1][2] |
운영비 | 한 달에 약 2000달러[3] |
접속 상태 | 가능 |
주소 | [RE] | | |
미러 링크[5][6] |
[clearfix]
1. 개요
특정 페이지를 영구히 저장하여 나중에 열람할 수 있도록 만들어진 무료 서비스이다. 웹 사이트는 보존하고 싶은 URL을 입력하는 부분과 저장된 아카이브 스냅샷을 검색하는 부분으로 나뉘어 있다. 물론 로그인해야 볼 수 있는 등의 제한이 걸린 곳을 아카이브할 때에는 브라우저가 로그아웃 등의 기본 상태에서 아카이브한 것과 같은 효과가 난다. 그 외에도 움직이는 프레임이나 소리는 구현 불가능하다.로그인이나 광고 없이 단순히 보존하고 싶은 URL을 입력하면 잠시 크롤링 과정을 거친 후 해당 URL을 보존하여 추후 원본이 삭제되더라도 열람할 수 있다.
스마트폰으로도 접속과 이용이 가능하다. 다만 모바일 버전은 없고 PC버전으로만 가능하다는 게 단점.
사실 허가받지 않는 무단 미러링은 엄연히 불법이다. 만약 좋지 않은 일이 발생했을 때 책임은 온전히 보존 명령을 입력한 본인이 지게 되므로, 주의해서 사용하는게 좋다. 특히 해당 웹사이트는 이용자의 IP 주소뿐만 아니라 다른 정보까지 동의 없이 수집하고 있는 것으로 알려져 있다.
2. 사용법
사용 방법은 크게 3가지로 나뉜다.- 아카이브 홈페이지로 이동하여 직접 URL을 입력
- 또는
javascript:void(open('https://archive.is/?run=1&url='+encodeURIComponent(document.location)))
를 북마크에 추가하여 보관하고 싶은 웹 페이지에서 누름 - 또는 크롬의 아카이브 확장 프로그램[16]을 사용할 수도 있다.
어떠한 방법이든 몇 분 가량의 로딩 이후 영구적으로 열람이 가능한 URL을 만들어 준다.
나무위키의 FrontPage를 보존한 모습. 나무위키 초창기의 프레임 형태를 볼 수 있다.[17]
3. 용도
아카이브 과정을 거친 URL에는 Text로 저장된 형태와 이미지로 저장된 형태의 총 2가지의 열람 방식을 제공하며 이밖에도 원본 URL의 위치, 저장된 날짜, 그리고 다운로드 URL이 제공된다.로그인이나 별다른 사전 지식 없이도 웹페이지를 영구히 저장할 수 있다는 점에서 삭제되거나 변경될 가능성이 높은 문서를 보존하는 용도로 널리 쓰일 수 있다. 예를 들어 웹페이지의 게시글을 추후 오해의 여지가 없도록 보존하는데에 사용될 수 있다. 그 이외에도 이미지를 드래그할 수 없는 사이트에서 이미지를 옮길 때 이용할 수 있다. 허나 과유불급인 게 보존하지 말아야 할 것까지 URL만 알면 누구나 볼 수 있게 영구적으로 보존한다는 점이다.
4. 삭제 방법
만약 어떤 식으로든 해당 사이트에 복사된 아카이브로 인해 피해를 입은 피해자거나 해당 피해자의 법률적 대리인이라면, 경찰에 신고하는 것 말고는 방법이 없다.허나 대한민국에서 경찰에 신고를 해도, 해외 사이트라 수사 삭제는 불가능하다는 답변과 차단만 가능하다는 답변을 받을 확률이 매우 높다. 한국 경찰이 해외 사이트까지 수사하지도 않고는 공조하는 것도 불가능하다. 예외적으로 해외와 협조해서 수사하는 경우는 테러, 아동 포르노 등 아주 커다란 사이버 범죄들 뿐이다.
신고 기능으로 신고를 하면서 메일 주소를 남기면, 메일 주소로 자동응답이 오는데, 삭제를 원한다면 법률서류를 준비해서 프랑스로 직접 항공우편으로 보내라는 황당한 요구를 한다.
현재 운영자가 타인과 소통하는 유일한 창구는 질문 답변 두 곳 뿐이며, 여타 다른 수단을 통해서라도 질문 쪽에 삭제에 관련된 모든 질문은 철저히 무시하고 있다. 사실 운영자가 처음부터 공정 이용을 상정해둔 게 아니라 개인적으로 자료를 찾고 싶은데 못 찾을 때가 싫어서 만들었을 뿐이라는 노선이라 처음부터 오용에 의한 피해에 남일이라고 모른 척할 생각으로 무책임했다. 애용자라고 다를 바 없는 것이 저작권 침해 소송을 피하기 위해서 아카이브를 애용하겠다고 한데다 운영자가 무책임하게 쓸 거면 더 좋은 도구를 쓰라고 부추기는 등(웨이백머신) 할 말이 없다.
그러니 만약 해당 아카이브가 수집한 웹페이지에 불법적인 내용이 담겨져 있었다던가, 혹은 아카이브 때문에 피해를 입고 있는 사람이 있다던가 한다면 해당 웹사이트의 서버가 있는 국가에 신고하거나 법적 도움을 줄 수 있는 사람을 찾는 것 말고는 방법이 없다.
문제는 이 경우, 직접 해당 국가의 국가기관에 법률적 요청을 하게 되면 일이 처리되는데 보통 몇개월은 걸리는데, 문제는 이 웹사이트가 주기적으로 주로 미국법률이 통하지 않는 서버들로 옮겨 다니고 있다는 것이다. 당연히 서버들 중 하나를 어찌어찌 찾아서 해당 국가에 도움을 요청해도, 이미 다른 곳으로 서버를 옮겨서 더 이상 해당 국가의 관할이 아니게 된다.
실제로 몇몇 도메인의 경우 법률적 간섭을 피하기 위해서 몇몇 국가들 쪽 에서는 접속이 불가능하게 막아놓은 것을 프록시 서버를 사용하면 확인 할 수 있다.
다만, 웹사이트 내에 본인이 있고, 본인이 찍었음[18]을 입증할 수 있는 사진이 있을 경우, DMCA를 통해 구글 검색 결과에서 1차적으로 아카이브 페이지를 숨길 수는 있다.#
재력이 뒷받침된다면 변호사를 선임하여 법적 절차를 받는 것이 그나마 가능성이 있지만, archive.today 라고 하면 법률가들도 기피하기 때문에 확실히 제대로 된 변호사를 찾지 않으면 그냥 시간 낭비이다. 사이트의 데이터에 대해 강제적인 삭제 조치를 할 수 있는 것은 검열을 금지하는 민주주의 헌법을 가진 나라에서는 법원뿐이다.
만약 리벤지 포르노 건이라면 경찰 말고도 여성부 소속의 정부기관에서 삭제 처리를 대행해 주므로 그쪽에 문의해 볼 수 있다. 단 이것도 상기 문제로 시일이 오래 걸린다는 것을 명심. 그나마 아동 포르노의 경우에는 관련 페이지를 차단하는 것으로 보인다.
2023년 7월 기준으로 더 이상 도망칠 서버가 없는건지 러시아 IP를 활용하는 사이버 망명을 돕는 회사들 쪽으로 옮긴 상태이다.
5. 문제점 및 주의사항
사실상 법적, 도덕적으로 불법에 가까운 서비스를 제공하면서, 그와 관련된 제대로 된 피드백 자체가 전무하다.- 저작권 문제 - 저작권자의 동의 없이 무단으로 저작물이 박제되는 경우가 많다. 비록 제3자가 박제를 요청했다고 하더라도, 타인의 저작물을 공개하는 것은 저작권법상 문제가 있다. 사진이나 웹툰뿐더러 글도 저작물이다. 작성되는 순간에 저작권이 발생한다. 심지어 유료화된 네이버 웹툰까지도 박제가 되어 있다.
- 아카이빙 대상 사이트의 업무방해 - 많은 인터넷 사이트는 광고를 수익 모델로 한다. 이 서비스는 인터넷 사이트의 콘텐츠를 무단으로 저장하여 해당 사이트의 트래픽을 감소시켜 광고 수익을 방해할 수 있다. 콘텐츠 작성자의 편집권을 위축시켜 인터넷 사이트의 콘텐츠 생산을 감소시켜 결과적으로 광고 수입 감소로 연결될 수도 있다. 특히 페이스북은 archive.today 운영자의 계정을 생성할 때마다 지속적으로 차단 중이다.
- 개인정보 침해 문제 - 개인정보 보호법에 따르면 개인정보를 수집하는 경우에는 개인정보가 수집되는 당사자의 동의 아래에 보유 목적과 기한 등이 정해져야 하며, 나중에 파기되는 방법이 존재해야 한다. 그러나 이 서비스는 이름, 사진, 이메일, 아이디, 아이피 주소, 홈페이지, 사생활, 종교, 정치적 견해, 성적 취향 등 개인정보가 포함된 콘텐츠를 당사자의 동의 없이 수집하여 심지어 영구적으로 보관하겠다고 주장하고 있다. 비록 삭제를 요청하는 부분이 형식적으로 존재하지만 사실상은 삭제가 어렵다고 알려져 있다. 이는 개인정보보호법뿐만 아니라 초상권, 명예훼손도 문제가 될 수 있다. 더구나 요즘에 대두되는 잊힐 권리 등 헌법상 행복추구권을 정면으로 무시하는 것처럼 보인다. 피해자는 심각한 고통을 겪을 수 있다. 해외에 서버가 있기 때문에 피해를 법적으로 규제하기도 어려워 보인다.
- 테러 선전, 아동성범죄 등 심각한 범죄 콘텐츠의 우회적인 유통경로가 될 가능성 - 예를 들어 불법 아동 음란물 같은 불법게시물을 보고 처벌이나 신고의 증거를 확보하기 위해 '공개된'아카이브 웹사이트에 아카이빙을 요청하는 것은, 결국 해당 음란물을 보존하고 유포하는 행위와 동일하다는 것을 명심해야 한다. 증거의 확보 보존 같은것은 공개하지 말고, ctrl + s 등으로 저장하거나, PDF로 캡쳐를 하여 가지고 있다가 경찰에 신고할 때 같이 제출하는게 바람직하다. 관리자 질문 게시판에 테러 선전 게시물이나 아동성범죄 게시물이 아카이브 되었을 경우 해당 게시물에 대한 삭제 요청을 하면, 경찰한테 신고하라고 빈정대는 답변을 하는 것을 볼 수 있다.
- 사실상 불가능한 삭제 - 수집 보존하는 것 뿐만이면 몰라도, 그걸 누구나 볼 수 있게 공개하는 행위 자체가 법적 논란에 휘말릴 수 있는 행위이므로, 대부분의 아카이브 사이트는 어지간한 삭제 요청의 경우 다 제대로 응대 해준다. 허나 이 archive.today의 경우, 대부분의 삭제 요청 자체를 원천적으로 무시, 거부하는 상태이므로 문제가 된다. 연락처 자체도 전부 가짜이며, 심지어는 다른 회사주소를 사칭하기까지 한다.
이하는 기술적 주의사항이다.
저장하는 페이지는 모든 데이터를 저장하지는 않으므로 주의를 요한다. 크게 저장되지 않는 것들로는 플래시 파일이나 플래시를 기반으로 한 모든 것, 비디오나 소리, PDF, RSS, XML 등이 있으며, 그 밖에 50 MB 용량제한이 있다.
또한 다음 카페 등 어느 정도의 폐쇄성을 지닌 서비스는 저장이 제대로 되지 않을 수 있다.
더 자세한 사항은 FAQ에서 확인할 수 있다.
일부 사이트에선 아카이빙이 막혀있는데, 네이버 블로그의 경우 암호화를 사용하여 한글이 이상하게 깨져서 아카이빙된다. 물론 웨이백머신으로 네이버 블로그를 백업한 다음, 그 웨이백머신으로 archive.is로 백업하는 식으로 우회할 수도 있다.
트위터 링크의 경우는 리트윗 숫자가 표시되지 않듯이 제대로 아카이빙되지 않는다.
아카이빙 서버 일부가 나무위키에서 차단된 IP 대역에 들어있어 2020년 4월 말부터 나무위키 문서를 아카이브하려고 하면 403이 뜬다. 내부적으로 여러 서버를 기간별로 돌려가면서 사용하고 있는 것으로 추정된다.
6. 역사
사실 site라는 검색어 연산자를 이용하면 더욱 더 정확한 검색이 된다. 아카이브.is를 site연산자를 이용해 검색하고 한국어 필터를 적용한 결과
여기까지 보면 그저 유용한 웹페이지로 보일 수 있으나 실제 목적은 바로 흑역사 캡처 및 보존.
그전까지도 유용하게 사용된 웹사이트이지만, 리그베다/나무위키에 도입된 건 리그베다 위키 사유화 사태 때 유사시를 대비해서 사용한 것이 사실상 최초이다.[19] 이후 여성시대 해명글 조작 사태를 계기로 여성시대 회원들에 의한 여성시대/사건 사고 등 관련 문서의 지속적인 반달과 문서 내 출처 자료의 원본 데이터 삭제가 문제가 되면서 떠오른 백업
2015년 8월 말부터 한국어 번역이 뜬다.
2019년 1월 21일은 접속이 되지 않았다. 주소를 치면 '이 페이지에 연결할 수 없음'이 떴다. 아마 서버가 메롱인 듯했다(...).
2020년 이후는 접속이 원활히 잘 된다.
2021년 9월 8일도 접속이 되지 않았다.
2023년 11월 13일 기준으로 접속이 되지 않는 중이다.
2023년 12월에도 접속이 되지 않는 상태이다. 이유는 불명.
2023년 12월 18일 기준 접속이 원활히 잘 된다.
7. 막는 방법
- 에펨코리아에서 해당 서비스가 퍼가지 못하도록 막았다고 하며, 관련 막는 방법을 공지 사항으로 공개했다. 2018년 4월 3일 시점에서는 46.166.139.0/24 과 185.22.174.0/24 IP 대역을 사이트 운영자가 막으면 퍼가기가 안 된다고 한다. archive.is에서 에펨코리아 페이지를 저장 못하도록 막았습니다. 하지만 여전히 아카이브 되고 있다. 아마 archive.is 측에서 주기적으로 사용하고 있는 IP 대역을 변경하고 있는 것으로 추정되며, 사용하는 IP 대역이 바뀔 때마다 막아야 될 듯 하다.
- 2019년 초부터 커그에서 해당 서비스가 퍼가는 것이 막혀있는듯 했다가 다시 풀렸다.
- 몇몇 웹 서버 운영자들에 따르면 이들은 IP 대역을 차단하면 IP 대역을 변경하고, User-Agent[20]도 일반 브라우저인 것 처럼 속여서 접속해 이것으로 차단할 수 없으며, 어떨때는 Tor까지 동원해 접속을 시도한다고 한다. 막을수야 있지만 막기 상당히 번거롭고 힘들다는 뜻.
8. 기타
- 유사 사이트로 웨이백머신과 WebCite, thefact.io 등이 있다.
- 사실 인터넷 아카이브계의 끝판왕은 인터넷 아카이브의 웨이백머신이라고 할 수 있다.[21][22]
자체 모바일 앱과 브라우저 확장 프로그램도 있고, 그냥 주소 넣어서 저장하겠다고 마우스 클릭만 하면 아카이브가 되기 때문에 편의성 면에서도 딱히 꿀리지 않는다. 아예 세계적인 도서관의 개념으로 운영되기 때문에, 웨이백 머신은 단순한 박제 기능 밖에도 광범위한 기능을 가지고 있다.[23] 웨이백 머신을 이용한 나무위키 아카이브. 그렇다 보니 규모도 더 거대하고, 서버나 백업과 같은 안정성도 더 신뢰할 수 있다. 운영에 쓰이는 세계적인 기부금은 덤.
물론 wayback machine 자체도 사실상 아카이빙이라는 불법 무단 전재 및 배포를 기반으로 하는 웹사이트이기 때문에 사용상의 주의가 필요하다. 아카이빙 말고도 해당 웹사이트의 자료실에는 온갖 저작권 침해 자료가 한도 끝도 없이 올라오는데 모니터링도 하지 않고 그저 신고가 들어오면 자기들에게 피해가 있을 법 한 자료들만 골라서 삭제하고 있는 상황.
- 참고로 도메인 정보를 찾아보다 보면 소유자 정보중에 Denis Petrov 라는 이름이 나오는 것을 볼 수 있는데, 도메인 정보에 나온 해당 인물의 연락처를 찾아서 연락을 하면 자신은 해당 사이트의 소유자가 아니며 명의를 도용당했다고 주장하는 답변이 온다.
해당 답변이 진실이라면 사이트의 소유자는 남의 명의를 도용하는 사람이며, 해당 답변이 거짓이라면 사이트의 소유자는 그런 거짓말을 하는 사람이라는 걸 알 수 있다.
- 북마크 바가 항상 보이는 게 거슬린다면 이 확장 프로그램을 사용하면 된다
- 일부 웹사이트(인스타그램.유튜브 등)이 저장이 안 될 경우 thefact.io를 이용하면 된다. 언급한 사이트들은 아무래도 요즘 자주 이슈가 되는 게시글이 올라오는 사이트들인 만큼, 저장이 필요한 상황이 올 가능성이 크다.
- 아카이빙된 웹 페이지에서 아무 링크를(다운로드 버튼 제외) 누르면 파킹 사이트로 이동한다.[24] 파킹 사이트 문서를 보면 알겠지만 대부분의 파킹 사이트는 믿을 게 못 된다. 여기서 설치를 유도하는 앱이나 APK 파일은 절대 다운로드하지 말고 뒤로가기를 누를 것. → 지금(12.3)은 피싱사이트 안 가는 것으로 보인다.
- 2021년 1월 4일 11시 40분경 잠시동안 접속이 되지 않았다. 11시 48분경 접속이 원활하게 잘 되고 있다.
- 가끔 서버가 터져서 아카이빙이 불가능한 경우가 있다. 이렇게 되면 아카이빙이 될때까지 기다려야 한다.
- 실시간 아카이빙이 불가능하다. 5시간 간격으로 아카이빙해야한다.
- 2021년 5월 10일 오후 8시 22분경 접속이 일시적으로 되지 않았다. 동일 오후 9시 25분경 접속이 원활해졌지만 서버 에러로 아카이브가 불가능하다.
- OSINT을 지지하고 추구한다.
- 인트라넷은 아카이브를 못한다고 한다.
9. 관련 문서
[1] 주기적으로 도메인과 저장 서버를 옮기고 있다. 주로 미국 법률이 통하지 않는 유럽 쪽 서버들을 사용하고 있으며, 서버 중에는 심지어 홍보문구로 "우리는 미국 법률을 x깝니다"라고 박아 놓은 해적 서버도 있었을 정도다.[2] 현재는 더 이상 도망칠 서버가 없는건지 러시아 IP를 활용하는 사이버 망명을 돕는 쪽으로 옮긴 상태다.[3] 운영자가 $2000/mo라고 직접 밝혀 메가옥텟당 2000달러로 착각할 수 있지만 옥텟이 아니라 한 달이다. 실제 운영비는 하루에 100달러 정도이다.[RE] 2022년 11월 30일 기준 archive.md로 넘어간다.[5] 계속 바뀌는 이유는 서버 제공자 측에서 독단적으로 하는 것이며 서버비를 내는 운영진은 이유를 모른다고 하였다. 그래서인지 운영진은 archive를 얼마나 오래 할 수 있을지 장담을 하지 못했다. 기술적 문제야 두세 시간이면 해결되고 데이터 소실은 없다고 하였으니 archive가 사라진다면 다른 문제로 사라질 것을 전망된다.[6] 그냥 거짓말일 확률도 높다. 4번 문단 참조. 도메인 여러 개를 이용해서 법률적 간섭이나 차단을 회피하는 데 사용하고 있는 듯하다.[7] 현재 archive.md에서 아카이브한 옛 주소로 연결 된다.[RE] [RE] Redirect to archive.md[RE] [11] 운영자가 2019년 1월 IS 도메인은 앞으로 못 쓸 수도 있다고 했으나 2021년 5월 13일 기준 현재까지도 접속이 된다. 아무래도 문제가 해결된 모양.[RE] [RE] [14] Avast를 사용하면 블랙리스트에 등록된 주소라면서 접속되지 않는다,이유는 불명.[Tor] 토르 브라우저 전용 사이트.[16] 공식 확장보다 먼저 나온 비공식 확장이 있다. 단, 이전에는 404 Not Found가 뜬다. 지금은 사용할 수 없는 항목이라고 뜬다. 파일:화면 캡처 2024-09-20 213524.jpg.[17] 참고로 나무위키 극초창기 때의 로고는 고딕체 "나무위키"가 다였다.[18] 촬영자가 본인이 아니라면 저작권을 주장하기 어렵기 때문이다.[19] 이때의 박제는 한창 사건이 진행될 그 시점에서는 사실 유용하지 않았으나, 서버가 터지면서 비로소 빛을 발했다.[20] 서버에 접속하는 클라이언트에 대한 정보를 담은 HTTP 헤더. 쉽게 말해서 이 웹페이지에 접속했을 때 어떤 컴퓨터에서 어떤 소프트웨어를 사용해 접속했는지에 대한 내용이 담겨있다.[21] 본래 국내에서도 아카이브라고 하면 보통은 웨이백머신을 쓰고 archive.today는 듣보잡 취급이었는데 2015 여성시대 대란 때 웹페이지를 아카이브하던 사람들이 웨이백머신이 아닌 archive.today를 사용한 것을 계기로 국내에서 인지도가 엄청나게 높아져서 이렇게 나무위키에 문서까지 생긴 것이다. 현재는 국내 한정으로 오히려 웨이백머신보다도 인지도가 더 높을 정도. 당장 나무위키의 문서량도 archive.today가 훨씬 더 많다[22] 웨이백머신이라는 더 좋은 사이트를 놔두고 굳이 archive.today를 사용하는 국내의 현 상황은 별로 긍정적인 현상이라고는 할 수 없다. 비유하자면 알약보다 더 강력한 백신도 있고 알약보다 선발주자인 백신들도 많지만 모종의 이유(이스트소프트의 대규모 홍보/여성시대 대란)로 인해 실제 스펙 이상의 인지도를 얻어 많은 사람들이 이에 익숙해지고, 당장 눈에 띄는 단점은 안 보이니까 그냥 계속 archive.today를 사용하고 있는 상황이 국내 아카이브 사용자들의 현 상황이다. 물론 어디까지나 비유일 뿐이고, archive.today는 알약만큼 심각한 단점이 있는 것은 아니다.
근데 2023년 지금은 archive.today를 어쩔 수 없이 쓸 수 밖에 없는 상황이 있는데, 나무위키, 아카라이브, 에펨코리아 등이 사이트 측에서 직접 웨이백머신의 아이피를 막거나(umanle 사가 운영하는 웹 해당), 웨이백머신에 아카이브 금지 요청을 넣은 사이트(에펨코리아가 해당)가 점점 늘어나는 추세라 이런 경우엔 어쩔 수 없이 대체제인 archive.today를 쓸 수 밖에 없다.[23] 일부러 박제하지 않았어도 사이트들의 십수년 전 모습을 찾아볼 수도 있고, 고전 게임, 고전 서적 등의 자료도 찾을 수 있다. 직접 파일을 올릴 수도 있다. 말 그대로 아카이브를 위하는 프로젝트이다. robots.txt로 막혀 있는 곳은 예외.[24] 아무래도 수익을 위해 파킹 사이트 업체와 계약을 한 듯하다.
근데 2023년 지금은 archive.today를 어쩔 수 없이 쓸 수 밖에 없는 상황이 있는데, 나무위키, 아카라이브, 에펨코리아 등이 사이트 측에서 직접 웨이백머신의 아이피를 막거나(umanle 사가 운영하는 웹 해당), 웨이백머신에 아카이브 금지 요청을 넣은 사이트(에펨코리아가 해당)가 점점 늘어나는 추세라 이런 경우엔 어쩔 수 없이 대체제인 archive.today를 쓸 수 밖에 없다.[23] 일부러 박제하지 않았어도 사이트들의 십수년 전 모습을 찾아볼 수도 있고, 고전 게임, 고전 서적 등의 자료도 찾을 수 있다. 직접 파일을 올릴 수도 있다. 말 그대로 아카이브를 위하는 프로젝트이다. robots.txt로 막혀 있는 곳은 예외.[24] 아무래도 수익을 위해 파킹 사이트 업체와 계약을 한 듯하다.