Reddit은 인터넷 아카이브를 차단합니다
Reddit은 AI 회사가 인터넷 아카이브의 Wayback Machine에서 데이터를 긁어 내기 때문에 인터넷 아카이브가 대부분의 Reddit을 색인화하는 것을 막기 시작할 것이라고 말했다. Wayback Machine은 더 이상 포스트 세부 페이지, 댓글 또는 프로필을 크롤링 할 수 없습니다. 대신 Reddit.com 홈페이지 만 색인화 할 수 있습니다. 이는 인터넷 아카이브가 주어진 날에 가장 인기있는 뉴스 헤드 라인과 게시물에 대한 통찰력을 보관할 수 있다는 것을 효과적으로 의미합니다.
Tim Rathschmidt 대변인은“Internet Archive는 오픈 웹에 서비스를 제공하지만 AI 회사가 우리의 플랫폼 정책을 위반하고 Wayback Machine의 데이터를 긁어내는 사례를 알게되었습니다. 직전.
인터넷 아카이브의 사명은 인터넷 및“기타 문화적 유물”에 웹 사이트의 디지털 아카이브를 유지하는 것입니다. Wayback Machine은 특정 날짜에 나타난 것처럼 페이지를 볼 수있는 도구입니다. 그러나 Reddit은 모든 콘텐츠를 보관해야한다고 생각합니다.“EG, 컨텐츠를 제한 할 때까지, 컨텐츠를 제한 할 때까지). Rathschmidt는 Redditors를 보호하기위한 Reddit 데이터”라고 말합니다.
Rathschmidt에 따르면이 한도는 오늘“램핑 증가”가 시작될 것이며 Reddit은 인터넷 아카이브에“사전”에 연락하여“발효되기 전에 한계를 알리기 위해”라고 말합니다. 그는 Reddit은 또한 사람들이 과거 인터넷 아카이브에서 콘텐츠를 긁어내는 능력에 대해“우려를 제기”했다고 말했다.
Reddit은 최근 AI 회사가 대량을 사용하고 학대하기 시작했을 때 스크레이퍼 도구에 대한 액세스를 차단 한 역사를 가지고 있지만 회사가 지불하면 해당 데이터를 제공 할 의향이 있습니다. 작년에 Reddit은 작년 초에 Google 검색 및 AI 교육 데이터에 대한 Google과의 계약을 체결했으며 몇 달 후 주요 검색 엔진이 지불하지 않는 한 데이터를 크롤링하는 것을 차단하기 시작했습니다. 또한 2023 년의 악명 높은 API 변경으로 일부 타사 앱이 폐쇄되어 항의로 이어졌으며 API가 AI 모델을 훈련시키기 위해 남용 되었기 때문이라고 밝혔다.
Reddit은 또한 Openai와의 AI 거래를 강타했지만 6 월에 Anthropic을 고소했다. Anthropic이 더 이상 긁지 않았다고 말한 후에도 Anthropic이 여전히 Reddit에서 긁어 모았다 고 주장했다.
Wayback Machine의 이사 인 Mark Graham은“우리는 Reddit과 오랜 관계를 유지하고 있으며이 문제에 대한 지속적인 논의를 계속하고 있습니다. 직전.
8 월 11 일 업데이트: Wayback Machine의 설명이 추가되었습니다.
Post Comment