Reddit은 인터넷 아카이브의 웨이백 머신으로 가용성을 제한하고 있습니다.
인터넷 아카이브의 Wayback Machine은 데이터 액세스에 대한 Reddit의 단속의 최신 희생자입니다. 회사는 웨이 백 머신의 Reddit에서 정보를 보존 할 수있는 능력을 크게 제한하는 움직임으로 아카이브 사이트가 액세스 할 수있는 내용에 대한 새로운 제한 사항을 제한하기 시작했습니다.
변화를 통해 비영리 인터넷 아카이브가 운영하는 프로젝트 인 Wayback Machine은 Reddit의 홈페이지 만 크롤링 할 수 있습니다. 더 이상 주석, 하위 레드 페이지, 게시물 세부 정보, 프로필 및 기타 데이터에 액세스 할 수 없습니다.
이 조치는 Reddit이 라이센스 비용을 지불하지 않고 대형 언어 모델을 훈련시키기 위해 데이터를 사용하는 AI 회사의 능력을 제한하려는 최신 단계입니다. 또한 인터넷 아카이브를 포함한 “성실한 배우”를 제한하지 않을 것이라고 명시 적으로 말한 회사가 작년에 취한 것과는 현저히 다른 입장이기도합니다. 그 이후 정확히 무엇이 바뀌 었는지는 확실하지 않습니다. Reddit은 AI 회사가 Wayback Machine을 통해 데이터를 긁어서 규칙을 우회하고 있다고 생각하는 것 같습니다. 우리는 댓글을 위해 인터넷 아카이브에 연락했습니다.
데이터 라이센스는 Reddit에게 중요한 사업이되었습니다. 이 회사는 OpenAI 및 Google과 수백만 달러 규모의 거래를 강타하여 Reddit 게시물을 사용하여 AI 모델을 훈련시킬 수 있습니다. 동시에, Reddit은 그러한 계약없이 데이터를 사용하려는 회사에 대해 점점 더 단단한 입장을 취했습니다. 올해 초이 회사는 인류를 고소하여 허가없이 수년간 레딧을 긁어 냈다고 주장했다.
Post Comment