​美國逾340家媒體防堵AI抓取 阻礙網際網路檔案館保存數位歷史 

商傳媒|責任編輯/綜合外電報導為防範人工智慧(AI)公司未經授權使用內容,美國已有超過340家地方新聞媒體,開始封鎖網際網路檔案館(Internet Archive)的Wayback Machine保存其新聞報導。這項舉動引發外界對數位資訊保存與資訊自由的擔憂。

根據《Gadget Review》報導,封鎖網際網路檔案館爬蟲程式的網站數量正持續增加。今年1月時,已有241家新聞網站採取阻擋措施,到了5月,這個數字已攀升至382家。許多主要報業集團,包括甘尼特傳播(USA Today Co.)、麥克拉奇(McClatchy),以及Alden Global Capital等避險基金旗下的媒體,都積極參與這次封鎖行動。

這些出版商主要擔心科技巨頭可能將他們透過 Wayback Machine 存檔的內容,當作訓練 AI 模型(例如 OpenAI 旗下的 ChatGPT)的免費資料。雖然目前沒有任何出版商證實 AI 公司已從網際網路檔案館抓取其內容,但《Baltimore Banner》的科技長指出,一旦 ChatGPT 在 Wayback Machine 中找到內容,他們不確定能否有效追溯內容來源並歸屬於自家媒體。此外,《大西洋》(The Atlantic)執行長也表示,若內容被免費取用,出版商將失去議價能力。

出版商的憂慮不僅限於 AI 公司直接抓取,他們也擔心即使已直接封鎖 OpenAI 的爬蟲程式,AI 公司仍可能透過已存檔的內容取得他們的著作。然而,這項阻擋行動也引發爭議,已有超過200名記者簽署請願書,支持 Wayback Machine 的運作。

專家指出,當新聞媒體停止營運時,其數位檔案經常隨之消失。例如,位於夏洛特鎮(Charlottesville)的週報 The Hook 在停刊後,其擁有的2.2萬篇報導也一併從線上消失。相較於免費的數位保存服務,出版商目前仍會將內容授權給 ProQuest 和律商聯訊(LexisNexis)等付費資料庫,而這些資料庫主要僅供大學或機構使用者存取。這顯示數位資料的保存需要成本,而免費的數位保存服務正逐漸成為網路早期樂觀精神的歷史遺物,數位資訊的自由存取面臨考驗。

     

相關新聞

您可能有興趣

即時新聞

熱門新聞