
商傳媒|何映辰/台北報導人工智慧領域近期浮現一種名為「AI Tarpits」的新型威脅,這種工具旨在透過「AI投毒」(AI poisoning)手段,損害人工智慧聊天機器人底層的「大型語言模型」(LLMs),使其產生不正確、誤導性甚至荒謬的輸出內容。
根據外媒報導,AI投毒的過程涉及故意污染AI聊天機器人的核心模型。而AI Tarpits正是其中一種特定工具,其設計目的是欺騙大型語言模型用於資料搜集的網路爬蟲,使其攝取大量無用或惡意的垃圾數據。
一旦大型語言模型攝取了這些被污染的數據,便會將其用於生成文字輸出。如此一來,所產生的內容將會是不正確或充滿誤導性的,嚴重降低AI回應的品質。最終,這種情況可能導致使用者對聊天機器人失去信心,進而減少使用。


