隨著chat gtp的興起 AI 生成的“垃圾網站”已達數百個
發布日期:2023-07-01 訪問次數:
隨著生成式 AI 的低成本化,越來越多使用爬蟲抓取其他網站內容,并用 AI 重新生成信息的“垃圾網站”不斷涌出,外媒 NewsGuard 發布相關數據報告,稱目前已經追蹤到了 大約277個(且還在不斷增加)的“垃圾網站”。
NewsGuard發現,人工智能工具現在被用來填充所謂的內容農場,指的是世界各地的低質量網站,這些網站炮制大量標題誘餌文章以優化廣告收入。
據悉,NewsGuard 從今年年初開始標記這些使用 AI 生成內容的網站,迄今為止,NewsGuard 的團隊已識別出 277 個不可靠的人工智能生成的新聞和信息網站,標記為“ UAIN ”NewsGuard 將不可靠的人工智能生成的新聞網站 (UAIN) 定義為在很少或沒有人為監督的情況下運行并發布主要或完全由機器人撰寫的文章的網站。

這些網站涵蓋 13 種語言:阿拉伯語、中文、捷克語、荷蘭語、英語、法語、印度尼西亞語、意大利語、韓語、葡萄牙語、他加祿語、泰語、和土耳其語。
而這些“AI 垃圾場”缺乏人類監管,其中消息魚龍混雜,沒有任何可信度,完全是為了從 Google Ads 中薅羊毛而生。

(圖源 NewsGuard)
這些網站通常具有通用名稱,例如 iBusiness Day、Ireland Top News 和 Daily Time Update,對于消費者來說,這些網站似乎都是已建立的新聞網站。這掩蓋了這些網站在幾乎沒有人為監督的情況下運作,并發表大部分或完全由機器人撰寫的文章,而不是在人為監督下呈現傳統上創建和編輯的新聞報道。這些網站已經制作了數十篇甚至數百篇通用文章,涉及政治、技術、娛樂和旅游等一系列主題。這些文章有時會包含虛假陳述,例如名人死亡惡作劇、捏造的事件以及將舊事件描述為剛剛發生的文章。
調查顯示,這些“垃圾網站”存在的目的就是誘導用戶點擊訪問,并通過其中顯示的廣告賺取收入,其中名為 TNN 的網站甚至每天可生成逾 1200 篇文章,該網站完全由爬蟲及 “轉換語法后重寫一遍”的 AI 腳本控制,相較之下,《紐約時報》網站每天平均僅發布 150 篇文章。

(圖源 NewsGuard)

(圖源 NewsGuard)
實際上這種利用爬蟲批量爬取其他媒體資訊信息,并在爬取的資訊頁面中加上大量廣告,并通過“競價排名”吸引訪問者,進而獲取廣告補貼的網站,在 AI 時代來臨前就已經相當常見,而生成式 AI 的普及只是給予了這些網站更低的營運成本。
除了追蹤器中包含的網站外,NewsGuard 分析師還發現了一個中國政府運營的虛假信息網站,該網站使用人工智能生成的文本作為虛假說法,稱美國在哈薩克斯坦經營一個生物武器實驗室,感染駱駝以危及中國人民。

(圖源 Pexels)
NewsGuard 識別的廣告中,超過90% ( 393 個中的356 個)是由最大的在線平臺Google Ads提供給 NewsGuard 的,據 Digiday 稱,Google Ads 去年從在線廣告中創造了 1680 億美元的收入。
而谷歌的廣告政策明確表示,不允許在自動生成的內容網站文章中使用 Google Ads API,但這些網站實際上每個新聞頁都有 3-5 個廣告鏈接,因此實際也違反了谷歌的廣告政策。
這些廣告似乎是以編程方式生成的,這意味著公司不是選擇將其廣告出現在這些網站上,而是通過一個無論網站的性質如何放置廣告的系統自動定位。因此,這種程序化方法為低質量和錯誤信息的網站提供了資金,同時無法保護“品牌安全”,因為大部分廣告都是由谷歌投放的。
編輯點評:如今隨著AI發展,網絡謠言和虛假新聞的泛濫是一個嚴重的問題,其中AI生成的假新聞網站是其中一個重要的源頭。這些網站借助AI技術生成虛假的新聞和信息,利用人們的好奇心和不可靠的信息來源,導致虛假信息不斷傳播。采取措施來防止AI生成虛假新聞的問題迫在眉睫。
掃描添加好友
免費提供:網站建設、網絡推廣解決方案
已幫助
人
人
您的鼓勵是站長的最大動力
標簽:垃圾網站
轉載請注明來自:http://www.tgdby.cn/news/3030.html