2024-07-05 www.dnxtw.com
电脑系统网 7 月 5 日信息,网络供应商 Cloudflare 近日推出一款名为“Bot Fight Mode”的网络防火墙专用工具,站长们还可以在控制面板打开服务内容,从而避免自身网站内容被用于训练 AI 的人工智能爬虫扒取。
电脑系统网注:爬虫是一种自动化程序流程,能够在网络上搜索获得信息,目前许多生产商应用有关爬虫扒取各大论坛信息用于训练 AI 模型,有关爬虫容易造成被爆网址会产生大量的异常流量,因此网站站长需支付高额的服务器带宽花费,与此同时也容易导致平台上很多原创设计 / 个人隐私具体内容泄漏。
据了解,Cloudflare 推出的有关专用工具主要采用签字核对、启发式算法、机器学习和行为识别技术性来辨别爬虫,网站站长还能够依照必须海关放行“好一点的 AI 智能机器人”爬取信息(该类“好一点的 AI 智能机器人”关键探寻页面的 robots.txt 来获得信息,往往不会对用户自身造成异常流量,都不会将网页页面所有信息立即用于整盘训练模型)。
互联网技术为许多大语言表达模型(如 OpenAI 的 GPT 模型和谷歌的 Bard)带来了绝大部分的训练数据信息,现在许多生产商为了能刷自己家 AI 模型成绩,大张旗鼓通过互联网爬虫“用来式”地获得训练数据信息,从而使本该你侬我侬的举动越来越“污名化”,各种互联网商立即推出该类禁止使用 AI 爬虫服务也在意料之中。
广告宣传申明:文章正文所含的对外开放跳转页面(包括不限于网页链接、二维码、动态口令等方式),用于传送大量信息,节约优选时长,结论仅作参考,电脑系统网全部文章内容均包括本声明。
06-28214
10-08483