您的当前位置:首页>资讯 > 正文

OpenAI现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练AI模型

  • 2023-08-08 17:14:55 来源:中关村在线


(资料图片仅供参考)

OpenAI近日推出了一项新功能,允许网站阻止其网络爬虫从其网站上抓取数据训练GPT模型,以解决可能涉及到的数据隐私和版权问题。网络爬虫是一种自动化的程序,可以在互联网上搜索和获取信息。OpenAI的网络爬虫名为GPTBot,其会以一定的频率访问各种网站,并将网页内容保存下来,用于训练GPT模型。 OpenAI表示,网站运营者可以通过在其网站的Robots.txt文件中禁止GPTBot的访问,或者通过屏蔽其IP地址,来阻止GPTBot从其网站上抓取数据。OpenAI还表示,“使用GPTBot用户代理抓取的网页可能会被用于改进未来的模型,并且会过滤掉那些需要付费访问、已知收集个人身份信息(PII)、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源,“允许GPTBot访问您的网站可以帮助AI模型变得更加准确,并提高它们的通用能力和安全性。” 然而,这并不会追溯性地从ChatGPT的训练数据中删除之前从网站上抓取的内容。互联网为大型语言模型(如OpenAI的GPT模型和谷歌的Bard)提供了大部分的训练数据,为AI训练获取数据已经变得越来越有争议。一些网站,包括Reddit和Twitter,已经采取措施打击AI公司免费使用其用户帖子的行为,而一些作者和其他创作者也因为涉嫌未经授权使用其作品而提起诉讼。

标签:

推荐阅读

OpenAI现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练AI模型

OpenAI近日推出了一项新功能,允许网站阻止其网络爬虫从其网站上抓取数

csgo枪皮肤在哪买_csgo在哪买皮肤便宜_csgo便宜开箱皮肤教程

CS:GO免费开箱【点击进入】老牌开箱网+超高爆率+一秒发货CSGO开箱APP【

氯苯甘醚商品报价动态(2023-08-08)

交易商品牌 产地交货地最新报价氯苯甘醚 含量99%,25公斤 件上海蓝嫣化

美国东部风暴致两人死亡 大量航班取消、用户断电

美国东部风暴致两人死亡 大量航班取消、用户断电---

小鹏汽车严打充电桩“霸位”,超时占位每分钟 1 元

近日,小鹏汽车在其官方应用程序上发布公告,表示将对充电桩“霸位”行

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品,均转载自其它媒体,转载目的在于传递更多的信息,并不代表本网赞同其观点和对其真实性负责。亚洲在线网倡导尊重与保护知识产权,如发现本站文章存在内容、版权或其它问题,烦请联系。 联系方式:8 86 239 5@qq.com,我们将及时沟通与处理。

教育