我们采用多种数据清洁和过滤方法,包括重复数据删除和分类。Claude 3套件的模型尚未在用户或客户提交给我们的任何用户提示或输出数据上培训,包括免费用户,Claude Pro用户和API客户。当Anthropic的通用搜寻器通过爬行公共网页获取数据时,我们遵循有关机器人的行业实践。TXT说明网站运营商用来指示他们是否允许在其网站上爬行内容。根据我们的策略,Anthropic的通用攻击者无法访问密码受密码或登录页面或旁路验证码控件,我们对使用的数据进行勤奋。人类透明地操作其通用爬行系统,这意味着网站运营商可以轻松地识别拟人化的访问并表明其对人类的偏好。