有时有些采集的数据不需要怎么办?火车采集器的内容过滤功能可以完成这个工作。
第二步:采集内容规则—数据处理—内容过滤
内容过滤有以下几个处理方法:
1.内容不得包含和内容必须包含:
可以设置多个词,支持选择 a.所有条件都必须满足 或 b.满足其中一个条件即可
2.采集结果不得为空:该功能可以让某个字段不出现空内容。
3.采集结果不得重复:该功能可以让某个字段不出现重复内容。设置此项前请确保您没有采集过数据,或者请先清空采集数据。
4.当内容长度小于(大于,等于,不等于)N时过滤:一个符号或一个字母或一个数字或一个汉字都算一个。
不符合要求的数据将被删除。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。