ET采集3的数据项增加了一个“截取”选项,“截取”选项用于将数据项的内容按指定长度的字数自动截断。
我们可以用该功能实现自动摘要。
步骤如下:
1、新建数据项,下图我们建立了一个名为“自动摘要”的数据项。

2、复制正文数据项的采集规则粘贴到自动摘要的规则里,勾选“去首尾空白”,设置截取字数。

3、建立自动摘要的数据整理组。

示例中第一条规则用于去除所有HTML标记,第二条规则过滤换行,第三条规则将连续的空白替换为一个空格。
4、在自动摘要数据项里关联整理组,然后点测试按钮进行测试。

5、从测试结果可以看到,我们想要的从正文自动截取生成摘要的功能已经实现了。
