ET采集3的数据项增加了一个“截取”选项,“截取”选项用于将数据项的内容按指定长度的字数自动截断。
我们可以用该功能实现自动摘要。
步骤如下:
1、新建数据项,下图我们建立了一个名为“自动摘要”的数据项。
![](http://imgsrc.baidu.com/forum/w%3D580/sign=9c440e3cd843ad4ba62e46c8b2035a89/1b23cfea15ce36d3904e70a933f33a87e850b173.jpg)
2、复制正文数据项的采集规则粘贴到自动摘要的规则里,勾选“去首尾空白”,设置截取字数。
![](http://imgsrc.baidu.com/forum/w%3D580/sign=8ee217eaa44bd11304cdb73a6aaea488/897c13ce36d3d539f077fc5a3387e950342ab073.jpg)
3、建立自动摘要的数据整理组。
![](http://imgsrc.baidu.com/forum/w%3D580/sign=96346be2d81373f0f53f6f97940e4b8b/555830d3d539b6007d84fc2ee050352ac75cb773.jpg)
示例中第一条规则用于去除所有HTML标记,第二条规则过滤换行,第三条规则将连续的空白替换为一个空格。
4、在自动摘要数据项里关联整理组,然后点测试按钮进行测试。
![](http://imgsrc.baidu.com/forum/w%3D580/sign=e53c17ba7af082022d9291377bfafb8a/7645d339b6003af372f02ff93c2ac65c1138b673.jpg)
5、从测试结果可以看到,我们想要的从正文自动截取生成摘要的功能已经实现了。
![](http://imgsrc.baidu.com/forum/w%3D580/sign=9864b5598b025aafd3327ec3cbecab8d/95afb0003af33a87a027f383cf5c10385243b573.jpg)