今天整理代码时点开了源码
发现几年前写的东西简直就是凑合
正好趁着白姐姐脱团,这代码我就删掉
了留个思路,万一以后有用呢。
基本原理是:
selenium驱动chromedriver打开无界面的chrome浏览器;
使用百度贴吧高级搜索白姐姐最近的十条发言记录;
通过Xpath定位获取每个发言的标题,内容,发言贴吧和时间;
以上四种信息存为一条数据,共计10条存为一个List;
读取一个File文件,File文件中记录之前保存下来的最近十条发言;
将List中的数据与File中的数据合并去重:
如果合并去重后数据数量为20,则File清空,将List数据存入File,并把List数据存入记录白姐姐发言的Excel;退出程序。
如果合并去重后数据数量为10,则退出程序。
如果合并去重后数据数量为10<N<20,则File清空,取最新10条合并去重后数据存入File,并将最新的N-10条数据存入记录白姐姐发言的Excel;退出程序。
以上脚本打成jar包,并将启动jar包命令编成bat文件。
jenkins构建自由风格工程,每10分钟执行一次bat文件。