您好,欢迎访问海口顶酷互联科技有限公司的官方网站!
注册 / 登录     咨询热线:0898-32693777
微信二维码
咨询热线: 0898-32693777

网站全站敏感词检测、广告违禁词查询很简单,一个python脚本轻松搞定

做网站的同学都有一个共同的苦恼:就是自己辛辛苦苦经营的网站,如果内容中涉及色情、暴恐涉政、恶意推广、辱骂、违反广告法、涉及违禁品等文本内容,小则被搜索引擎处罚,严重的可能还会被请去喝茶。还有很多企业站因为编辑的不小心(有些词防不胜防),网页中使用了广告违禁词,可能会被竞争对手投诉到工商等部门,可能会面临关站、整改、罚款等处罚。

这样的例子屡见不鲜,百度去搜一下一大堆。


企业网站被投诉违反广告违禁词案例
企业网站被投诉违反广告违禁词案例


很多站长因此而头疼,目前网上能找到网站敏感词检测和广告违禁词查询的工具都是基于单网页或者单页面内容的,例如你的某一篇文章。对于有成千上万内容的网站检测起来就很麻烦了,总不可能一篇一篇复制过去检测吧。

前几天看到大神玉米同学写了一个全站违禁词检测查询的python脚本,使用以后发现了一些小问题,例如可能把网站上的图片当做一个内容页面去检测,这样会消耗更多网站的资源。就随手修改了一哈:只检测html文件或者目录,另外在过滤词库新增了18000余条色情、暴恐涉政、恶意推广、辱骂、违禁品等敏感词,实现不仅仅查询广告违禁词的功能。只保存有违禁词页面URL方便查询。

本脚本只有两个文件:1、filter.txt(过滤词库,你可以根据自己的需求去增加词库; 2、main.py(主程序)。使用方法如下:

网站全站敏感词检测、广告违禁词查询脚本使用方法:

提示:此脚本是基于python3.X。

1、把main.py主程序中的域名修改成你要查询网站的域名,然后保存。


全站敏感词检测、广告违禁词查询使用方法:1、修改域名
全站敏感词检测、广告违禁词查询使用方法:1、修改域名


2、运行这个脚本。(怎么运行,请到百度搜python或者自行脑补,提示缺py库的请自行pip install)。


全站敏感词检测、广告违禁词查询使用方法:2、运行脚本
全站敏感词检测、广告违禁词查询使用方法:2、运行脚本


3、程序会自动爬取你网站的所有连接,并提示哪个页面命中某个违禁词,最后会在程序运行目录下生成一个ok.csv文件。此文件详细记录了你网站的哪个页面有哪些违禁词。你可以根据这个上面的记录去修改相应的内容。


全站敏感词检测、广告违禁词查询结果
全站敏感词检测、广告违禁词查询结果


是不是很简单呢?当然这个检测查询脚本也只是给各位站长一个提示和预警,全面检测自己网站上面到底有哪些敏感词和广告违禁词,以便及时调整内容,避免遭到损失。最后放出此下载地址。解压缩即可运行。
下载地址:全站敏感词查询源码

解压密码获取方法

网站全站敏感词检测、广告违禁词查询很简单,一个python脚本轻松搞定(图5)

请使用微信扫码关注后、输入“全站敏感词”,即可获得解压密码。



非常感谢您有耐心的读完这篇文章:"网站全站敏感词检测、广告违禁词查询很简单,一个python脚本轻松搞定",更多内容请继续浏览,我们将为您提供更多参考使用或学习交流的信息。我们还可为您提供:网站建设与开发网站优化品牌推广、APP开发、小程序开发新闻推广等服务,我们以“降低营销成本,提高营销效果”的服务理念,自创立至今,已成功服务过不同行业的1000多家企业,拥有14项国家软件著作权,将力争成为国内企业心目中值得信赖的互联网产品及服务提供商。如您需要合作,请扫码咨询,我们将诚挚为您服务。


微信扫码 免费咨询

0898-32693777
解答:网站优化,网站建设,APP开发,小程序开发,H5开发,品牌推广,新闻推广,舆情监测等

上一篇:宝塔面板http网站未配置SSL协议时跳转https串站的解决方法

下一篇:网站建设中这些不能忽视的问题你知道吗?

不限地域、不限平台、不限关键词。
适用所有想提升关键词排名的电脑、手机、微信网站!
Top