智城识别ID 36668
承接项目数 0
好评率 0%
会员 0级
总收入 ¥ 0RMB
保证金 0 RMB

案例

系统结构图
接近 12 年前上传

开发周期 : 1 周
项目报价 : ¥50,000-¥60,000

舆情监测系统,网页数据抓取

IDC舆情监管平台(睿查idcSmartView)就是针对IDC这些需求开发的。idcSmartView目前提供的核心功能有如下几个。
域名自动侦听发现:通过IDC出口的镜像数据,可以及时精确发现每一个时间的域名情况,每天有没有新增的域名。
网站备案关联查询:通过自动解析提取网站首页的备案连接信息,信产部的备案信息自动查询接口(要确保能使用这个接口),或者定期导入信产部发送的域名备案数据,idcSmartView可以关联查询每个包含非法内容的网站有没有备案,这个网站的责任人是谁。
Web/wap网站敏感内容扫描搜索:通过搜索技术,对IDC里面运行的网站进行扫描和检索,自己可以设定站点页面抓取连接的深度。及时发现包含非法内容的页面,并准确定位到所属网站,所属IP,以及对应的责任客户。
  idcSmartView除了可以抓取普通的web网站之外,还可以抓取手机网站内容(wap)。随着现在手机网站越来越多,目前也逐渐成了黄色内容和非法内容的传播主要渠道。
idcSmartView支持三种网站内容审计方式
通过监控镜像流量,获取站点域名,然后抓取页面数据进行审计。
手工输入监控网站域名,做为抓取数据起始URL。
直接设定IP地址,首先发送http请求,根据网站回应,开始抓去审计。
网站运行状态监控:对于托管在机房的网站,还可以进行运行状态监控,对于已经关闭,或者重定向到其他页面的站点,提示“网站已关闭”等运行状态。
图片扫描监控
遍历被监控网站各个页面,把包含的图片过滤出来,集中展示,并提供关键词搜索查询,可以加快监管人员审查黄色图片的工作效率。展现形式类似微软bing的图片搜索模式。
域名主动阻断
IDC运维人员使用本系统可以自己设定关闭阻断某个域名,这样系统会自动阻断对这个域名站点的访问连接。尤其对于IDC内虚拟主机托管的服务器,一个IP地址可能解析了很多域名,这样可以单独关闭用户对某一个域名网站的访问。

系统结构图
系统框架图
界面 1
系统界面-1
界面 2
系统界面-2
界面 3
系统界面-3
界面 4
系统界面-4