一、项目概述
需要一款微博数据爬虫软件,针对主流微博(新浪、网易、搜狐、腾讯)经某个关键词或某几个关键词(从数据库中取出)组合搜索的数据进行爬取,检索后的结果按照要求插入数据库(MySqL)。
二、性能指标
1、可多线程并行爬取数据,并发的任务数量在10个以上。
2、保证搜索数据的全面性、准确性、时效性。
三、接包方必备的条件
1、有相关项目经验(重要),熟悉常见微博网络爬虫及搜索,页面信息抽取等技术。对产品设计有很深的理解。
2、开发及测试周期:10天。周期结束后需要提交测试后的软件。要求接包方时间相对灵活,沟通方便。
3、最好有成功案,可以试用。
4、所使用的编程语言应是当前成熟高效常用语言,软件代码应简洁、高效且注释详细准确,在windows xp以上系统平台上能够稳定运行,兼容性好。
5、交付的软件,不能有致命Bug、后门、恶意代码等。
6、提供全套完整的源代码。
如果您符合我们的要求并有意向合作,可加QQ:304023963(请注明微博爬虫)。详细功能和所需插入的数据库我方可另提供。如果您有成熟的网络爬虫或是舆情监测产品(需提供源代码),价格可另议。非诚勿扰!谢谢!