返回
顶部
我们已发送验证链接到您的邮箱,请查收并验证
没收到验证邮件?请确认邮箱是否正确或 重新发送邮件
确定
产业行业政策诉讼TOP100招聘湾区IP动态职场人物国际视野许可交易深度专题活动商标版权Oversea晨报董图产品公司审查员说法官说首席知识产权官G40领袖机构企业专利大洋洲律所

裁判文书网数据被标价售卖!律师:或构成侵权

版权
湾区知识产权5年前
裁判文书网数据被标价售卖!律师:或构成侵权

裁判文书网数据被标价售卖!律师:或构成侵权

#本文仅代表作者观点,不代表IPRdaily立场#

 

原标题:裁判文书网数据竟被商家标价售卖

 

近日,记者从某网购商城看到,最高人民法院裁判文书网的数据被标价出售。裁判文书网发布的判决书都是公开的,为什么会被售卖?获取数据的手段对于网站是否有危害呢?

 

网售数据 价格需“私聊”获取

 

记者在某网络商城中看到,有标注来自湖南、广东、山东等多地的商家均声称出售裁判文书网的数据,其中不少商家声称其数据量超6000万条。而据裁判文书网公开数据显示,目前裁判文书网上公开的文书总量为7395万多篇,如果商家所称的数量属实,则商家能够提供绝大多数已经公开的文书数据。

 

 裁判文书网数据被标价售卖!律师:或构成侵权

裁判文书网数据被标价售卖!律师:或构成侵权

贩卖数据商家的推销页面

 

不少声称能够出售裁判文书网数据的商家在商品文字描述中称,其数据是通过“网络爬虫”的方式获取的。所谓“网络爬虫”,又称网页蜘蛛、网页机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。相当于一个自动访问网页并进行相关操作的小机器人。

 

记者注意到,尽管每名商家均在商品页面标示称,其数据售价为0.1元至1元,但每名商家均在文字描述中表示,数据的售价并不以标示为准,而是需要“私聊”获取。

 

一名售卖裁判文书数据的商家说,购买裁判文书数据的买家所需要的数据量从几千篇到几千万篇不等,有的买家是因为无法打开裁判文书网而不得不来求助于数据卖家,“还有很多学生买数据用于论文写作,这种情况几千条就够了,商用的话可能需要几百万条甚至上千万条。”商家还称,每个月他们能接到四五个文书数据采集的订单,而价格和买家需要的数据量有关,“几百万条数据大概要几千块钱,现在加密技术很严格,所以要贵一些。”

 

“爬虫”系统  曾致正常用户无法访问

 

记者了解到,部分技术机构通过网络爬虫系统获取裁判文书网数据的行为,已经给裁判文书网正常用户的访问带来了不便。不少网友曾在网上发帖称,自己搜索裁判文书时,常常遭遇裁判文书网网站显示因为系统原因,无法查询的情况。

 

对此,最高人民法院在其官网回应网友对于裁判文书网运行慢、故障频繁等情况时表示,由于中国裁判文书网公开文书数量和影响力不断增加,访问用户数不断增长。同时,2018年5月初以来,大量技术公司通过爬虫系统无限制并发访问非法获取裁判文书数据,造成网站负荷过大,大量正常用户请求堵塞,访问出现速度慢或部分页面无法显示等现象。

 

今年5月,最高人民法院信息中心主任许建峰在接受媒体采访时表示:“中国裁判文书网目前每天的访问量可以达到几千万的量级,其中还包括数据爬虫的攻击,我们的中心服务器承受着巨大压力。”

 

“我们每时每刻都在监控着它的应用情况,希望遇到问题立即采取措施,但是的确还不能完全跟得上步子,所以会出现停网维护运营的情况。”许建峰说,最高法已成立了专门的运维保障团队去维护管理中国裁判文书网,也将在技术与人力上投入更多的力量。

 

相关机构:已采用多种方式“反爬”

 

记者获悉,此前,相关方面已采取多种方式,对抗“爬虫技术”。最高人民法院曾发文称,为更好地确保正常用户访问性能,相关方面以验证码的方式上线系统软件防爬功能。“验证码技术是防爬虫的一种有效措施,当浏览量在某段时间内达到一定数量后,将启用验证码机制进行核验。后续,我们将不定期更新防爬虫技术,加强网站维护,提高网站运行效率和稳定性。”

 

此外,针对网友提问,为何不能按照“公开时间”为检索条件进行裁判文书检索时,最高人民法院方面表示,暂没有设置“公开时间”为检索条件的主要原因是爬虫系统会根据“公开时间”项进行增量文书爬取,“待下一步防爬虫系统稳定、可靠运行一段时间后,我们将适时考虑增加‘公开时间’检索项。”

 

此外,最高人民法院方面称:“由于前期爬虫行为过于猖獗,无限制暴力访问大幅降低正常用户访问性能,我们采取了通过限制列表页面翻页数量来防止爬虫系统的措施。”

 

律师分析:强行突破“反爬”技术或构成犯罪

 

金杜律师事务所从事IP类法律业务的律师瞿淼曾发文阐述了网络爬虫所涉及的法律问题。瞿淼称,从技术中立的角度而言,爬虫技术本身并无违法违规之处。但是,随着数据产业的发展,数据爬取带来的各种问题和顾虑日渐增加。过于野蛮的爬虫可能造成网站负荷过大,从而导致网站瘫痪、不能访问等。

 

“由于爬虫的批量访问会给网站带来巨大的压力和负担,因此许多网站经营者会采取技术手段,以阻止爬虫批量获取自己网站信息。而针对这些技术手段,爬虫开发者可以通过优化自己的代码、使用IP池等多种方式规避上述技术措施,实现对网站信息的批量抓取和复制。”瞿淼说,由于网络爬虫会根据特定策略尽可能多地访问页面,因而爬虫的使用将占用被访问网站的网络带宽并增加网络服务器的处理开销,甚至无法正常提供服务。

 

瞿淼认为,根据《反不正当竞争法》关于网络的相关条款,如果网站运营者已经采取了一定的反爬虫措施,而爬虫控制者基于经营目的、强行突破网站运营者采取的反爬虫技术措施,并客观导致被抓取网站无法正常运行,则可能构成不正当竞争行为。此外,强行突破某些特定被爬方的技术措施,还可能构成刑事犯罪行为。

 

针对此情况,北京市社会组织法律调解中心副理事长张新年律师认为,“这些裁判文书基于司法公开目的,是免费的公共资源,未经最高人民法院授权,商家售卖裁判文书网数据构成侵权。”

 

来源:北京青年报

记者:屈畅 朱健勇

编辑:IPRdaily王颖          校对:IPRdaily纵横君


推荐阅读(点击图文,阅读全文)


裁判文书网数据被标价售卖!律师:或构成侵权

嘉宾寄语CPIPS 2019:相约第四届中国医药知识产权峰会2019(10月23-25,上海)


裁判文书网数据被标价售卖!律师:或构成侵权

官宣!首届“全球科技创新与知识产权总裁研修班”招生简章


裁判文书网数据被标价售卖!律师:或构成侵权

可信好用的全球专利数据库


裁判文书网数据被标价售卖!律师:或构成侵权

延期通知!寻找40位40岁以下企业知识产权精英(40 Under 40)活动改期


“投稿”请投邮箱“iprdaily@163.com”


裁判文书网数据被标价售卖!律师:或构成侵权

「关于IPRdaily」


IPRdaily成立于2014年,是全球影响力的知识产权媒体+产业服务平台,致力于连接全球知识产权人,用户汇聚了中国、美国、德国、俄罗斯、以色列、澳大利亚、新加坡、日本、韩国等15个国家和地区的高科技公司、成长型科技企业IP高管、研发人员、法务、政府机构、律所、事务所、科研院校等全球近50多万产业用户(国内25万+海外30万);同时拥有近百万条高质量的技术资源+专利资源,通过媒体构建全球知识产权资产信息第一入口。2016年获启赋资本领投和天使汇跟投的Pre-A轮融资。

(英文官网:iprdaily.com  中文官网:iprdaily.cn) 

 

本文来北京青年报并经IPRdaily.cn中文网编辑。转载此文章须经权利人同意,并附上出处与作者信息。文章不代表IPRdaily.cn立场,如若转载,请注明出处:“http://www.iprdaily.cn/”

湾区知识产权投稿作者
共发表文章4311
最近文章
关键词
首席知识产权官 世界知识产权日 美國專利訴訟管理策略 大数据 软件著作权登记 专利商标 商标注册人 人工智能 版权登记代理 如何快速获得美国专利授权? 材料科学 申请注册商标 软件著作权 虚拟现实与增强现实 专利侵权纠纷行政处理 专利预警 知识产权 全球视野 中国商标 版权保护中心 智能硬件 新材料 新一代信息技术产业 躲过商标转让的陷阱 航空航天装备 乐天 产业 海洋工程装备及高技术船舶 著作权 电子版权 医药及高性能医疗器械 中国专利年报 游戏动漫 条例 国际专利 商标 实用新型专利 专利费用 专利管理 出版管理条例 版权商标 知识产权侵权 商标审查协作中心 法律和政策 企业商标布局 新商标审查「不规范汉字」审理标准 专利机构排名 商标分类 专利检索 申请商标注册 法规 行业 法律常识 设计专利 2016知识产权行业分析 发明专利申请 国家商标总局 电影版权 专利申请 香港知识产权 国防知识产权 国际版权交易 十件 版权 顾问 版权登记 发明专利 亚洲知识产权 版权归属 商标办理 商标申请 美国专利局 ip 共享单车 一带一路商标 融资 驰名商标保护 知识产权工程师 授权 音乐的版权 专利 商标数据 知识产权局 知识产权法 专利小白 商标是什么 商标注册 知识产权网 中超 商标审查 维权 律所 专利代理人 知识产权案例 专利运营 现代产业
本文来自于iprdaily,永久保存地址为http://www.iprdaily.cn/article_22352.html,发布时间为2019-08-04 10:10:16

文章不错,犒劳下辛苦的作者吧

    我也说两句
    还可以输入140个字
    我要评论
    回复
    还可以输入 70 个字
    请选择打赏金额