【k哥爬蟲普法】Python程式員爬取視頻資源13萬部,一分錢沒掙,獲刑2年!

来源:https://www.cnblogs.com/ikdl/archive/2022/09/08/16668945.html
-Advertisement-
Play Games

我國目前並未出台專門針對網路爬蟲技術的法律規範,但在司法實踐中,相關判決已屢見不鮮,K 哥特設了“K哥爬蟲普法”專欄,本欄目通過對真實案例的分析,旨在提高廣大爬蟲工程師的法律意識,知曉如何合法合規利用爬蟲技術,警鐘長鳴,做一個守法、護法、有原則的技術人員。 案情介紹 2017年以來,被告人王世傑工作 ...


我國目前並未出台專門針對網路爬蟲技術的法律規範,但在司法實踐中,相關判決已屢見不鮮,K 哥特設了“K哥爬蟲普法”專欄,本欄目通過對真實案例的分析,旨在提高廣大爬蟲工程師的法律意識,知曉如何合法合規利用爬蟲技術,警鐘長鳴,做一個守法、護法、有原則的技術人員。

案情介紹

2017年以來,被告人王世傑工作期間,為利用自己所學電腦網路技術建立網站賺錢,租用雲伺服器開辦了一個名為“酷奇XX視頻”的視頻網站。利用爬蟲技術在互聯網上爬取未經著作權人授權許可的電影、電視劇、綜藝、動漫等各類視頻資源,包括《流浪地球》、《復仇者聯盟4》、《大鬧天空》等最新影視劇,以及淫穢主播視頻表演等視頻。

此後,王世傑通過在視頻網站網頁上掛載“廣告位招租”招商廣告,招商廣告中載明自己的QQ號碼,伺機通過視頻資源牟利。且王世傑通過網站設置了一個會員註冊信息,用戶可以用手機號或者郵箱賬號註冊成為會員,會員可以通過線上支付現金購買充值卡,1元兌換1積分,不同積分可升級為階梯式包時段的會員,享受該網站提供的各種VIP會員服務。

2019年5月8日,勉縣公安局受案後,民警依法對“酷奇XX視頻”網站的信息進行了線上提取,其中提取各類涉嫌侵犯著作權影視作品601部,疑似淫穢物品視頻238部。

同年5月18日,阿裡雲公司工作人員因發現“酷奇XX視頻”網站信息與備案不符,將“酷奇XX視頻”網站關停。

同年5月21日,經漢中市公安局對從“酷奇XX視頻”網站中提取的45部福利視頻鑒定,意見為:送檢的2張DVD光碟內視頻文件名稱01至45的45部視頻錄像為淫穢及色情物品。

同年5月30日,民警在上海市易果電子商務有限公司辦公室將被告人王世傑抓獲,在其家中扣押黑色台式組裝電腦主機一臺,並依法提取了電子數據。

同年9月6日,經漢中市公安局對從“酷奇XX視頻”網站中提取的總計238部福利視頻鑒定,意見為:移動硬碟內視頻文件名稱編號為001至238的238部視頻錄像為淫穢及色情物品。

截止“酷奇XX視頻”網站被關停時,該網站共有會員55人,提供各類視頻總計13萬餘部,其中有電影5.1萬餘部,電視劇2.2萬餘部,綜藝2.3萬餘部,動漫2.4萬餘部等,福利其它9085部,其中已提取固定視頻839部(含福利視頻238部,普通電影視頻601部)。

截止案發,未發現有註冊會員支付款項。同時,網站轉載的部分視頻中存在鑲嵌式廣告,在案件偵查過程中也沒有發現王世傑有實際廣告收入。

公訴機關據此認為被告人王世傑的行為構成侵犯著作權罪、傳播淫穢物品罪,建議對其判處二年以上三年以下有期徒刑,可適用緩刑,並處罰金。
被告人王世傑對起訴書指控的犯罪事實無異議,自願認罪,請求對其從輕處罰。

供辯情況

本案重點在供述的時候,辯護人對犯罪事實無異議,但辯稱:1、本案中,被告人王世傑沒有營利目的;2、對公訴機關指控被告人王世傑構成侵犯著作權罪有異議。建立鏈接不同於複製發行,亦不屬於提供作品,王世傑沒有侵犯著作權的主觀故意和客觀行為,且侵犯著作權罪是數額犯,王世傑並沒有實際獲利,故不構成侵犯著作權罪;3、被告人王世傑沒有傳播淫穢物品的故意,只是因為沒有做好網站的管理工作,疏忽大意。爬蟲技術是對訪問行為的模仿,無法自我識別、甄別淫穢視頻;

但實際上法院也一一駁回了

因為法院認為被告人在網站網頁上掛載“廣告位招租”視窗,招商廣告中載明自己的QQ號碼為聯繫方式;還在網站中設置了會員註冊、線上支付、積分兌換等,其具有營利目的、且其行為屬於複製發行。以營利為目的,未經著作權人、錄音錄像製作者許可,通過互聯網向公眾傳播他人電影、電視作品601部,情節嚴重,其行為構成侵犯著作權罪;

其次,被告人王世傑作為視頻網站的創建人和管理者,理應加強網站的管理和維護,其在採用爬蟲技術時,未對相關影視進行甄別,對淫穢視頻的傳播持放任態度,其主觀上具有傳播淫穢物品的故意,利用互聯網傳播淫穢音像視頻238部,情節嚴重,其行為亦構成傳播淫穢物品罪

判決情況

被告人王世傑犯侵犯著作權罪,判處有期徒刑一年零六個月,並處罰金人民幣5000元;犯傳播淫穢物品罪,判處有期徒刑八個月。

二罪並罰,決定執行有期徒刑二年,緩刑二年零六個月,並處罰金人民幣5000元。

反思總結

很明顯,案例中的當事人就是想爬一些電影視頻資源放到自己網站,通過會員制度和廣告來盈利,除了這種爬取視頻資源的情況,還有不少人通過爬蟲技術爬取技術博主的原創文章,放到自己的網站上,這種做法通常也會在網站上植入廣告來盈利,還有的是為了給網站做 SEO 優化,提高網站權重,也有的給文章設置付費內容、掃碼關註公眾號才解鎖內容等,這種未經過原作者允許進行惡意採集並盈利的行為,無疑都是侵犯著作權的,也是可以被判刑的。

不少人想將爬蟲作為副業賺錢,也有很多人信奉“技術無罪”,要知道“技術無罪”論,自從快播案後就是不存在的,利用爬蟲賺錢,應走正道,目的和手段都要合法合規,也一定要註意是否侵犯了別人的隱私權和著作權,切莫心存歪念,因小失大。當然利用爬蟲技術傳播淫穢物品更是我們不能觸及的紅線!

常見的“僅用於內部學習交流,不得傳播”的避風港原則,在人人影視案之後也不存在了,因此公司如果有類似的項目,技術和運營團隊都有義務對所爬取的內容進行甄別,利用人工智慧、NLP等技術,對文本、圖片、視頻進行合法性鑒別,甚至要有專門的數據治理部門,對於違法內容理應立即銷毀。

爬蟲技術基本上來說是一個加速便捷工具,如果你業務不合規,手動執行都是違法的,那麼大規模高效獲取只會加速滅亡,因此在使用效率技術前一定要想清楚自己業務的商業模式是否合法合規,要麼就不做,要做就得加強合規建設。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Smartbi操作 繪製報表 實現需求 在需要向資料庫中查詢一些欄位並繪製成一個Excel表格時,可以不需要經過後臺寫代碼,直接通過在Smartbi中寫SQL語句查詢資料庫,拿到數據填充到準備好的Excel模板中。 前期準備 安裝Smartbi插件(需要office)安裝好後Excel中會有相應的S ...
  • 前言 😋 大家早好、午好、晚好吖~ 知識點: 爬蟲基本流程 requests 發送請求 re 正則表達式 json 結構化數據解析 開發環境: python 3.8: 解釋器 pycharm: 代碼編輯器 requests 發送請求 pyecharts 繪製圖表 pandas 讀取數據 實現代碼: ...
  • 本文介紹 docker 環境下安裝並單機運行 Nacos2,使用 docker 環境下的 MySQL 8 存儲數據。 1 拉取鏡像 1.1 創建目錄 在硬碟上創建 nacos 的有關目錄: mkdir -p /Users/yygnb/dockerMe/nacos/conf /Users/yygnb/ ...
  • 摘要:圖像銳化和邊緣提取技術可以消除圖像中的雜訊,提取圖像信息中用來表徵圖像的一些變數,為圖像識別提供基礎。 本文分享自華為雲社區《[Python圖像處理] 十七.圖像銳化與邊緣檢測之Roberts運算元、Prewitt運算元、Sobel運算元和Laplacian算》,作者: eastmount 。 由於 ...
  • 本專欄的上一篇文章寫了《長篇圖解etcd核心應用場景及編碼實戰》,本文繼續。後續計劃章節內容如下: 《長篇圖解etcd核心應用場景及編碼實戰》 《搭建高可用etcd集群》 《基於etcd實現分散式鎖(java代碼實現)》 《基於etcd實現配置變更通知(java代碼實現)》 《基於etcd實現服務註 ...
  • Spring框架筆記 IOC容器(控制反轉) 什麼是 IOC ​ 控制反轉,把對象創建和對象之間的調用過程,交給Spring進行管理。 使用IOC目的: ​ 降低耦合度 ​ 通過控制反轉,對象在被創建的時候,由一個調控系統內所有對象的外界實體將其所依賴的對象引用傳遞給他。也可以說依賴被註入到對象中。 ...
  • 5. 數據查詢 欲看此文,必看如下兩篇文章: Druid支持JSON-over-HTTP和SQL兩種查詢方式。除了標準的SQL操作外,Druid還支持大量的唯一性操作,利用Druid提供的演算法套件可以快速的進行計數,排名和分位數計算。 5.1 準備工作 5.1.1 導入大量數據 準備大量數據提供查詢 ...
  • 以.uos為尾碼的文件,表示Uniform Office Spreadsheet文件,是一種國產的辦公文件格式,該格式以統一辦公格式(UOF)創建,使用XML和壓縮保存電子錶格。既有的Excel表格文件,可以通過格式轉換的方式轉換為UOS格式,本文將對此作相關介紹。 【導入jar包】 使用jar包: ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...