前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數據挖掘下污染環境犯罪預警模型淺析范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:污染環境犯罪作案手段隱蔽,危害后果的浮現具有延遲性,給偵查工作帶來極大的阻礙,本文基于污染環境犯罪的特點,結合近幾年公安大數據偵查蓬勃發展的現狀,提出基于數據挖掘技術的污染環境犯罪預警模型的構建設想,論述其必要性與可行性,以及構建預警模型的整個流程,以期能夠為污染環境犯罪的有效打擊提供一些借鑒和幫助。
關鍵詞:污染環境犯罪;數據挖掘;預警模型
大數據偵查具有獲取渠道多元、信息分析客觀全面、處理數據信息高效、打擊與預測一體化等優勢,為偵查系統技術的進一步提升帶來了不可或缺的貢獻。近年來,公安機關利用大數據進行挖掘分析,實現打擊現行、監測預警已經成為大趨勢,各地公安業務部門紛紛舉辦數據建模大賽,涉及刑偵、經偵、反恐、禁毒等各個業務面,成果十分豐富[1]。數據挖掘技術可以從海量數據中運用特定的方法搜索出那些先前并不知道的、隱藏的、有潛在使用價值的信息[2],這一功能恰好與偵查工作的需求相吻合,因此被廣泛應用于各類犯罪預警模型的構建。例如,對于偵查機關而言,獲取污染環境犯罪線索的傳統模式是接受群眾舉報以及接受相關行政部門的案件移送,通過污染結果找到污染物,再通過污染物溯源找到嫌疑企業。利用數據模型進行預警可以改變傳統的線索來源方式的被動性和滯后性,實現對污染環境犯罪的高效打擊。以N市食藥環偵支隊為例,支隊先后建成“企業非法處置危廢”、“易制毒、易制爆行業非法處置危廢”、“環保監測數據造假”等數據分析研判模型,有效匯聚整合全市6000多家產廢企業,易制毒、易制爆化學品使用企業共計30余萬條數據,開辟數據模型賦能打擊污染環境犯罪新路徑,有力提升了實戰效能。
1構建污染環境犯罪預警模型的必要性
1.1案件量激增涉及領域廣泛
根據最高檢公布的消息,2018年1月至2020年8月間,全國檢察機關共批捕污染環境犯罪案件5364件9517人,同比分別上升64.47%和80%;起訴7226件16687人,同比分別上升47.44%和72.99%[3],全國污染環境案件查處數量總體呈明顯上升趨勢。根據我國危險廢物處置規定,除極個別允許自行利用和合理存放的情況之外,不允許企業私自處置。但交由具有資質的專門經營單位處理需要支付費用,部分企業為了降低成本,將產生的危險廢物少做或不做登記申報,不經正規處置。甚至出現了專門收集、倒賣,傾倒、再加工危險廢物的地下產業鏈。涉及金屬表面加工業、玻璃制造業、染料制造業、食品藥品制造業、再生油加工業、廢舊機械收購拆解業等行業,領域非常廣,偵查部門難免兼顧乏力。盡管各行業都有對應的行政監管部門,但總有人偷鉆監管漏洞、頂風作案。
1.2犯罪手段隱蔽造成取證困難
污染環境犯罪案件中,不法商人為了逃避打擊,選擇在城鄉接合部、偏遠農村地區、荒郊野嶺以及正規園區的廠中廠建廠,通過支付較高租金、拉攏村干部以及熟絡關系人等形式無證開辦黑工廠、黑加工點;另外,這些黑工廠、黑加工點在生產經營過程中為掩人耳目,逃避查處,往往選擇閉門經營、夜間生產,作案時利用暗管、滲坑偷排,有的直接向城市網管偷排,花樣層出不窮。加之污染環境犯罪侵犯的是生態環境、公眾權益,案件中往往沒有直接受害的自然人,群眾監督的力度和廣度受到限制。2019年S區查辦的一起污染環境犯罪案件,犯罪嫌疑人在沒有相應資質的情況下,以低價承諾為某企業處理工業廢液,在深夜時分多批次用灌裝車輛運輸工業廢液至蘆葦灘地,車輛經過區域偏僻荒涼,皆為道路監控盲區,若非民警在走訪過程中“嗅覺”敏銳,順線深挖,極有可能讓這一非法處置危廢的團伙逃脫制裁。
1.3社會危害極大后期修復困難
與傳統的殺人、盜竊等犯罪不同,污染環境犯罪沒有特定直接受害人,并且損害后果往往不是立刻浮現的,具有很長的潛伏期。20世紀中葉“富山痛痛病”的發現引起人們對環境與健康問題重視與思考,從污染物排放到公害病引起關注,危害后果的潛伏期長達幾十年。除此之外,危險廢物一旦非法排放,便會污染附近的土壤和水質,滲入地表,甚至污染地下水,僅僅依靠水和土壤的自然修復,往往需要數十年甚至數百年的歷程,污染一次可能需要好幾代人付出沉重代價。危險廢物惰性的化學屬性,決定了合理處置的高額成本,并且我國當前修復危險廢物污染源的技術尚不夠成熟。所以,環境一旦被污染,想要短時間修復原貌極其困難。
2構建污染環境犯罪預警模型的可行性
2.1理論上的可行性——信息轉移原理
信息轉移原理是物質交換原理在信息時代的發展與完善,信息轉移原理表明犯罪過程中信息轉移現象是必然發生的。首先是由犯罪行為的物質性原理決定的。行為人將內心的犯意外化為現實的行動,用物質力量去侵犯犯罪對象時才稱之為犯罪發生[4]。這種物質的力量必然會破壞事物原有的狀態,引起信息轉移的出現。與犯罪活動相關的信息以各種各樣的形式散存于客觀與主觀世界之中,偵查人員需要做的就是利用偵查學專業知識和手段盡量完整地搜集這些碎片式的信息,經過加工處理形成信息鏈條,還原犯罪發生時的狀態。數據挖掘正是通過對大宗信息數據的分析處理來發現犯罪端倪、實現監測預警,在這個數據爆炸的時代,人們出行、住宿、支付、通信等社會活動無一不被納入電子信息的大網,犯罪嫌疑人也不例外。以污染環境犯罪為例,企業生產經營過程中會產生購買、出售、庫存、耗能、排污等信息;雇傭或者受雇于他人非法處置污染物會產生通話記錄、網絡聊天記錄、轉賬記錄等信息;共同作案可能會有同住宿記錄并呈現手機信號的伴隨;利用車輛運輸傾倒污染物會產生交通軌跡信息。這些看似分散的信息經過模型的研判,可以反映出污染環境犯罪中一些共性的現象或者核心關聯關系。當某種行為遺留的信息痕跡滿足這種共性的現象或者關聯關系,我們可以認為這種行為存在涉嫌污染環境犯罪的風險。
2.2實踐上的可行性——大數據強大的相關關系發掘功能
一個犯罪行為的存在,必定離不開“時空人事物”等要素,只是有些關聯淺顯易得,有些關聯復雜深藏,不易察覺。如果僅靠偵查人員的主觀經驗和直覺去判斷分析,精準性很難保證。為切實解決污染環境案件線索發現難的問題,必須堅持以專業打職業,通過資源整合共享、數據聚合關聯、信息綜合研判,變被動為主動,利用數據挖掘技術全面準確地發掘相關關系,建立指標體系,實現精準監測預警,在節省人力物力時間的同時,高效獲取線索。以N市食藥環支隊建立的“企業非法處置危廢”預警模型為例,該模型立足企業生產工藝和物料平衡原理,發掘出企業生產原材料購入量、企業生產耗能量、企業產品產出量和產廢量等信息之間的關聯,立足此種關聯實現對涉嫌非法處置危險廢物的產廢企業的預警。簡單來說,其企業投入生產使用的用電量、用水量與企業產品產出量有聯系,產品產出量與廢物產生量又有內在聯系,也就是說,企業能耗與企業危險廢物的產生有一定的關聯性。如果某企業的用電量、用水量與環境保護部門備案的危險廢物正規處置量關聯性發生異常,那么該企業就有可能存在非法處置危險廢物的可能性,模型將發出預警信號,待偵查人員前去落地查控。若經查實,預警所依據的數據也將成為重要證據,避免屆時很多數據都被刻意篡改,人證流失,現場也被清理,偵查工作將陷入被動。
3預警模型構建流程
預警的過程,就是收集情報信息、利用情報信息、發出情報信息的過程[5]。預警模型的構建也遵循這樣一個過程。構建流程大致包括數據收集、數據預處理、建立模型、評估校正、預警輸出五個環節。當然,在建立預警模型之前,我們首先要明確業務需求,模型要解決的問題是對有高度可能涉嫌污染環境犯罪的行為自動推送預警信號,接下來的五個環節都要圍繞這個核心需求進行操作。
3.1數據收集
數據收集之前,我們要理解到底哪些數據可以反映某行為高度涉嫌污染環境犯罪。可能需要大量的污染環境犯罪歷史數據,主要是案卷信息,以此為抓手發掘出更為精準的跟蹤指標。可能需要大量的地理環境監測數據來實時掌握污染情況。可能需要企業被環保行政執法以及處罰的次數來判斷其行為升級、實施犯罪的風險等等。集中數據資源不僅包括將原本分散在各偵查業務部門的數據加以整合,還包括針對與偵查工作有密切聯系的社會數據建立資源共享機制[6]。數據收集是大數據挖掘技術能充分發揮作用的基礎,數據收集越全面、越充分,運算出的結果越客觀準確。為了更加準確地對污染環境犯罪行為實施預警,應當盡可能全面地收集與其相關的數據,應當包括但不限于以下幾類:(1)公安機關內部數據:污染環境犯罪歷史案卷、出租廠房登記數據、重點涉污行業場所管理數據、旅館住宿人員數據、道路卡口視頻監控數據等。(2)地理環境監測數據:包括對空氣質量、水質、土壤、植物、動物、微生物等的在線監測數據;通過遙感采集、地圖數字化、現場踏勘和攝影測量等采集的地形地貌、水文土壤、行政境界、社會經濟數據等。(3)行政部門相關數據。包括金屬表面加工業、玻璃制造業、染料制造業、食品藥品制造業、再生油加工業、廢舊機械收購拆解業等產污行業的工商登記數據,企業環評數據,環保部門行政執法、處罰數據,企業內部監測設備采集數據、企業危廢處置記錄等。(4)互聯網涉案數據。主要包括網絡通訊數據以及在各類網站、論壇、APP、物流平臺等抓取的相關數據等,通過關鍵詞追蹤抓取比如與污染環境犯罪有關的曝料、感慨、指責等等。(5)其他社會數據。包括易制毒易制爆化學品購買數據、銀行交易數據、能源使用數據、通信數據、出行數據等。
3.2數據預處理
數據挖掘是通過挖掘算法在給定的數據集中建立評估模型,數據挖掘過程的進度決定于原始數據的質量[7]。在收集的大量數據中并非所有數據都是有效的,數據在采集過程中,可能存在因為采集設備故障、人員操作失誤等原因造成的數據屬性值缺失,數據不規范等情況;與其他部門共享的數據,規格也并不一定相同,因此需要通過預處理來篩選和清洗,補全缺失的數據,轉化非結構化數據,刪除不需要的數據,將收集到的原始數據轉換成能夠符合挖掘算法要求標準的目標數據。數據預處理整合來自不同數據源的多維異構數據,主要操作有數據清洗、數據集成、數據規約和數據轉換等[8]。
3.3建立模型
模型的搭建是大數據挖掘技術的重要環節,分為發掘相關關系和建立預警模型兩步。首先,將經過預處理的污染環境犯罪的歷史數據錄入,選擇合適的算法發掘不同因素之間的相關關系,結合實戰經驗,確立最能反映污染環境犯罪行為的影響因子,建立合理的預警指標體系。比如一年內污染物排放超標次數[9]、一年內在線監測報警次數、一年內行政處罰次數[9],以及危險廢物處置數據異常指數、罐車進出污染環境高危區域次數、水電等能耗量異常指數等。其次,基于相關關系的分析建立預警模型。筆者設想的污染環境犯罪預警模型分為污染環境犯罪監測子系統和污染環境犯罪預警子系統。其中監測子系統包括犯罪行為反映指標跟蹤模塊、犯罪風險評估模塊;預警子系統包括犯罪行為預警模塊和應急處置模塊。犯罪行為反映指標跟蹤模塊負責對污染物排放超標次數、在線監測報警次數、危險廢物處置數據異常指數、車輛進出污染環境高危區域次數、水電等能耗量異常指數等指標進行跟蹤監測。犯罪風險評估模塊負責對一些異常情況進行涉嫌污染環境犯罪的風險評估,通過對歷史數據的分析以及偵查人員豐富經驗的運用,為各指標設立閾值,超出閾值即發出預警信息。例如,按照工藝流程某企業應該產生的工業廢物數量與實際上報正規處置的危廢數量明顯超出合理差值,風險評估模塊結合異常指標的數量以及異常的程度進行風險的評估,劃定等級。包括對區域、時段以及具體犯罪行為的風險評估。犯罪行為預警模塊主要負責根據風險等級進行預警和處置。對污染環境犯罪高危區域、高危時段,以及犯罪風險等級較高的異常行為進行預警,由偵查部門立刻介入調查。犯罪風險等級低的異常情況可以選擇繼續監控或者交由環保部門去檢查整改。應急處置模塊根據對所有數據的綜合研判,對于污染的程度進行判斷,針對一些緊急情況給出處置預案,比如切斷水源供應、轉移群眾、停工停學等,防止造成更為嚴重的后果。
3.4評估校正
模型建立之后,應當對模型的效果進行評估。包括指標設置、閾值設置、算法適用、預警情報精準度等方面,常用的評估方法是輸入歷史犯罪數據進行滾動運算,看模型能否推送預警信息。除此之外,犯罪與偵查處在你追我趕的較量中,當污染環境犯罪行為能夠被偵查部門精確監控預警之后,犯罪分子必然會尋找新的犯罪手段來躲避偵查,隱藏犯罪事實。預警模型能對犯罪行為做出預測,較之于人工巡查更為客觀高效,但是,預警模型的短板在于一旦指標建立、算法確定,它只會按照既有設定進行運算,難以實現自發自動地與時俱進,一旦犯罪發生新的變化,模型的預警即會失效。偵查人員在借助污染環境犯罪預警模型工作的同時也要及時了解新的犯罪手段,經常關注環保前沿動態,對周圍群眾進行調查走訪,根據實際情況的變化來調整監測指標,調整系統算法和結構,以實現污染環境犯罪精確預警[10]。
3.5預警輸出
模型經過分析研判,對涉嫌污染環境犯罪風險系數較高的區域、時段、個體進行預警[10]。(1)風險地區預警通過地理環境監測數據和污染環境犯罪歷史數據的分析,可以實現區域的預警。一方面是根據環境指標異常對已經發生污染環境行為的區域發出預警,另一方面是對于尚未發生污染環境犯罪行為,但屬于犯罪分子較為青睞的犯罪實施地,需要加強監控、重點關注的區域發出預警。(2)風險時段預警通過大數據分析出某些時段是污染環境犯罪行為多發的時段,偵查部門就可以對癥下藥,一方面加強對高發時段企業監測設備所呈現數據真實性的警惕,另一方面結合區域預警結果,在高發時段增加巡邏警力、增強巡邏力度,并且嚴密排查此時段往來于高危區域的運輸貨車,先發制人。(3)風險個體預警通過對企業各項數據的監測分析,結合特情信息收集以及軌跡研判,定位到具體某一個企業、某些人員、某輛貨車涉嫌實施污染環境犯罪行為,然后部署警力,落地查控。
4結語
目前,利用數據挖掘技術建立模型,實現線索挖掘、監測預警已經成為公安機關打擊犯罪的重要方式,在打擊污染環境犯罪這方面,大數據技術還有很大的應用潛能可供挖掘,需要偵查人員拓展思路,積極主動探索,更好地發揮大數據在偵查中的價值。依靠大數據技術來分析研判對于打擊污染環境犯罪來說固然準確高效,但不能完全依賴。公安機關仍然要做實基礎工作,強化陣地管控,著力提高基層工作水平,進一步強化對轄區內重點行業場所的基礎管理,在企業內部關鍵崗位人員中物建信息員和耳目,交警部門也在從事貨物運輸的駕駛員中物建信息員,多點布情,點面結合,確保涉及環境污染的案件能夠及時被發現,最大限度地擠壓污染環境違法犯罪活動生存的空間。
作者:劉藝絢 單位:中國人民公安大學