隨著油氣地震勘探技術(shù)的進步和勘探網(wǎng)格的精細化,一次勘探測量會形成百億量級的地震道,原始數(shù)據(jù)采集量從2012年的一年約50TB飛速上漲到2019年的2500TB、在單個大型項目中需要提供配套存儲容量就最高可達30PB。中石油集團東方地球物理勘探有限公司處理中心總工程師賴能和表示,數(shù)據(jù)已成為石油勘探的重要資產(chǎn),不斷驅(qū)動油氣勘探技術(shù)創(chuàng)新。
給大地做CT
在某海域,靜靜地漂浮著幾艘布滿了專業(yè)設(shè)備、外形很“奇怪”的船只,如果不事先說明,很少有人會知道他們正在進行著一項無比精細、復(fù)雜的宏大工程。這些船只會拖著一條條很長的電纜,通過氣槍陣列發(fā)射到固定的深度爆炸,這些產(chǎn)生地震波遇到不同的地下介質(zhì),形成不同的反射波,上傳到電纜上面的傳感器接收,這些接收到的信號,經(jīng)過數(shù)據(jù)中心的數(shù)字處理和地質(zhì)解釋,其成果成為判斷海底地質(zhì)結(jié)構(gòu)的重要依據(jù)。

海域石油勘探
很多人可以猜到,這些船正在進行的工程是海底油氣勘探,而這些船則是中石油集團東方地球物理勘探有限公司(簡稱:東方物探)的勘探船,他們通過采用包括海上過渡帶、海底電纜、海底節(jié)點等多種采集技術(shù)來進行淺海與深海的油氣三維地震勘探,用數(shù)據(jù)給海底“做CT”,追尋油氣的“蛛絲馬跡”。
從幾十年前落后的油氣勘探技術(shù)與設(shè)備,發(fā)展到如今各種先進勘探技術(shù)“輪番上陣”,中國的油氣勘探技術(shù)實現(xiàn)了快速發(fā)展,并孕育了東方物探等領(lǐng)先的企業(yè)。迄今為止,東方物探已經(jīng)配合油田累計發(fā)現(xiàn)、落實圈閉近1.7萬個,提供建議井位近2.4萬口,2018年在公司國內(nèi)外油氣重要發(fā)現(xiàn)參與率達到92%。國際市場主要分布全球5大洲、73個國家,為270多家油公司提供技術(shù)服務(wù)。
數(shù)據(jù)驅(qū)動油氣地震勘探
在某油氣勘探現(xiàn)場,東方物探的一個小隊正在進行現(xiàn)場勘探,他們手中沒有紙筆,而是依靠著先進的設(shè)備進行數(shù)據(jù)采集,他們每天現(xiàn)場采集的數(shù)據(jù)量大概有20個TB左右,采集完以后,當天晚上拿到營地進行拷貝,并上傳到現(xiàn)場數(shù)據(jù)處理系統(tǒng)的存儲設(shè)備中進行現(xiàn)場處理,隨后這些數(shù)據(jù)還需傳到室內(nèi)數(shù)據(jù)中心中,進行進一步的數(shù)據(jù)整理與分析。
在勘探階段,這樣的情境幾乎每天都要上演,由此帶來了海量的數(shù)據(jù)。賴能和表示,東方物探的原始數(shù)據(jù)采集量已經(jīng)從2012年的一年大概在50TB左右,飛速上漲到2019年的2500TB左右,7年間上升了50倍。根據(jù)地震數(shù)據(jù)處理流程的需要,每個項目需要的存儲量基本上是原始數(shù)據(jù)的15倍左右,那么東方物探數(shù)據(jù)中心要配套的有效存儲學(xué)40PB,裸容量超過50PB。
之所以會產(chǎn)生如此巨大的數(shù)據(jù)量,來源于油氣勘探數(shù)據(jù)的采集和處理特點。賴能和指出:“油氣勘探分為數(shù)據(jù)采集、數(shù)據(jù)處理、利用處理后的數(shù)據(jù)體進行地質(zhì)構(gòu)造解釋等三個階段。從數(shù)據(jù)采集的角度看,當前的油氣勘探可以分為陸地勘探與海洋勘探兩個方面。其中,陸地勘探主要采用可控震源,通過震源持續(xù)震動,向下傳播的波遇到地下不同的巖層反射回地面接收信號的方式來進行勘探;而海洋勘探則可以通過海上過渡帶、海底電纜、海底節(jié)點等方式進行勘探。”
由于石油勘探的區(qū)域巨大,涉及到地震波特征的數(shù)據(jù)量也堪稱海量,再加上地表、海底的條件和地下的地質(zhì)結(jié)構(gòu)千變?nèi)f化,油氣的運動方向,儲層部位也無規(guī)律可循,所以,三維地震勘探對于數(shù)據(jù)的存儲、處理技術(shù)都提出了非常高的要求。在特大型項目中,通常一次采集的數(shù)據(jù)量會形成上百億量級的地震道,原始數(shù)據(jù)量就可能達到數(shù)百TB。
承載探勘的數(shù)據(jù),存儲需要海量、高性能和高可靠
在東方物探某基地,矗立著一個大型的數(shù)據(jù)中心,該數(shù)據(jù)中心項目一期的數(shù)據(jù)量就達到了1400TB,部署了 256節(jié)點浪潮集群和32個浪潮 AS13000 存儲節(jié)點,提供了30個PB的配套存儲。據(jù)賴能和介紹,之所以會在數(shù)據(jù)中心投入如此大的力量,不僅是因為數(shù)據(jù)對于油氣勘探極為重要,而且還因為油氣勘探計算量巨大、存儲量巨大、勘探數(shù)據(jù)極為敏感,需要實現(xiàn)本地化存儲。
賴能和表示,“在海外部署如此大型的存儲系統(tǒng),對于存儲本身提出了非常巨大的挑戰(zhàn)。該項目一期的數(shù)據(jù)量是1400TB,什么概念呢?如果有4000個CPU來做地震資料疊前偏移成像的話,要做60天,大概要30個PB的存儲進行配套,計算量和存儲量斗非常大。”

分布式存儲以極致容量、極致性能承載物探數(shù)據(jù)
物探應(yīng)用需要處理龐大的數(shù)據(jù),對于后端存儲系統(tǒng)的IO處理能力及數(shù)據(jù)吞吐能力有極高的性能要求。舉個例子,地震資料的單個文件大小超300GB,給帶寬提出了很高要求;而數(shù)據(jù)分析過程會產(chǎn)生海量的次生小文件,又對IO提出了高要求。如果存儲性能不足,輕則導(dǎo)致作業(yè)時間延長,重則導(dǎo)致作業(yè)失敗,影響整體項目進度,經(jīng)濟損失難以估量。
另外,東方物探有的三維采集項目位于海外,存儲系統(tǒng)也要隨之“漂洋過海”,遠離國內(nèi)的運維保障中心,再加上較為惡劣的溫濕度條件。三維物探的存儲系統(tǒng)一旦發(fā)生故障,將可能對業(yè)務(wù)系統(tǒng)正常運行造成風(fēng)險,要求存儲系統(tǒng)必須具備足夠的冗余容錯能力,不能因為設(shè)備級故障導(dǎo)致業(yè)務(wù)停機或數(shù)據(jù)丟失。
浪潮分布式存儲平臺AS13000 在小文件讀寫性能、空間利用率、文件支持數(shù)量、智能運維預(yù)測等方面的創(chuàng)新優(yōu)化,每秒實現(xiàn)了幾千萬次甚至億級讀寫操作,從存儲層面支撐海量三維物探數(shù)據(jù)得到盡快的分析。同時,浪潮存儲提供了嚴格的生產(chǎn)和測試要求,其技術(shù)指標能滿足油氣勘探技術(shù)要求。
向海底、地底延伸 解鎖新的油氣藏
2004年,世界石油的預(yù)計總儲藏量為1717億噸,2008年,世界石油預(yù)計總儲存量達到1839億噸,到了2017年,世界石油總儲存量則達到了2423億噸。雖然作為不可再生能源,但是探明的石油儲量卻呈現(xiàn)“越來越多”的趨勢。
之所以出現(xiàn)這種情況,最直接的原因是油氣勘探技術(shù)的不斷進步,通過以數(shù)據(jù)來驅(qū)動油氣勘探,物探公司如今已經(jīng)可以更加有效地找到深埋于地層中的油氣。

中石油集團東方地球物理勘探有限公司處理中心總工程師 賴能和
油氣勘探的技術(shù)正在不斷進化。目前的勘探技術(shù)只能支持地下五公里的低深度空間勘探,而未來這一深度也可能將向更深的深度演化。而且勘探網(wǎng)格也將實現(xiàn)從過去的25×25到12.5×6.25或更小的網(wǎng)格發(fā)展??碧骄W(wǎng)格密度每增加一倍,數(shù)據(jù)量就增加3-4倍;網(wǎng)格畫的越細,分析的就越準確,油氣探勘對計算和存儲能力的要求是無止境的。此外,賴能和表示,“人工智能在油氣勘探領(lǐng)域已經(jīng)開始陸續(xù)應(yīng)用,曾經(jīng)需要30人處理2個月的數(shù)據(jù),現(xiàn)在通過神經(jīng)網(wǎng)絡(luò)和人工訓(xùn)練算法去處理,速度、精確度都大大提高。”

東方物探成為全球物探市場的一股重要力量
隨著石油、天然氣等能源開發(fā)向“地底或海底”延伸,以及重大工程建設(shè)、地質(zhì)調(diào)查、科研等需求的不斷拓展,三維物探行業(yè)將有望迎來爆發(fā)期。以東方物探為代表的中國企業(yè),積累了雄厚的技術(shù)實力以及豐富的經(jīng)驗,正在成為全球物探市場的一股重要力量。