在2022年3月公布的場景解析及語義分割技術(shù)國際榜單ADE20K上,網(wǎng)商銀行以0.6730總分排名第一,這是繼去年斬獲并保持cityscapes語義分割榜冠軍后,在又一個計算機(jī)視覺領(lǐng)域榜單上取得的佳績。
據(jù)介紹,ADE20K是麻省理工學(xué)院(MIT)于2017年發(fā)布的一個可用于場景感知、分割和多物體識別等多種任務(wù)的數(shù)據(jù)集,包含150多種室內(nèi)外不同場景,2萬多張照片,參賽者需要通過算法準(zhǔn)確分割和標(biāo)記其中諸如建筑、樹、人、玻璃窗等物件,準(zhǔn)確率越高則得分越高。相比于同類型的cityscapes,ADE20K設(shè)置的環(huán)境和場景更為復(fù)雜,對算法適應(yīng)性的挑戰(zhàn)也更大,是世界計算機(jī)視覺三大頂級會議(CVPR、ICCV和ECCV)語義分割論文權(quán)威基準(zhǔn)數(shù)據(jù)集。
作為計算機(jī)視覺技術(shù)的重要分支,場景解析和語義分割能夠幫助計算機(jī)準(zhǔn)確感知和理解平面照片上的物體,從而將非結(jié)構(gòu)化的圖像轉(zhuǎn)化為可以被計算的數(shù)據(jù),為還原和理解真實世界場景提供基礎(chǔ)。大多數(shù)場景中的物體多樣且復(fù)雜,且同一類物體在不同場景中的顏色、形狀、大小、姿態(tài)也不盡相同,因此如何對不同物體進(jìn)行分割和準(zhǔn)確識別,是此類技術(shù)的難點。
據(jù)了解,網(wǎng)商銀行是目前唯一一家同時在兩個國際榜單上均保持領(lǐng)先的機(jī)構(gòu),同時在榜的還有華為、商湯科技、微軟、谷歌、亞馬遜等全球科技企業(yè)和研究機(jī)構(gòu)。
計算機(jī)視覺的不斷發(fā)展也為金融服務(wù)帶來了新的方法和模式。作為螞蟻集團(tuán)成立發(fā)起的專注于服務(wù)小微的科技銀行,網(wǎng)商銀行已經(jīng)在農(nóng)村金融和小微金融風(fēng)控等領(lǐng)域廣泛應(yīng)用了此類技術(shù)。
在農(nóng)村金融領(lǐng)域,網(wǎng)商銀行率先引入了衛(wèi)星遙感圖像識別技術(shù),在中低分辨率衛(wèi)星圖像上通過計算機(jī)視覺進(jìn)行10X10米的像素級作物識別,實現(xiàn)了對于玉米、水稻、小麥等20多種主糧作物和蘋果、狝猴桃、柑橘等十多種經(jīng)濟(jì)作物的識別,并達(dá)到了以往用高分辨率衛(wèi)星圖像才能實現(xiàn)的93%識別準(zhǔn)確率。基于這項技術(shù),網(wǎng)商銀行“大山雀”衛(wèi)星遙感風(fēng)控系統(tǒng),目前已覆蓋全國超過1000個縣域,服務(wù)幾十萬種植大戶。
同時,通過視覺圖像識別分割算法的持續(xù)優(yōu)化,也可以對農(nóng)房、大棚等設(shè)施進(jìn)行自動提取,快速識別設(shè)施分布類型、數(shù)量、面積等信息,從而可以獲取農(nóng)村經(jīng)濟(jì)活動區(qū)域分布信息,指導(dǎo)信貸層面提供更好的區(qū)域服務(wù)。
如下圖所示,底圖是天地圖區(qū)域公開影像,紅色(農(nóng)房)、綠色(大棚)分別標(biāo)記識別出的設(shè)施。
此外,在線下實體店的場景中,圖像感知技術(shù)也能用于對店鋪的行業(yè)和經(jīng)營行為的識別、理解和刻畫。
例如,通過識別用戶拍攝上傳的店鋪門頭照,貨架甚至進(jìn)銷獲合同和發(fā)票,并結(jié)合多維度交叉驗真技術(shù),網(wǎng)商銀行便能夠更準(zhǔn)確刻畫小微經(jīng)營者所處的行業(yè)、上下游關(guān)系和真實經(jīng)營面貌,從而為經(jīng)營性貸款授信提供依據(jù)。(文中圖片由企業(yè)提供)
通過解析照片,可以準(zhǔn)確識別商超貨架的貨品情況,從而為分析銷售情況提供參照。