四川圖像識別模塊分析

來源: 發(fā)布時間:2024-09-22

目前,有許多功能性AI工具可以幫助我們進(jìn)行圖像標(biāo)注,其中慧視SpeedDP是針對AI零基礎(chǔ)用戶的低門檻AI開發(fā)平臺,提供從數(shù)據(jù)標(biāo)注、模型訓(xùn)練、測試驗(yàn)證到RockChip嵌入式硬件平臺模型部署的可視化AI開發(fā)功能。SpeedDP提供豐富的算法參數(shù)設(shè)置接口,滿足不同用戶業(yè)務(wù)場景的定制化需求。此外,慧視SpeedDP開發(fā)平臺支持本地化服務(wù)器部署,數(shù)據(jù)敏感的用戶也無需擔(dān)心數(shù)據(jù)信息泄露的問題。目前慧視SpeedDP開發(fā)平臺主要提供目標(biāo)檢測算法的開發(fā)功能,不同的用戶可針對自己的業(yè)務(wù)場景進(jìn)行AI算法的定制化開發(fā)以及算法模型的快速迭代優(yōu)化。RK3399圖像處理板是我司自主研發(fā)的圖像識別模塊板,該板卡采用國產(chǎn)高性能CPU。四川圖像識別模塊分析

圖像識別模塊

YOLO系列算法是目標(biāo)識別領(lǐng)域很重要的技術(shù)之一,因?yàn)樾阅軓?qiáng)大、消耗算力較少,一直以來都是實(shí)時目標(biāo)檢測領(lǐng)域的主要范式。該框架被***用于各種實(shí)際應(yīng)用,包括自動駕駛、監(jiān)控和物流等行業(yè)的目標(biāo)識別。自今年2月YOLOv9發(fā)布以后,近期,清華又推出了YOLOv10,作為計(jì)算機(jī)視覺領(lǐng)域的突破性框架,具備實(shí)時的端到端目標(biāo)檢測能力,通過提供結(jié)合效率和準(zhǔn)確性的強(qiáng)大解決方案,延續(xù)了YOLO系列的傳統(tǒng)。據(jù)悉,YOLOv10在各種模型規(guī)模上都實(shí)現(xiàn)了SOTA性能和效率。例如,YOLOv10-S在COCO上的類似AP下比RT-DETR-R18快1.8倍,同時參數(shù)數(shù)量和FLOP大幅減少。與YOLOv9-C相比,在性能相同的情況下,YOLOv10-B的延遲減少了46%,參數(shù)減少了25%。監(jiān)控視頻圖像識別模塊公司成都慧視有工業(yè)級板卡RK3588.

四川圖像識別模塊分析,圖像識別模塊

要解決這個難題,慧視光電的算法工程師給出了小目標(biāo)識別算法的方案,通過加強(qiáng)目標(biāo)特征、數(shù)據(jù)增廣、放大輸入圖像、使用高分辨率的特征、設(shè)計(jì)合適的標(biāo)簽分配方法,以讓小目標(biāo)有更多的正樣本、利用小目標(biāo)所處的環(huán)境信息或者其他容易檢測的物體之間的關(guān)系來輔助小目標(biāo)的檢測。此外,利用自研的深度學(xué)習(xí)算法開發(fā)平臺,通過不斷的深度學(xué)習(xí),能夠讓AI更加精細(xì)的識別目標(biāo)。這個方法在瑞芯微RK3588、RV1126、RK3399pro等系列圖像跟蹤板上得到了較好地驗(yàn)證。因此,將這個算法用在無人機(jī)高空識別領(lǐng)域,完全能夠彌補(bǔ)傳統(tǒng)算法的不足,達(dá)到更加穩(wěn)定鎖定跟蹤的目的。

慧視光電開發(fā)的Viztra-HE030圖像處理板采用了工業(yè)級芯片RK3588,內(nèi)部植入公司自主研發(fā)的智能圖像算法,架構(gòu)更先進(jìn),核心數(shù)8核(4大4小),算力6.0TOPS,支持豐富的輸出接口,同時支持H264、H265兩類視頻編碼??蓪?shí)時對目標(biāo)進(jìn)行識別或者人為的的鎖定,同時可以根據(jù)輸出目標(biāo)的靶量信息,對目標(biāo)進(jìn)行實(shí)時跟蹤。這是達(dá)成目的的硬件條件。在算法領(lǐng)域,則需要一些特殊的算法。無人機(jī)執(zhí)行任務(wù)時飛在高空,地面的物體就會顯得較小,小目標(biāo)通常指圖像中像素面積小于32*32的物體,一般的AI算法難以實(shí)現(xiàn)精細(xì)鎖定跟蹤。AI算法賦能下的圖像處理板能夠進(jìn)行目標(biāo)識別。

四川圖像識別模塊分析,圖像識別模塊

無人機(jī)搭載如光電吊艙等帶有攝像頭的設(shè)備后,達(dá)到了實(shí)現(xiàn)智能識別的硬件條件,但是傳統(tǒng)的攝像頭只能獲取圖像,并不具備AI識別的功能。無人機(jī)AI識別算法的關(guān)鍵還是在于模仿人眼一樣進(jìn)行視覺處理,然后AI進(jìn)行智能提取和分析圖像,再和訓(xùn)練模型進(jìn)行快速比對,從而在無人機(jī)快速飛行的過程中做到實(shí)時目標(biāo)識別。要想實(shí)現(xiàn)目標(biāo)識別需要的硬件支持就是AI圖像處理板。圖像處理板通過算法的賦能,就能夠?qū)δ繕?biāo)區(qū)域的物體進(jìn)行AI識別分析,從而做出判斷。由于無人機(jī)作業(yè)的環(huán)境復(fù)雜,因此對于圖像處理板的要求需要進(jìn)一步提升。成都慧視開發(fā)的Viztra-HE030圖像處理板,采用了工業(yè)級芯片RK3588,采用先進(jìn)架構(gòu),8核(4大4小)處理,算力能夠達(dá)到6.0TOPS。同時,慧視光電能夠根據(jù)需求環(huán)境定制豐富的輸出接口?;垡旳I板卡可以用于大型公共停車場。云南自主研發(fā)圖像識別模塊提供商

慧視光電的RK3399是一款什么樣的板卡?四川圖像識別模塊分析

我國家的機(jī)動車數(shù)量龐大,但是停車位的建設(shè)卻沒有很好的跟上節(jié)奏,這也就導(dǎo)致許多車在出行時找不到停車位,車主也就不得不臨時將車停放在路邊。隨著路邊停放車輛的不斷增多,原本寬敞的道路也就變得狹窄,嚴(yán)重時甚至?xí)碌盟共煌?。此外,一些大車由于阻擋視野,還容易造成“鬼探頭”等事故。通常情況下,交管部門會利用路邊的抓拍設(shè)備進(jìn)行違停抓拍或者巡邏車進(jìn)行巡邏,但是從實(shí)際效果來看,作用并不明顯。于是,無人機(jī)被派上用場。四川圖像識別模塊分析