以計算機視覺、深度學習和大數(shù)據(jù)為核心,通過創(chuàng)新的技術(shù)架構(gòu)布局多領(lǐng)域、多方向前沿研究,快速打通人工智能場景化應(yīng)用落地,賦能行業(yè)。
通過圖像或視頻預(yù)測心率、心率變異性、血壓、血氧、呼吸率壓力六大生理指標;實現(xiàn)智能舌診面診,分析用戶健康狀態(tài),賦能智慧醫(yī)療等應(yīng)用場景。
利用對抗訓練、活體檢測deepfake、異常檢測等技術(shù),保證視覺模型不僅精度高并且安全可信,賦能產(chǎn)業(yè)安全。
首創(chuàng)類腦神經(jīng)網(wǎng)絡(luò)計算模型,該模型具備自適應(yīng)、可遷移、抗噪聲能力。首創(chuàng)多腦區(qū)協(xié)同脈沖神經(jīng)網(wǎng)絡(luò)模型,具備突破多腦區(qū)協(xié)同視覺、聽覺等感知的多模態(tài)學習能力,該模型具備自學習、小樣本、多模態(tài)樣本協(xié)同學習能力,可以自動標注樣本。創(chuàng)新性構(gòu)建基于腦結(jié)構(gòu)和功能啟發(fā)的防攻擊神經(jīng)網(wǎng)絡(luò)模型。
構(gòu)建了高效的特征比對策略,首先將任務(wù)串行化,利用任務(wù)的單一性對執(zhí)行代碼進行規(guī)劃,提升代碼的運行效能,具備平移不變性、旋轉(zhuǎn)不變性、尺度不變性,可增強抗干擾,防止數(shù)據(jù)防篡改。
基于硬件安全模塊支持下的可信計算平臺,以提高系統(tǒng)整體的安全性,具備高通量編解碼、視覺語義分析、視覺圖譜構(gòu)建、視覺任務(wù)建模、視覺可信推理。
云服務(wù)能力下沉,繼承了云安全、存儲、計算、人工智能能力,可部署于不同量級的智能設(shè)備和計算節(jié)點中,通過定義物模型連接不同協(xié)議、不同數(shù)據(jù)格式的設(shè)備,提供安全可靠、低延時、低成本、易擴展、弱依賴的計算服務(wù)。
多模態(tài)融合感知技術(shù)綜合利用不同傳感器獲取的信息,形成了對環(huán)境或目標更全面的感知和識別,具備全領(lǐng)域2D/3D視頻感知、多方位loT設(shè)備感知、全要素數(shù)據(jù)感知、多維度狀態(tài)行為感知。
獲取的圖像進行實時動態(tài)分析,并對含有槍支彈藥類、爆炸物品類、管制器具類、易燃易爆物品類、毒害性物品類、腐蝕性物品類、放射性物品類、限制攜帶物品進行實時動態(tài)預(yù)警和數(shù)據(jù)推送。
領(lǐng)先的ReID技術(shù),首創(chuàng)突破行人特征表達技術(shù),實現(xiàn)人物跨鏡頭、跨交通工具、更換服飾的跨場景跟蹤。領(lǐng)先的細粒度場景結(jié)構(gòu)化技術(shù)、多維度行人結(jié)構(gòu)化技術(shù),基于視覺的任務(wù)推理和預(yù)測,復雜場景任務(wù)管理和規(guī)劃的智能視覺推理引擎。
利用視頻結(jié)構(gòu)化技術(shù)及深度學習算法,分析圖像/視頻中所有的人臉、非機動車、機動車等目標,以及路況、行為等情況,并輸出其屬性。
人像分析:對圖片中行人的衣著、戴眼鏡、拎東西、帶口罩、帽子、發(fā)型、背包、抱小孩等屬性的識別分析。
車輛分析:檢測圖片中的車輛,并對品牌、型號、顏色、車牌號等屬性進行識別分析。
場景分析:檢測圖片中的場景,輸出檢測出的場景并進行預(yù)判分析。
通過預(yù)訓練的語義角色標注模型引入顯式的上下文語義標簽信息,以多場景技術(shù)應(yīng)用為導向,提供可直接應(yīng)用于產(chǎn)品策略的NLP技術(shù)能力。
通過對損失函數(shù)的有效組合,提高遮擋嚴重的半身照以及跨域人員的精準度。
通過攝像頭實時捕捉用戶畫面,隨機給出動作指令,根據(jù)用戶做動作的方式;或近紅外和深度攝像頭捕捉用戶畫面,判斷是否是真人。
利用靜脈中紅血球吸收特定近紅外線的特性,將近紅外線照射手指,并由圖像傳感器感應(yīng)手指透射過來的光來獲取手指內(nèi)部的靜脈圖像,進而進行生物特征識別。
通過共享底層網(wǎng)絡(luò)架構(gòu)加基于注意力機制的多分支高層網(wǎng)絡(luò)的訓練,提高人臉特征在不同光照,遮擋的變量下特征的魯棒性。圖片/視頻中的人臉檢測,檢出率達92.4%,檢測速度達30幀/秒,支持最小為20像素的人臉圖像。精確定位圖片/視頻中人臉的256個關(guān)鍵點。