近日,我國(guó)首部針對(duì)生成式人工智能產(chǎn)業(yè)的規(guī)范性政策—《生成式人工智能服務(wù)管理暫行辦法》(以下簡(jiǎn)稱辦法)正式施行,引發(fā)行業(yè)人士和相關(guān)政策研究者的高度關(guān)注。
國(guó)家互聯(lián)網(wǎng)信息辦公室有關(guān)負(fù)責(zé)人表示,出臺(tái)《辦法》,旨在促進(jìn)生成式人工智能健康發(fā)展和規(guī)范應(yīng)用,維護(hù)國(guó)家安全和社會(huì)公共利益,保護(hù)公民、法人和其他組織的合法權(quán)益。
《辦法》的出臺(tái),一方面體現(xiàn)了國(guó)家對(duì)生成式人工智能產(chǎn)業(yè)發(fā)展的鼓勵(lì)和支持,既為產(chǎn)業(yè)創(chuàng)新提供了政策導(dǎo)向和法律保障,另一方面又為產(chǎn)業(yè)監(jiān)管提供了科學(xué)合理且平衡適度的框架。
過(guò)去幾年,商業(yè)化一直是困擾整個(gè)人工智能行業(yè)的難題,大模型的出現(xiàn)為AI商業(yè)化提供了新契機(jī)。作為極具開(kāi)拓性且高速發(fā)展的新業(yè)態(tài),大模型的賽道之分,成為了業(yè)內(nèi)爭(zhēng)論不休的話題?,F(xiàn)有大模型大致可分為兩類(lèi):通用大模型,像ChatGPT,面向人群以及場(chǎng)景適用范圍十分廣泛,但由于需要巨大的計(jì)算資源和數(shù)據(jù)量,已經(jīng)成為國(guó)內(nèi)外大廠的重點(diǎn)項(xiàng)目;垂直大模型,在特定的領(lǐng)域或行業(yè)中經(jīng)過(guò)訓(xùn)練和優(yōu)化,針對(duì)特定場(chǎng)景提供更精準(zhǔn)和高效的解決方案,更好地滿足用戶在某個(gè)領(lǐng)域或者場(chǎng)景下的需求和期待,如:醫(yī)療、金融等。
此次《辦法》強(qiáng)調(diào)了:應(yīng)采取有效措施,提升生成式人工智能服務(wù)的透明度,提高生成內(nèi)容的準(zhǔn)確性和可靠性。從“準(zhǔn)確性‘’“可靠性”這兩點(diǎn)要求來(lái)說(shuō),通用大模型由于爬取網(wǎng)上可能存在錯(cuò)誤、偏見(jiàn)的信息,會(huì)導(dǎo)致精準(zhǔn)度不夠,生成有誤或有偏見(jiàn)的響應(yīng),其不足逐漸顯露,無(wú)法切實(shí)滿足各行各業(yè)的需求。相比較而言,垂直大模型更能發(fā)揮其價(jià)值,它需要學(xué)習(xí)大量行業(yè)的專精語(yǔ)料和經(jīng)驗(yàn)知識(shí),具有更強(qiáng)的領(lǐng)域?qū)I(yè)性和任務(wù)針對(duì)性,能夠更好地解決特定領(lǐng)域的問(wèn)題和提供更加精準(zhǔn)的服務(wù),也更容易找到其商業(yè)模式。
以醫(yī)療健康領(lǐng)域?yàn)槔?,醫(yī)療場(chǎng)景對(duì)問(wèn)題的容錯(cuò)率低,這就對(duì)大模型提出了更高的要求,即AI需要基于醫(yī)療專業(yè)語(yǔ)料給出更專業(yè)、更精準(zhǔn)的醫(yī)療建議;其次,目前醫(yī)療數(shù)據(jù)中有超過(guò)90%的數(shù)據(jù)來(lái)自于醫(yī)學(xué)影像,這也意味著一個(gè)切實(shí)有效的、能做復(fù)雜決策的醫(yī)療人工智能大模型,需要融合醫(yī)學(xué)影像、文本,甚至語(yǔ)音或是視頻等多模態(tài)信息以賦能各種醫(yī)療場(chǎng)景。最后,考慮到現(xiàn)階段醫(yī)院實(shí)際的部署環(huán)境和數(shù)據(jù)安全性要求,“大模型”不能無(wú)限“大”,需要讓數(shù)據(jù)飛輪和模型訓(xùn)練能夠很好結(jié)合,發(fā)揮效果更好、成本更低。
此外,《辦法》中還提到,采取有效措施提高訓(xùn)練數(shù)據(jù)質(zhì)量,增強(qiáng)訓(xùn)練數(shù)據(jù)的真實(shí)性、準(zhǔn)確性、客觀性、多樣性”,這體現(xiàn) “讓產(chǎn)業(yè)向高質(zhì)量方向發(fā)展”的政策導(dǎo)向。
智慧眼砭石大模型在此方面做了重點(diǎn)考量,一方面,采用知識(shí)圖譜與大模型相結(jié)合的技術(shù)路線,通過(guò)在訓(xùn)練過(guò)程中加入知識(shí)圖譜對(duì)訓(xùn)練過(guò)程進(jìn)行知識(shí)增強(qiáng),結(jié)合RLHF技術(shù),在500億參數(shù)條件下比單純使用大模型技術(shù),醫(yī)學(xué)問(wèn)題回答準(zhǔn)確度提升近10%。另一方面,隱私計(jì)算條件下的大模型聯(lián)邦訓(xùn)練,保證了數(shù)據(jù)的多樣化和高質(zhì)量,充分釋放數(shù)據(jù)要素價(jià)值,真正做到數(shù)據(jù)的“可用不可見(jiàn)”、“數(shù)據(jù)不出域”。此外,砭石醫(yī)療大模型能夠支持醫(yī)療領(lǐng)域多模態(tài)的輸入,包括醫(yī)療領(lǐng)域文本、圖像、視頻和音頻形式,可以有機(jī)整合不同的信息,相比單模態(tài)信息更加全面,讓AI充分施展拳腳,方便醫(yī)藥機(jī)構(gòu)使用。
當(dāng)前,在《辦法》的催化下,各家通用大模型、垂類(lèi)大模型廠商正加緊進(jìn)行自身戰(zhàn)略布局、提升產(chǎn)品的安全合規(guī)性,共同構(gòu)建安全可信的、自主可控的大模型生態(tài),智慧眼亦將堅(jiān)持科技向善,為醫(yī)療健康產(chǎn)業(yè)的可持續(xù)發(fā)展做出價(jià)值貢獻(xiàn)。