11月22日,由粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院(International Digital Economy Academy,簡稱IDEA研究院)主辦的2024年IDEA大會在深圳成功舉行。
IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋在主題演講中指出,在技術(shù)大爆發(fā)時期開展創(chuàng)新,對技術(shù)的深度理解尤為重要。與此同時,他強調(diào),隨著AI的各項能力逼近甚至超越人類,AI治理已成亟待全球共同面對的議題。
IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋
“深圳是一座用迭代軟件的速度迭代硬件的城市?!鄙蛳蜓笳f道。
成長自“創(chuàng)都”深圳,過去一年,IDEA的大灣區(qū)生態(tài)開枝散葉,種下更多創(chuàng)新的種子。除福田實驗室外,IDEA與前海深港合作區(qū)共建IDEA前海創(chuàng)新院,與深圳龍崗區(qū)合作建設(shè)IDEA低空經(jīng)濟分院,與橫琴粵澳深度合作區(qū)共建IDEA—橫琴數(shù)字技術(shù)及人工智能測評中心。
本次大會,IDEA還公布一系列前沿研究與產(chǎn)業(yè)落地成果,帶來從技術(shù)突破到產(chǎn)業(yè)融合的AI盛宴。
從通用視覺感知到具身智能
沈向洋在演講中表示,計算機視覺技術(shù)在真實世界的應(yīng)用場景十分廣泛。然而,過去主流的小模型方案,難以應(yīng)對碎片化、多變的長尾需求,限制了技術(shù)落地規(guī)模。源自自然語言研究的Transformer架構(gòu)誕生后,視覺模型與之結(jié)合,走上一條“從小變大,從N變1”之路。
自2022年起,IDEA團隊從目標檢測出發(fā),打造精準度、通用性、泛化能力兼優(yōu)的DINO系列視覺大模型。本次大會發(fā)布了該系列最新的DINO-X通用視覺大模型,擁有真正的物體級別理解能力,實現(xiàn)開放世界(Open-world)目標檢測。無需用戶提示,直接檢測萬物。
與此同時,IDEA團隊還推出行業(yè)平臺架構(gòu),通過一個大模型基座,結(jié)合通用識別技術(shù),讓模型不需重新訓(xùn)練,就可邊用邊學(xué),支撐多種多樣的B端應(yīng)用需求。
視覺感知是機器與物理世界交互的基礎(chǔ)。全場景視覺感知能力的提升,自然為技術(shù)落地拓寬了空間。
而在具身智能領(lǐng)域,IDEA研究院此次便一連宣布三個合作:與騰訊合作,在深圳福田區(qū)、河套深港科技創(chuàng)新合作區(qū)落地建設(shè)福田實驗室,聚焦人居環(huán)境具身智能技術(shù);與美團合作,探索無人機視覺智能技術(shù);與比亞迪合作,拓展工業(yè)化機器人智能應(yīng)用。
從合成數(shù)據(jù)到大模型價值創(chuàng)造
合成大模型能力的涌現(xiàn),離不開互聯(lián)網(wǎng)時代的海量數(shù)據(jù)養(yǎng)料積累,沈向洋還在演講中表達了業(yè)界對合成數(shù)據(jù)的重視。
在這個方向上,IDEA團隊自研了語境圖譜技術(shù),解決過往文本數(shù)據(jù)合成方案的多樣性匱乏等問題。該技術(shù)為合成數(shù)據(jù)引入“指導(dǎo)手冊”,以圖譜為綱,指導(dǎo)用于合成的語境采樣。
結(jié)果顯示,IDEA團隊的方案能持續(xù)為大模型帶來能力提升,表現(xiàn)超過目前的最佳實踐(SOTA);從token消耗來看,平均節(jié)約成本85.7%。目前,該技術(shù)內(nèi)測平臺已開放,通過API提供服務(wù)。
在拓展新前沿的同時,大模型價值創(chuàng)造也在進行時。大會上,IDEA秀出多個垂類行業(yè)應(yīng)用落地進展,包括:學(xué)術(shù)大模型和AI科研神器ReadPaper、營銷創(chuàng)作大模型,以及面向經(jīng)濟與金融領(lǐng)域的經(jīng)濟大模型、運籌決策大模型、投資大模型。
從AI for Science到AI for Coding
在基礎(chǔ)研究愈發(fā)受到重視的當下,AI for Science是技術(shù)創(chuàng)新創(chuàng)業(yè)的重要方向。今年的諾貝爾獎,更是將這場科學(xué)革命推向聚光燈下。
IDEA團隊從化學(xué)領(lǐng)域的預(yù)測能力和數(shù)據(jù)能力入手,進行了研究和產(chǎn)業(yè)化實踐。
在預(yù)測方面,IDEA研發(fā)的多個化學(xué)領(lǐng)域?qū)<掖竽P?,分子屬性預(yù)測和化學(xué)反應(yīng)預(yù)測能力均處業(yè)界領(lǐng)先水平;在數(shù)據(jù)方面,IDEA開發(fā)了化學(xué)文獻多模態(tài)大模型,聯(lián)合晶泰科技發(fā)布專利數(shù)據(jù)挖掘平臺PatSight,將藥物領(lǐng)域的專利化合物數(shù)據(jù)挖掘時間,從數(shù)周縮短至1小時。
除了科學(xué)研究之外,另一個技術(shù)范式正在被AI重塑的領(lǐng)域,是編程語言。
此次大會上,IDEA研究院的MoonBit團隊展示了其開發(fā)平臺強大的AI for coding體驗。
MoonBit是專為云計算與邊緣計算設(shè)計的AI云原生編程語言及工具鏈,已具備完備的多后端支持和跨平臺能力,可在硬件上直接運行,支持RISC-V。MoonBit的開源開發(fā)平臺,將于12月正式開放。
低空經(jīng)濟:安全與開放
除了AI外,低空經(jīng)濟成為今年最為引人注目的行業(yè)。
IDEA研究院連續(xù)第三年發(fā)布低空經(jīng)濟白皮書,今年的關(guān)鍵詞是安全。沈向洋指出,在低空經(jīng)濟的發(fā)展中,安全是重中之重。唯有實現(xiàn)了安全,才能實現(xiàn)大規(guī)模飛行,而安全,又與效率、成本等要素緊密相聯(lián)。針對此,《低空經(jīng)濟白皮書3.0》推出了低空安全體系。
另一個關(guān)鍵詞,則為開放。IDEA推出低空管理與服務(wù)操作系統(tǒng)OpenSILAS 1.0 Alpha版,還攜手17家產(chǎn)業(yè)伙伴發(fā)起OpenSILAS創(chuàng)新聯(lián)合體,旨在打造開放共享、技術(shù)領(lǐng)先的系統(tǒng)和平臺,建立有實際系統(tǒng)支撐的標準體系。
校對:劉榕枝