人工智能已成為當下最火熱的賽道,被認為是引爆下一代科技革命的戰略新興技術,企業、資本紛紛入局,希望盡早在這個未來具備萬億規模的市場中搶得先機。
盡管參與者眾多,但AI技術的競爭卻沒有變得更百花齊放,反而是千軍萬馬擠過“AI內容生成”的獨木橋。不過在今年的華為開發者大會2024(HDC?? 2024)上,一項新技術的誕生和發布,為AI產業吹進了一縷創新清風,刷新了傳統視野,拓寬了技術探索的邊界,這項技術是一種空間智能技術,它在學習人腦的機制行為,讓機器擁有視覺和聽覺能力,并為應用場景做出機器決策和行動。
6月22日,天圖萬境與華為云在HDC?? 2024大會現場聯合發布了AI“視頻聲效大模型”解決方案,它底層基于天圖萬境自主研發的AI感知視聽技術,為人工智能領域帶來了顛覆性革命。此次發布標志著AI技術在“空間智能”領域取得的重大突破,也預示著千行百業將因此而發生新質生產力的變革。
“視頻聲效大模型”解決方案沒有沿用傳統的AI文生圖、文生視頻路線,而是希望AI可以按照人類進化的方式,用眼睛耳朵和大腦來做出判斷思考和行動,讓??AI在數字世界中具有了感知能力和理解能力,就像5億4000年前,生命體進化出“視覺”、“聽覺”一樣,新的 AI??技術讓計算機具有了視覺、聽覺、理解能力,并通過機器“思考“做出行動和決策。
這項技術的誕生,將對行業帶來顛覆性的改變。對于人類來說,我們是通過看、聽,識別物體屬性,感知空間變化,比如認識一只貓,或者看到一輛賽車呼嘯而過的畫面就可以聯想到賽車引擎高低變化的轟鳴聲,就可以感知車離我們的運動關系。但是對于計算機來說,它只會判斷畫面中的像素點或者音頻的波形數值,內容世界的信息對于AI來說沒有“經驗聯想“意義,計算機業不能識別和理解。
天圖萬境的AI感知視聽技術,正在幫助AI??可以像人類一樣,先通過聽覺和視覺來認識世界,再通過大腦積累的經驗記憶來進行預測和自我修正,將每個專用 AI??模型看作是人類的神經元,通過多個AI“神經元“的相互配合,使用大規模的數據訓練后,就可以讓計算機理解這個世界,例如通過AI圖像分割“學會”認識物體,并判斷出它是一只貓,或者是一輛賽車。每個專業的?? AI”神經元“具有其專業領域的豐富知識,它可以理解這個復雜的世界和推理未曾見過的信息,而這樣的組合,正在減少對硬件算力的依賴,來學習人腦袋的功耗比,人腦僅以??45??瓦的峰值消耗,就可以處理極其復雜的事情,這樣這的“聯級神經元”框架設計,正在讓計算機深度領悟人們生活的三維世界,在數字世界中存在的物理規律。
當計算機有了視覺、聽覺,就可以擁有理解力,進化出真正的智慧,推動所有聚生智能,賦能需要機器決策和行動的千行百業,邁向新的“空間智能”時代。在今年的HDC?? 2024大會上,天圖萬境創始人圖拉古在“盤古多模態大模型”專場論壇上,做了《視頻聲效大模型催生空間智能》的主題演講,闡述了空間智能未來的發展方向。
必一運動
他表示,“我和我的團隊一直致力于創造更加理想的空間智能。我們要讓?? AI擁有類人的記憶推理能力,讓它理解行為意圖、物質屬性、運動規律、和空間關系。我們希望機器能夠為人做事,或者幫人做事,知道哪些是人類需要的,并理解不同場景下人類的差異化需求,通過“聯級神經元”和多樣數據的訓練,讓機器學會自我認知和決策,可以在數字世界中,像人類一樣識別多樣的世界環境,理解場景的復雜性。”
此次天圖萬境與華為云攜手推出的“視頻聲效大模型”解決方案,能夠以智慧的方式生成聲音。比如通過判斷畫面中火車的由遠及近的空間變化,生成從小到大的音量。通過識別畫面中海鷗群集的數量,匹配出真實的等量動態聲音。這也是全球首個能夠智慧理解真實世界的AI大模型,為計算機走向“空間智能”奠定了堅實的技術基礎,更重要的是,這樣的空間智能模型擺脫了“AI??提示詞”的輸入,圖拉古表示“很多時候,人類看到某種行為或圖像就可以自然產生想法,而我們希望機器也具有這樣的能力,自我決策和行動”。
讓機器擁有視覺、聽覺的感知能力,可以讓礦山里的無人探測車分辨巖石,或實時監測礦井環境,提高安全性;在消防檢測中,AI可以快速識別火源位置,預測火勢蔓延路徑,極大提升應急響應能力;可以讓普通攝像頭不借助任何深度傳感器,秒變可以能夠拍攝三維立體畫面的“立體眼”,獲得穩定清晰的深空間深度,輸出立體的空間視頻,而人類正是在以這樣的方式理解世界…
當AI擁有類人的感知世界能力后,它將演化出更強的認知能力、識別能力、記憶能力,誕生真正的智慧,幫助人們創造更加美好的生活。
天圖萬境與華為云共同看好AI感知視聽技術擁有的巨大應用前景和市場空間,雙方在HDC 2024上簽署戰略合作協議,攜手促進“視頻聲效大模型”解決方案的研發和推廣,促進雙方在人工智能與云計算領域的深度融合。
天圖萬境在華為開發者大會2024上展示的AI感知視聽技術,以及“視頻聲效大模型”解決方案,不僅驚艷了會場聽眾,更為行業引入了全新的技術思維和創新藍圖。未來,天圖萬境還將在AI感知視聽技術方面持續發力,走得更遠更快,為全球AI的智能化探索出不一樣的創新路徑。
學會大咖談|中國機械工程學會陸大明:培育新質生產力 助力制造業智能升級
數字技術賦能鐵路遺產保護傳承:數喆數據亮相第四屆鐵路遺產國際學術研討會
《2023-2024年中國人工智能市場研究年度報告》重磅發布,智慧互通(AICT)位列計算機視覺領域“五強”
共創數智世界,新華三集團Digital Tour 2024大會圓滿落幕
中國移動算網安全案例成功入選世界智能產業博覽會“Find智能科技創新應用優秀案例”
跳出青春活力,彰顯出行時尚——愛瑪x劉畊宏直播間奉獻夏日專場,開啟“718愛瑪直購節”