榮格工業資源APP
了解工業圈,從榮格工業資源APP開始。
當醫療AI的數字空間即將被大語言模型窮盡,另一種更為大膽的設想正在逼近現實。
今年以來,多款帶有“具身智能”稱號的醫療級產品扎堆發布,涵蓋了手術、康復、檢驗檢查、院內物流等多個線下真實場景。
這些產品的共同特點是,兼具能夠自主決策的“大腦”和執行指令的物理本體。通俗點說,他們更像是在大模型技術框架下完成升級的醫療機器人。
“過去我們做機器人控制的時候,要算動力學方程、運動學方程,要做電機控制。但有了大模型以后,我們就可以把電機軌跡,轉化成token,形成輸出指令。”
一位醫療機器人公司的創始人告訴《健聞咨詢》,具身智能的方法論已經成熟,難點在于數據,數據體量不夠,就無法完成訓練。
在制造和物流等行業,已經出現了類似的具身智能樣板:人形機器人開始執行搬運作業,倉儲機器人具備初步的環境理解能力……但在醫療領域,由于風險、精準度、倫理等一系列客觀限制,具身智能產品落地的形態和速度要遠遠落后于其它行業。
有趣的是,在產品鏈條的兩端,代表技術前沿的科研人員和導向產品落地的投資人站成了涇渭分明的兩派。
前者堅信,一旦搭建出新的模型底座,再輔以相應的數據語料,就能泛化出策略和動作,從而創造出不同醫療場景下的具身智能產品;后者則認為,具身智能當前的技術能力還無法支撐嚴肅醫療場景中的大多數任務,且面臨倫理挑戰,商業價值存疑。
我們已經無數次見證這樣的對立——當某種新技術浪潮的確定性,撞上醫療的保守和偏執,這次的故事會有不一樣的答案嗎?
落地場景受限
智源研究院院長王仲遠在此前的媒體采訪中曾舉過一個例子,一個兩歲小女孩不會撕糖果包裝紙,但是通過模仿手機視頻里演示的拆糖果過程并不斷嘗試,最后她找到了包裝紙的鋸齒部分,成功將其撕開。
這就是具身智能的完整形態——視覺識別、動作預測、目標判斷、嘗試、失敗、調整、再嘗試。
如若按上述案例來定義具身智能,則它至少包含兩層含義。一是其物理實體能夠借助本體(系統)在真實世界中自主完成任務;二是本體的邊緣計算能力必須足夠強大,能夠實時反饋至物理實體,不完全依賴云端。
目前,在整個醫療行業,最接近具身智能概念的產品主要集中于兩條細分賽道——手術機器人與康復機器人。它們雖同屬于“醫療機器人”范疇,但對空間感知和執行的能力要求截然不同。
從康復機器人來看,由于康復需要面向不同患者、不同康復階段,場景多變,指令千差萬別,因此機器人不僅要理解動作意圖,還需根據實時反饋調整自身操作策略,這使得康復場景成為測試具身智能泛化能力和動態適應性的關鍵戰場。
“現在康復機器人的運動能力沒有問題,主要是卡在智力上。”國內某康復機器人公司的業務負責人告訴《健聞咨詢》,大模型技術主要解決的是機器人視覺和語言模塊的交互能力,但對于運動控制還沒有太好的解法。
“比如你跟他說,幫我去拿一杯水,他能聽懂你的意思,也能感知到水杯在哪里,但怎么把這個動作完成,還需要再做嘗試。”
目前,康復領域具身智能的成熟應用主要集中在步態控制等較為受限的場景。比如康道醫療自主研發的機器人產品,可以根據患者的實時步態,自動調節助力強度,有效抑制異常步態形成,提升神經損傷患者的行走康復效率。
而在手術機器人領域,對于具身智能的爭議則更為多元。
上海現代服務業聯合會大數據中心主任徐云程告訴《健聞咨詢》,從她近期調研的情況來看,目前手術機器人的智能化程度已經開始接近“自動駕駛L3”級別,即在既定的手術方案下,機器人能夠高精度地執行整臺手術,醫生只需要在旁邊監督,發生意外情況時接管即可。
在她看來,相比于康復等場景,手術場景更為標準化,“器械一旦進入人體組織,通過視覺或力反饋感知后,它所發出的動作指令,在空間上是比較細微的,且不需要太多的柔性處理。當然,它對動作精準性的要求也會更高。”
中國康復技術轉化及發展促進會秘書長楊涵對手術具身智能的看法要更為保守。在他看來,如果把具身智能定義為源于智能體與其所處環境之間持續的、動態的物理互動,目前手術具身智能目前還有很長的路要走,當前市面上的主流手術機器人大多還是手術輔助為主,缺乏自主的意識和動手能力,甚至還不能算作是具身智能。
“手術過程中需應對組織形變、出血等諸多動態變量,需要極高的實時認知和決策能力,目前AI算法和學習能力還有很多局限性。反而是在非侵入的康復機器人領域,力反饋技術和交互體驗或許能夠在短期內取得比較大的進步,容錯率也比較高。”
但無論是在哪一個醫療細分領域,楊涵都認為,要到2030年左右,才可能出現類比自動駕駛L4級別的具身智能產品。
世界模型未解
和傳統機器人相比,具身智能的優越性不僅在于機器人操作上的升級,更重要的是整體功能和認知能力的飛躍。
傳統醫療機器人多依賴預設程序執行固定動作,適應性較差;而具身智能則需要融合視覺、觸覺和力覺等多模態信息,自主判斷、調整動作策略。
在手術中,這意味著機器人可以精準執行復雜路徑,完成微創操作中的力控要求,并根據突發情況即時調整操作;在康復訓練中,能夠根據患者反饋調整訓練力度、幅度和節奏,實現個性化、動態化干預。
因此,無論是手術機器人還是康復機器人,都繞不開一個核心概念:世界模型。
最近,全球人工智能領域最具影響力的研究者之一、美國國家工程院院士李飛飛在其發布的長文《從語言到世界:空間智能是AI的下一個前沿》中提到,人類認知的核心不僅僅是語言,而是對三維空間的理解和操作能力,從停車到接鑰匙,從設計建筑到發現DNA的雙螺旋結構,都依賴于空間智能。
她把大語言模型比作“黑暗中的文字匠人”,只能教會機器讀寫,而基于空間智能創造的世界模型,則會教會機器觀察和建造。
國內專注于具身智能研究的智源研究院也給出了類似的技術路徑判斷——從語言到多模態,再到具身智能,最終到世界模型。
盡管世界模型為具身智能的持續進化提供了理論上的可能,但它在醫療行業卻面臨更多挑戰。
一方面,醫療環境更加復雜。光是人體解剖結構,就遠比工業零件復雜得多,更遑論動作的隨機性、器官的可變性、病灶的差異性等問題。在醫療領域,世界模型必須理解的是一個高度動態且沒有標準件的世界。
另一方面,醫療的安全邊界比所有行業都窄,容錯率更低,這也就意味著過去那套靠“大量數據喂養,再通過人工標注來反復校正,最終做出產品”的路徑,在醫療具身智能的范疇上很難復用。
商業價值存疑
如果說技術路徑是醫療具身智能的“縱軸”,那資本態度就是決定其發展速度的“橫軸”。
投資人對醫療具身智能的判斷是,醫療場景對安全要求極高,監管周期也較長,商業化驗證將面臨很大難度——這意味著醫療具身智能的投資周期或許將遠超主流基金年限。
多位從事醫療AI的投資人均向《健聞咨詢》表示,不太關注醫療具身智能的項目,更別提具體的投資意向,“這條賽道還在很早期的階段,技術突破和商業模式都有很大的不確定性。”
“在醫療垂直方向的投資里,我們很少會談到‘具身智能’這個概念,也很少有人會用這個概念來定義自己的產品或者賽道。”遠毅資本投資人唐軼男直言,具身智能當前的技術能力還無法支撐醫療場景中的任務。
她進一步指出,目前業內最先進的手術機器人均為 “主從式”,即醫生是操作主體,機器人是工具,并不屬于具身智能的范疇。即便是最接近自動化的 “骨科機器人”,本質也是“導航+精準定位”,手術規劃與關鍵決策仍需要由醫生完成。
投資人們并非單純看衰技術,也會考慮回報周期。在自動駕駛行業,智能程度可以從L2逐漸過渡向L4,但醫療里卻沒有“過渡級別”,每個階段都必須足夠安全。
“通用領域對于具身智能犯錯的容忍度相對較高,但在醫療中,任何微小錯誤都可能導致嚴重事故,涉及巨大的法律和倫理責任。”
一位專注于數字醫療賽道的資深投資人表示,具身智能的 “自主學習”與醫療法規之間存在根本沖突,按照法規要求,所有用于臨床的醫療產品必須是“固定且經過充分驗證的”,但一個會自我演變的AI系統并不具備這一條件。
更重要的是,從投資方的角度來看,醫療具身智能的商業價值還存在不確定性。
“在學術領域,已經出現了一些對手術機器人自動化的探索,例如對自動縫合的研究,從研究的角度看起來很‘酷炫’,但我們從投資的角度來判斷,這些研究未必有商業化落地的價值。”
唐軼男認為,醫療創新不能陷入“拿著錘子找釘子”的陷阱,即不必刻意追求所謂的“具身智能標準形態”,而是要圍繞臨床真實需求,用硬件、算法和感知技術解決問題。
一個更符合未來的猜想是,醫療具身智能的真正突破,或許不會來自某個“跨時代的產品”,而是來自一個個細分場景被逐個驗證、逐步累積。
當助理式機器人能夠在康復場景穩定運行,當自動采血成為普遍可用的基礎能力,當手術機器人在“人機協同”的框架里完成更多可量化的提升,這些不起眼的進展會共同構成未來的行業基石。
具身智能為醫療行業描繪了超越傳統自動化的未來,然而,這條通往智能之路布滿荊棘,醫療領域極高的可靠性與安全性要求,構成了其商業化和大規模落地的最大挑戰,這條通往成功的道路注定坎坷而漫長。

