榮格工業資源APP
了解工業圈,從榮格工業資源APP開始。
廣東深圳光明區一間實驗室內,擺滿了各類機器人、機械臂。數據采集師丁哲章頭戴VR(虛擬現實)設備,雙手操控手柄在空中指點。他眼前的虛擬畫面,正是機器人“眼中”的世界。

丁哲章(左一)在采集機器人疊衣服的數據。 受訪者供圖
在一個擺滿藥品的貨架前,丁哲章微微抬手,按下按鈕,身旁機器人的“手指”穩穩夾起一個藥盒,跟隨著丁哲章的手部運動軌跡,將藥盒放入收納箱中。這正是丁哲章團隊每天工作的主要內容:為具身智能機器人的“大腦”喂高質量的真實數據。
“如果把模型訓練視為‘做菜’,那么數據就是‘食材’。”丁哲章取下VR頭戴式顯示器,接著介紹,“我們要做的,就是從‘采摘’到‘清洗’的全流程,即數據的采集、標注和管理。”
目前,具身智能的訓練面臨一個難題:機器人尚未廣泛進入真實場景,缺乏自然產生的行為數據。
“它不像大語言模型,有海量的互聯網語料供學習;也不像自動駕駛,能從真實路況中積累數據。”丁哲章解釋,機器人的每一步動作,早期需要人為引導、主動采集,否則就會陷入“無米下鍋”的境地。
為此,丁哲章團隊研發了一套軟硬件結合的真機數據采集系統,包括通用機器人遙操作系統、具身數據平臺、人體數據采集系統等,打通機器人大模型訓練之前的所有流程,為具身智能機器人基礎場景數據提供解決方案。
實驗室里,有一片被稱作“機器人超市”的測試區。不同形態的機器人——人形的、輪式的、機械臂的,分布在貨架、桌面、床鋪等場景中。幾位同事或身穿動作捕捉服,模仿武術和舞蹈動作,或通過VR頭戴式顯示器操控機械臂疊衣、縫紉等。
“機器人數據采集有兩個關鍵任務:一是運動控制數據,用于訓練機器人的‘小腦’,實現走、跑、跳等基礎運動;二是真機操作數據,通過遙操作讓機器人學會抓取、擺放等任務,訓練它的‘大腦’。”丁哲章說。
說話間,抓藥的機器人完成了一組訓練。“在單一場景下,一個動作可能只需幾百條數據,但要讓它應對不同的環境變化,就需要采集更大規模的數據。”丁哲章指出,機器人不是記住某個固定坐標,而要從大量相似經驗中提煉“該怎么抓取”的泛化能力。
這一龐大需求,催生了一個新興職業:數據采集師。他們要做的,并非簡單的重復動作,而是需要理解機器人的運動邏輯,就像手把手教人寫字。
數據采集僅是第一步。實驗室旁,數據標注員正對著屏幕標記動作細節:“何時伸手”“抓住何物”“是否成功”……這便是“洗菜”環節,確保數據干凈清晰,才能高效“下鍋”。同時,自動化、半自動化的標注工具,還可進一步提升數據批量處理能力。
這一系列精密嚴謹的工序,構成了具身智能賴以訓練的基礎。丁哲章說,機器人企業拿到我們提供的“原材料”,便能夠“炒菜”并“端上桌”,投入到市場應用。
2023年5月創業至今,丁哲章已帶領團隊服務國內外上百家機器人企業、科研院所等,覆蓋60多種機器人形態。“我們正在幫助行業打破‘沒有數據就沒法用,沒法用就沒數據’的死循環。每一個任務的閉環,都在拓展機器人的能力邊界。”他說。
談及行業未來,丁哲章認為當前機器人在成長過程中,需要持續的數據喂養。隨著各地機器人數據采集場陸續建設,數據采集新業態加速成形。“我們做的,就是通過數據積累,推動行業迭代升級。”丁哲章說。

