人民網
人民網

數據採集師丁哲章幫機器人准備“食材”

讓具身智能“有米下鍋”(人物故事)

本報記者 呂紹剛
2026年03月25日08:22 | 來源:人民網-人民日報
訂閱已訂閱已收藏收藏小字號

《人民日報》(2026年03月25日 第 10 版)

丁哲章(左一)在採集機器人疊衣服的數據。受訪者供圖

  廣東深圳光明區一間實驗室內,擺滿了各類機器人、機械臂。數據採集師丁哲章頭戴VR(虛擬現實)設備,雙手操控手柄在空中指點。他眼前的虛擬畫面,正是機器人“眼中”的世界。

  在一個擺滿藥品的貨架前,丁哲章微微抬手,按下按鈕,身旁機器人的“手指”穩穩夾起一個藥盒,跟隨著丁哲章的手部運動軌跡,將藥盒放入收納箱中。這正是丁哲章團隊每天工作的主要內容:為具身智能機器人的“大腦”喂高質量的真實數據。

  “如果把模型訓練視為‘做菜’,那麼數據就是‘食材’。”丁哲章取下VR頭戴式顯示器,接著介紹,“我們要做的,就是從‘採摘’到‘清洗’的全流程,即數據的採集、標注和管理。”

  目前,具身智能的訓練面臨一個難題:機器人尚未廣泛進入真實場景,缺乏自然產生的行為數據。

  “它不像大語言模型,有海量的互聯網語料供學習﹔也不像自動駕駛,能從真實路況中積累數據。”丁哲章解釋,機器人的每一步動作,早期需要人為引導、主動採集,否則就會陷入“無米下鍋”的境地。

  為此,丁哲章團隊研發了一套軟硬件結合的真機數據採集系統,包括通用機器人遙操作系統、具身數據平台、人體數據採集系統等,打通機器人大模型訓練之前的所有流程,為具身智能機器人基礎場景數據提供解決方案。

  實驗室裡,有一片被稱作“機器人超市”的測試區。不同形態的機器人——人形的、輪式的、機械臂的,分布在貨架、桌面、床鋪等場景中。幾位同事或身穿動作捕捉服,模仿武術和舞蹈動作,或通過VR頭戴式顯示器操控機械臂疊衣、縫紉等。

  “機器人數據採集有兩個關鍵任務:一是運動控制數據,用於訓練機器人的‘小腦’,實現走、跑、跳等基礎運動﹔二是真機操作數據,通過遙操作讓機器人學會抓取、擺放等任務,訓練它的‘大腦’。”丁哲章說。

  說話間,抓藥的機器人完成了一組訓練。“在單一場景下,一個動作可能隻需幾百條數據,但要讓它應對不同的環境變化,就需要採集更大規模的數據。”丁哲章指出,機器人不是記住某個固定坐標,而要從大量相似經驗中提煉“該怎麼抓取”的泛化能力。

  這一龐大需求,催生了一個新興職業:數據採集師。他們要做的,並非簡單的重復動作,而是需要理解機器人的運動邏輯,就像手把手教人寫字。

  數據採集僅是第一步。實驗室旁,數據標注員正對著屏幕標記動作細節:“何時伸手”“抓住何物”“是否成功”……這便是“洗菜”環節,確保數據干淨清晰,才能高效“下鍋”。同時,自動化、半自動化的標注工具,還可進一步提升數據批量處理能力。

  這一系列精密嚴謹的工序,構成了具身智能賴以訓練的基礎。丁哲章說,機器人企業拿到我們提供的“原材料”,便能夠“炒菜”並“端上桌”,投入到市場應用。

  2023年5月創業至今,丁哲章已帶領團隊服務國內外上百家機器人企業、科研院所等,覆蓋60多種機器人形態。“我們正在幫助行業打破‘沒有數據就沒法用,沒法用就沒數據’的死循環。每一個任務的閉環,都在拓展機器人的能力邊界。”他說。

  談及行業未來,丁哲章認為當前機器人在成長過程中,需要持續的數據喂養。隨著各地機器人數據採集場陸續建設,數據採集新業態加速成形。“我們做的,就是通過數據積累,推動行業迭代升級。”丁哲章說。

(責編:劉森君、陳育柱)

分享讓更多人看到

返回頂部