农村强奸一级网站|久草京热在线视频|色五月桃花综合激情|亚洲人妻精品主播|欧美无限码中文在线|国产午夜伦理三级|亚洲男女在线播放|欧美日韩成人香蕉视频|全球无码AV1区|中文字幕亚洲五月

Qiming News

對話 | 啟明創(chuàng)投周志峰對話它石智航陳亦倫、原力靈機唐文斌:關于具身智能的宏觀共識與微觀非共識

11/08/2025 | IPO早知道

由啟明創(chuàng)投主辦的2025世界人工智能大會(WAIC)“啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇——創(chuàng)業(yè)投資開啟AI技術與應用共振周期”于7月28日在上海世博中心藍廳成功舉辦。

在對話環(huán)節(jié)中,啟明創(chuàng)投主管合伙人周志峰擔任主持人,與它石智航創(chuàng)始人兼首席執(zhí)行官陳亦倫,以及原力靈機聯(lián)合創(chuàng)始人兼首席執(zhí)行官、曠視科技聯(lián)合創(chuàng)始人唐文斌圍繞“具身智能的奇點時刻”展開討論。


啟明創(chuàng)投主管合伙人周志峰(左),它石智航創(chuàng)始人兼首席執(zhí)行官陳亦倫(中)和原力靈機聯(lián)合創(chuàng)始人兼首席執(zhí)行官、曠視科技聯(lián)合創(chuàng)始人唐文斌(右)

陳亦倫表示:“具身智能是當下AI市場最火爆的子領域,具身技術正以指數(shù)級速度進步發(fā)展,我們已經(jīng)站在奇點到來的早期窗口?!?/strong>他指出目前具身智能技術有四大趨勢:機器人本體控制技術逐漸成熟、端到端技術正從自動駕駛領域擴展到機器人、數(shù)據(jù)不斷積累即將發(fā)揮Scaling Law、高自由度靈巧手方案已經(jīng)出現(xiàn)。同時他認為具身智能和自動駕駛在任務場景和底層技術上同宗同源,模型技術可以復用,工程能力可以遷移,自動駕駛行業(yè)的經(jīng)驗與認知也能幫助具身智能領域的探索與落地。最后在賽道選擇上,它石智航遵循高價值、有規(guī)模、有難度的“黃金三角”邏輯,會選擇用戶非常在意的真實需求、存在較大市場空間且上一代機器人技術難以解決的問題,最終實現(xiàn)通用機器人的AGI終極目標。

唐文斌圍繞具身智能領域的技術發(fā)展、創(chuàng)業(yè)邏輯及場景落地等話題分享了核心觀點,展現(xiàn)了對具身智能這一新興賽道的深刻洞察。他強調(diào)其創(chuàng)業(yè)的初心一直是機器人,從早前以物流機器人切入,到現(xiàn)在投身具身智能,最大的信心還是來自于對技術的深刻信仰,尤其是大模型、CoT和Agent能力的顯著進步。唐文斌認為機器人從專用走向通用有兩個必要條件,一個是對物理世界的精確感知能力,一個是對復雜任務的規(guī)劃和推理能力。唐文斌指出,最終機器人能不能用得起來其實核心看兩點,能用、好用是第一點,因為要真正能解決問題;第二點是它的經(jīng)濟模型得成立,這兩點大概率還是會從后端開始,再走向一些偏商用,最后走向民用的狀態(tài)。

以下系對話精選:

01/
具身智能技術發(fā)展得越來越快

周志峰:感謝亦倫和文斌來參加這個論壇。我還記得2015年啟明創(chuàng)投在投優(yōu)必選的時候,市場上沒有太多投資人關注人形機器人、工業(yè)機器臂以外的泛機器人行業(yè)。我記得有一個機器人創(chuàng)始人群,很長時間內(nèi)群里就幾十位極客。但從兩年前開始,我們統(tǒng)計中國出現(xiàn)了100多家做具身智能和通用人形機器人的企業(yè)。我們論壇討論的AI這么多細分領域中,從創(chuàng)業(yè)公司的數(shù)量來講,熱度沒有比具身智能領域更熱的,所以今天大家肯定很關注這個對話。

請先簡單介紹一下自己和公司。

陳亦倫:各位來賓好,我是陳亦倫,我是它石智航的創(chuàng)始人。在過去的十年我和團隊比較幸運的是能夠參與一些比較領先的自動駕駛核心技術的開發(fā),作為一個具身智能的子命題,我們經(jīng)歷了10年完整的過程,從最開始的實驗室原理樣機,到現(xiàn)在來說,我身邊很多朋友也能夠在日常生活中體驗到我們的產(chǎn)品,并且它每天在改善每個人的出行體驗。

在未來十年,我們希望能夠打造更加通用的機器人形態(tài),以及更加強大的物理世界的AI,能夠加速這些技術更快、規(guī)?;厝谌氲饺说纳a(chǎn)和生活之中,我們希望具身智能技術能夠成為未來十年產(chǎn)業(yè)升級的一個重要引擎,謝謝。

唐文斌:大家好,我是唐文斌,我創(chuàng)業(yè)的第一家公司是曠視科技,今天我代表的是原力靈機,原力靈機是一家比較新的公司,專注具身智能領域的研發(fā)和落地。

我們做機器人的時間已經(jīng)很長了,從曠視科技成立的第一天,我就想說先給機器人安上一雙眼睛,讓它能夠看到世界,但我們創(chuàng)業(yè)的初心其實一直是要做機器人。曠視科技最早從物流場景切入,第一次做了機器人的嘗試。像亦倫師兄一樣,我們今年看到了很多的技術變量,有可能能夠從專用的機器人走向通用的機器人,我們希望能夠真正用大模型、機器人的能力,為物理世界帶來終極AI的形態(tài),這是我們現(xiàn)在在努力做的事情。

周志峰:第一個問題,作為這個行業(yè)中的領軍人物,您二位看到具身智能、人形機器人、通用機器人在過去一年有哪些大的變化、大的進展?可以和大家分享一下,對這個領域的發(fā)展更有信心了嗎?

陳亦倫:我個人對這個領域一直非常有信心,我覺得大家可以在每年的WAIC上看到,過去這兩年整個具身智能或者機器人的技術前進的速度已經(jīng)超過了此前累積下來的前進速度,這還是非常能夠振奮人心的,作為從業(yè)者,我們自己預判之后它的發(fā)展速度會越來越快。

現(xiàn)在,在一年之前整個WAIC的各個機器人展都以靜態(tài)展示為主,現(xiàn)在在機器人的全身域控制上,locomotion和WBC上,這個領域我認為已經(jīng)接近于收斂的形態(tài)了。另外一個重要的AI,比如說端到端,我認為可能在一兩年前,學術界會有一個比較強烈的信心,但工業(yè)界的人還是有疑慮的,但至少現(xiàn)在,在機器人的移動領域,可能在它最大的場景自動駕駛領域上已經(jīng)充分產(chǎn)品化了,而且大家可以在日常生活中體驗它的能力。在操作領域,其實大家在實驗室級別的產(chǎn)品樣機上已經(jīng)看到巨大的飛升潛力。

第三個,我覺得非常重要的一件事情是多模態(tài)的大模型,它的整個基礎能力一直在顯著提升,而且不同于純語言模態(tài)的大模型,多模態(tài)包括視覺、語言形式,整個數(shù)據(jù)的Scaling Law還是沒有見頂,還是有巨大的提升空間,這幾個因素綜合下來,我覺得在具身智能AI領域,這幾年會處在一個越跑越快的時間。

同時硬件技術也在高速成熟,我們看到一些非常高自由度的終端形態(tài),比如靈巧手,一些接近于量產(chǎn)形態(tài)的方案已經(jīng)開始出現(xiàn),這些飛速發(fā)展都是比較振奮人心的。

唐文斌:我覺得本質(zhì)來講,最大的信心其實是來自于大模型上CoT和Agent的能力達到了一定的臨界值。我認為機器人真正走向通用有兩個必要條件:

第一個是對物理世界的精確感知能力,這其實也是曠視科技在過去很多年一直在做的事情,我們也看到不管是從小模型還是到大模型,其實整個多模態(tài)的感知能力是在不斷加強的,而且現(xiàn)在已經(jīng)可以做得非常好了;第二個是復雜的規(guī)劃和推理能力。

只有這兩件事情結合起來,機器人才能夠走向一個通用的狀態(tài),而我們今天看到Agent的發(fā)展、CoT的發(fā)展,其實都給我們帶來非常多的驚喜,所以我覺得這兩點結合起來,從技術判斷上,我們覺得這其實是在非??焖俚爻尚械姆较虬l(fā)展。

02/
宏觀逐漸形成共識
微觀仍顯多元化

周志峰:非常好,關于技術這塊剛才也提到很多,我想多聊兩句。

我記得2014年、2015年投資曠視科技的時候,啟明創(chuàng)投有自己的投資思考和邏輯。當時我們認為2012年ImageNet其實是深度學習的一個轉折點或者是一個技術的突破點,因為那之后基本上技術開始收斂,全行業(yè)最優(yōu)秀、最出色的人都向著一個大方向去奮斗,所以我們認為可以布局曠視科技這樣的深度學習技術驅動的企業(yè)。

我們在2022年投資智譜AI,后來投資階躍星辰,也是認為2020年的GPT-3是大模型技術的突破點,那之后技術相對收斂,大家都朝著共同的方向努力,肯定能夠看到很好的結果。

在投資它石智航和原力靈機的時候,我們內(nèi)部一直有很多爭論,具身智能的技術到底有沒有收斂?還是依然處于百花齊放?如果百花齊放的話,投資人的風險是很大的,今天投資的公司,有可能

隊很優(yōu)秀,但是三年后技術沒有收斂到這家公司所在的方向上,那是不是一個很大的風險?我們聊聊,到底具身智能技術有沒有收斂?以前大模型技術發(fā)展受限于數(shù)據(jù)、算力,現(xiàn)在具身智能這個領域,有沒有一些大的瓶頸阻礙技術更快速往前走?

唐文斌:我的判斷是技術并沒有收斂,因為今天不管是從算法的框架上,還是從數(shù)據(jù)的來源上,還是從硬件的形態(tài)和穩(wěn)定性上,以及最后場景落地的先后順序,每一個問題仍是開放問題。

目前大家普遍認為技術逐漸收斂,應該走端到端、純數(shù)據(jù)驅動這條路線,用類似于VLA的技術框架,這是逐漸形成的共識,并且我覺得大家對于未來的技術發(fā)展也有一些共識。

比方說多模態(tài),大家今天都會覺得光靠視覺引導很難走向智能,因為人在物理世界的時候,不僅是通過眼睛去感知物理世界,還通過觸覺,看不到的東西還會通過腦袋探一探,比如說能不能學習自動駕駛,如何能夠直接把有深度的信息用在VLA里面,這一系列的多模態(tài)數(shù)據(jù)如何灌入大模型?我覺得在逐漸形成共識。

但這個模型架構長什么樣子?其實現(xiàn)在并不知道。

我們現(xiàn)在其實還在探索的一些技術方向,包括今天的VLA大部分是單幀模型,如果用VLA去驅動機器人炒菜,讓它放三勺鹽,它其實放不了三勺鹽,因為它放完第一勺鹽以后很快就不記得有沒有放過鹽了,從視覺的角度來講,放過鹽和沒放過鹽的狀態(tài)是一樣的。由于這個模型現(xiàn)在并沒有memory(記憶)的機制,當然我們也可以在外部做一個規(guī)則引導的機制,但是如何讓模型具備原生的記憶機制?我認為也是一個非常重要的問題。

第三,我們內(nèi)部在研究的問題是,今天很多公司,比如從Figure開始,大家都在提大小腦模型,但我認為大小腦模型并不是一個終極的狀態(tài)。

大小腦模型其實是人為按照頻率把模型做了切分,因為大腦區(qū)在思考,小腦區(qū)做執(zhí)行,它輸出的頻率不一樣,所以我們?nèi)藶榍谐蓛蓚€模型。

但這樣的人為切分是一個好的方式嗎?它智能嗎?其實不智能,因為人操作的時候會想一想再做,做完之后這個狀態(tài)發(fā)生改變了,我再想一想。所以機器人怎么才能像人一樣形成一個動態(tài)的、柔性的思考和決策鏈?它其實可能還是基于一個模型,然后變成一種動態(tài)頻率和柔性頻率對模型的輸出,這可能又是一個開放性的問題。

那么回答剛才的問題,我認為今天的模型框架遠沒有收斂,有非常多的問題等待我們解決,但正是因為這些開放性的問題,我認為這件事情才讓我們對未來充滿激情和想象力。

周志峰:印奇(編者注:千里科技董事長)說,2011年創(chuàng)立曠視科技的時候是學生創(chuàng)業(yè),當時是大學生創(chuàng)業(yè)的熱潮,講得最多的一句話是“先跳下懸崖,然后在墜落過程中組裝飛機式的創(chuàng)業(yè)”。但今天的總結是,如果沒有先想清楚一個完整的技術和商業(yè)閉環(huán),這種創(chuàng)業(yè)可能是很難成功的。

這個問題比較挑戰(zhàn),您剛才說確實現(xiàn)在還有這么多的不確定性,技術也沒有完全收斂,那您今天選擇具身智能機器人創(chuàng)業(yè)會不會是跳下懸崖、組裝飛機的過程?

唐文斌:我認為這是一個“技術信仰、價值務實”辯證統(tǒng)一的問題。因為當我們做這個大模型也好,或者最早做深度學習的時候也好,如果沒有技術信仰,沒有任何一個技術可以在誕生的第一天就給你確定性,如果他已經(jīng)有一個非常明確的確定性,那這件事情也已經(jīng)結束了,沒有留給創(chuàng)業(yè)公司任何機會。

所以我認為正是這種不確定性和技術信仰才使得創(chuàng)業(yè)公司有機會。因此我認為在團隊內(nèi)部,大家真正信這件事情,對技術抱有真正的熱情和信仰,極其重要。

第二,這個過程中不只有信仰,要能夠沿著真正的登山之路,在中間找到營地獲得補給,有階段性的商業(yè)化,能夠形成成果。所以我覺得對于這個問題,我既同意也不同意,這是一個辯證統(tǒng)一的過程。

周志峰:請亦倫也聊聊這個話題。

陳亦倫:我基本贊成文斌的說法,但是可以從另外的角度詮釋一下,我的觀點是目前具身智能在宏觀的層面上,或者是長線的層面上,我認為大家是取得了高度的共識。但是在具體怎么做的層面上,每一家都會有自己的多元化思考,我可以分享一下為什么我覺得這件事情在宏觀層面上取得高度共識是非常重要的。

之前我走過十年的自動駕駛周期,在宏觀層面上很長時間都是高度的非共識,體現(xiàn)在例如機器人的模塊需要決策和規(guī)劃是否應該用AI?是否應該和感知分別處理?大家是否應該用地圖?這其實都是非共識,而且爭論了很久,這是宏觀層面上的。

現(xiàn)在對于具身智能,其實在宏觀長線上大家的認知是非常統(tǒng)一的,比如說我們都認為數(shù)據(jù)是非常重要的,我們都認為這個模型最終部署的形態(tài)大概率是端到端的形態(tài),是一個多模態(tài)的,可能視覺上還有其他的傳感器都有非常重要的作用,可能一個模仿學習是不夠的,還需要強化學習,甚至需要一些世界模型的加持,對于這些,大家有共同點。

但在具體實踐的角度,其實區(qū)別很大,比如數(shù)據(jù),有人認為可能需要部署很多臺機器人,有很多要操作的數(shù)據(jù),有的認為可能需要通過仿真生成很多數(shù)據(jù),有的認為真機數(shù)據(jù)更重要,應該要通過更好的方式“多快好省”地收集真機數(shù)據(jù)。再具體來說,比如剛才提到了VLA,我也非常同意,我認為VLA是三種模態(tài)的代表,它是代表感知V,語言L,到A的動作輸出,其實VLA是確定了這個網(wǎng)絡的任務輸入和輸出,所以網(wǎng)絡中間需要用什么樣的架構來設計,是不是需要一張網(wǎng)絡直接從頭穿到尾?還是中間有一些隱變量層?是否是模仿學習就足夠了?是否要采用強化學習?用什么樣的強化學習?是否需要世界模型的加持?這些是大家不斷探索的。

其實不僅是這些在算法層面上的,硬件層面上也是一樣的,是在一個宏觀共識、微觀非共識的層面操作。

比如現(xiàn)在通用機器人的形態(tài),基本上是兩類,一類是雙足,一類是輪式,代表大家在不一樣的應用領域上的局部趨勢,但即使對于雙足機器人來說,它有直驅關節(jié)的,也有用一些更加復雜的傳動機構,能夠實現(xiàn)電機和它的傳動機構更加均衡的設計,這些都會有。

但我覺得一個宏觀的共識,加上微觀的多元化,對于這個行業(yè)來說是比較健康的,意味著大家在一個基本確定的方向上可以迅速迭代,彼此界定自己的認知,這樣會讓行業(yè)走得比較快。

03/
過去的行業(yè)認知和經(jīng)驗積累能高度復用

周志峰:您以前主導了華為第一代完全從零開始的智能駕駛技術自研體系,也塑造了今天華為智能駕駛在全球的地位,您提到了認知,有什么認知是能夠在智能駕駛領域和今天的具身智能領域共享的?

陳亦倫:我覺得這是特別好的問題。首先自動駕駛技術和機器人技術一開始就是同宗同源的,事實上很長一段時間內(nèi),自動駕駛的主體技術主要來源于美國兩個機器人實驗室,斯坦福的Sebastian Thrun(《概率機器人》的作者)的實驗室,和卡耐基梅隆的Red Whittaker(探月機器人)的實驗室,這兩個實驗室通過DARPA挑戰(zhàn)賽,匯聚成了Waymo的主體方案,一直延續(xù)到了今天。2018年之后,自動駕駛技術開始大規(guī)模AI化,把傳統(tǒng)的機器人算法棧從逐個模塊的AI化,到分層端到端,到徹底的端到端AI化,使得自動駕駛成為具身智能首個大規(guī)模應用的商業(yè)系統(tǒng)。

我覺得在自動駕駛的從業(yè)經(jīng)驗,包括技術經(jīng)驗,對于在機器人領域的復用,我是從這三方面理解的:

第一個,技術的直接復用,因為機器人和汽車一樣,也是自動駕駛非常好的一個具身平臺,本身也需要移動能力,而且它的移動能力對整個機器人的應用至關重要??紤]到現(xiàn)在日常能夠見到的一些商用機器人系統(tǒng),里面的一些移動技術更多類似于家用掃地機器人的技術,我認為從這些技術直接升級到更現(xiàn)代的一些端到端的技術,對于它的應用價值、技術價值而言都是一件非常重要的事情。

第二個,一些認知層面上的幫助,自動駕駛這么多年的行業(yè)投入非常大,其實有一點是“交了學費”的,在自動駕駛所有AI一定要被定義在時間和空間里,而不是定義在二維的圖片里,這點其實非常重要。

在自動駕駛里有個有名的名詞是BEV,本質(zhì)上來說就是一個時空概念,定義在時空概念有很多好處,不管任意一個模態(tài)的輸入和輸出,都是在時間和空間這些非常本質(zhì)的物理量上對齊。

從這個角度來說,像我團隊更喜歡把具身智能叫做物理世界AI,剛才我們聽到的有些做醫(yī)藥的挖掘,可能是化學或者生物世界,但具身智能天生是在一個物理世界里存在的AI,處理的基本變量就是時間、空間、作用力,我們覺得具身智能能夠往前快速推進非常關鍵的一點可能是認知。

另外自動駕駛是作為第一個大規(guī)模應用落地的具身智能系統(tǒng),中間經(jīng)歷過海量數(shù)據(jù)的沖刷,所以對于每種方法的能力邊界,比如說模仿學習的能力邊界、強化學習的能力邊界,可能會有一些更清晰的認知。

第三個,工程能力的直接遷移,其實機器人的硬件系統(tǒng)和自動駕駛的很多硬件系統(tǒng)基本上是完全類似的設計,或者說一些基礎軟件系統(tǒng),比如從芯片、底層軟件到通訊中間件,基本上高度趨同。以及剛才文斌提到的快慢雙系統(tǒng),我個人非常同意文斌的觀點,快慢雙系統(tǒng)不是終局,但它是在現(xiàn)有芯片存在內(nèi)存墻的情況下的一個務實考慮。所以快慢雙系統(tǒng)的異步部署,包括對于AI企業(yè)最重要的兩件事情,一是數(shù)據(jù)的管道,另外是訓練的一些基礎設施,這些都是可以高度復用的。

周志峰:這個問題也請文斌回答一下,您在曠視科技搭建了物流機器人的大規(guī)模落地,當時的經(jīng)驗對比今天研發(fā)的新一代機器人,您覺得有什么是可以轉移過來的?

唐文斌:我們當年研發(fā)物流機器人的時候,坦白講更多還是在市場需求和技術可達性之間,尋求一個焦點。而物流行業(yè)是一個非常典型的場景,一方面能夠承載和驗證我們的技術,另一方面有足夠的規(guī)模和明確的需求。

剛剛講到曠視科技成立的時候我們就想做機器人,創(chuàng)業(yè)之初我們先從眼睛開始,希望未來能夠有手和腿真正去影響物理世界。我們其實也看了很多場景,發(fā)現(xiàn)物流的場景有幾個好處,在一定程度上被標準化了,例如集裝箱是物流史上最偉大的發(fā)明,因為它把很多東西封裝了,標準化了,而這個標準化使得自動化和機器人變得可行。

物流其實是機器人能夠發(fā)揮作用的極佳場景,它有非常大的市場需求,全球有幾千萬人在倉庫里干活,所以它的需求非常大,同時因為它的標準化使得技術具備可達性,所以我覺得這是物流場景第一個非常吸引人的點。

其次,我們做物流機器人的過程中其實也交了很多學費,或者說也學到了很多。一個是做機器人的時候,我們發(fā)現(xiàn)很多流程環(huán)節(jié)都是嵌入型的,在物理空間上其實是有前道工序和后道工序的,在這樣的流程環(huán)節(jié)里非常重要的一點是異常閉環(huán)。比如在數(shù)字世界里,一個虛擬Agent或者一款App,當你發(fā)現(xiàn)它遇到了一個異常,可以靠重啟App再來一次,但物理世界里是做不了這件事的,拿了一款貨品出來,機器人在運輸這款商品時,我們的程序出故障了,這時如何恢復狀態(tài)?它的異常不能通過程序員截獲來解決,所以我們必須要為整個流程去設計所有的異常閉環(huán)。當你遇到這個問題之后,如何能夠處理,使得生產(chǎn)環(huán)節(jié)一定能夠順暢、完整地進行下去,這件事情實際所付出的代價可能比我們想象中的要大得多,這是一個從POC到實際應用的巨大鴻溝,這是我們在物流機器人上學到的第一點。

大家今天看到很多機器人的構型,內(nèi)部其實也在做硬件的形態(tài)。我覺得在物流機器人上還學到一點——快不一定是“快”,穩(wěn)可能才是真的“快”。我們采購了很多機器人,但它們的MTBF(平均無故障工作時間)可能還沒達到在場景中真正長期穩(wěn)定運行的要求。

而在這種情況下的大規(guī)模部署,可能會導致運維災難,技術的不成熟靠服務去補,這樣的服務是非?!跋摹眻F隊的,大量的技術人員和算法工程師需要前往現(xiàn)場做一系列的運維,這件事情我們經(jīng)歷過一次。

最后回到機器人,落地到場景中,這些問題其實同樣需要認真對待,因此我也很感謝這一段物流機器人的相關經(jīng)歷。

04/
后端的制造業(yè)場景最有希望
率先實現(xiàn)規(guī)?;涞?/span>

周志峰:非常好。大家肯定很關心,WAIC這次集合了150臺機器人,看似很熱鬧,但其實大部分停留在舞臺展示的狀態(tài),從行業(yè)領軍者的角度看,第一批或者第一個落地的真實場景會是什么?

陳亦倫:其實我覺得很多機器人場景都是好場景,我分享一下它石智航挑選場景的方法論,基本上就是三句話:

1. 高價值。

2. 有規(guī)模。

3. 有難度。

我們認為這三個是自洽的。

周志峰:高價值、有規(guī)模、有難度。

陳亦倫:高價值,就是用戶有剛需,痛點明確,我們希望存在一個更大的產(chǎn)品空間,這樣我們才能聚合一些優(yōu)秀的人來做事。而有難度是基本邏輯閉環(huán)的事情,大概率高價值、有規(guī)模,如果上一代機器人還能解決問題,可能這一代機器人也沒有機會,我們重點也是在解決上一代機器人解決得不好的技術難題,站在應用空間的角度,現(xiàn)在機器人的從業(yè)者和使用方對于機器人的興趣已經(jīng)從炫技轉向對使用價值的深度思考,我認為這是一件非常好的事情。

能夠有規(guī)?;涞氐亩际呛妙I域,都能觸發(fā)市場的“奇點”。

周志峰:能具體給一個落地的領域嗎?可以透露嗎?

陳亦倫:從我的角度來說,第一個有剛需且明顯能夠落地的一定是制造業(yè),因為在該行業(yè)中已經(jīng)存在了大量機器人,而且它的痛點非常明確。

唐文斌:我們對場景的選擇也有一些思考,有幾個標準:

第一個是在技術發(fā)展的路線上梯度為正。今天到底要不要特別深入到一個垂直場景中?我們內(nèi)部認為不要,一定要走在技術發(fā)展的正確路線上,因為今天的技術上很多方面沒有收斂,如果太早固化技術的形態(tài),讓它固化到一個場景中去,某種程度上是犧牲了泛化性,這并不是我們想要做的事情,所以我們非常堅持用一個模型在技術發(fā)展的正向梯度上推進。

第二,我們同時考慮技術的可達性,就像印奇說的,在跳懸崖的過程中組裝飛機,有些飛機是組裝得出來,有些飛機其實不見得能在今天組裝出來,具身智能用端到端純數(shù)據(jù)驅動的方式,一步到100%是很難的,所以我們大概率會逐漸從90%到95%、100%,所以如何尋找一些容錯率相對較高、容忍操作時間的場景,我們認為是非常重要的。

第三,就像亦倫師兄說的,它得是規(guī)模大、需求強的場景。

具體而言,志峰演講的最后一個預測很對,我們也覺得會是更靠后端的場景,例如工業(yè)、物流場景,因為它更大規(guī)模、更密集、勞動力更多,所以它所產(chǎn)生的價值更大。最終機器人能不能用得起來其實核心看兩點,能用、好用是第一點,因為要真正能解決問題;第二點是它的經(jīng)濟模型得成立,這兩點大概率還是會從后端開始,再走向一些偏商用,最后走向民用的狀態(tài)。

周志峰:特別感謝,也期待兩位在具身智能領域大展宏圖!