由啟明創(chuàng)投主辦的2025世界人工智能大會(WAIC)“啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇——創(chuàng)業(yè)投資開啟AI技術(shù)與應(yīng)用共振周期”于7月28日在上海世博中心藍(lán)廳成功舉辦。
在本次論壇上,與愛為舞創(chuàng)始人兼首席執(zhí)行官張懷亭以《關(guān)于AI應(yīng)用創(chuàng)業(yè)的思考與實踐》為題發(fā)表了演講。
與愛為舞創(chuàng)始人兼首席執(zhí)行官張懷亭
張懷亭在演講中表示,AI應(yīng)用的創(chuàng)業(yè)機會在于利用生成式AI技術(shù),將服務(wù)業(yè)做成制造業(yè),打破大規(guī)模(個性化)-高品質(zhì)-低成本的不可能三角。之所以目前還沒看到AI應(yīng)用的爆發(fā)式商業(yè)化落地,核心原因是大模型的幻覺、推理的不準(zhǔn)確和結(jié)果的不確定。這就要求從事AI應(yīng)用的團(tuán)隊既要懂業(yè)務(wù)還要懂AI技術(shù),平衡模型的不確定性和業(yè)務(wù)的容錯度,先跑通業(yè)務(wù)閉環(huán),用業(yè)務(wù)牽引AI能力逐步落地,同時找到適合自身業(yè)務(wù)場景的數(shù)據(jù)飛輪。在智能時代,跨界的人才密度和務(wù)實創(chuàng)新的企業(yè)文化是組織建設(shè)的關(guān)鍵,人機協(xié)同的工作范式是企業(yè)運營的基礎(chǔ)。
以下系張懷亭的演講內(nèi)容。
感謝啟明創(chuàng)投給我們這樣一家成立才兩年多的初創(chuàng)企業(yè)機會,在這里向大家匯報一下,我們在AI應(yīng)用領(lǐng)域這兩年來創(chuàng)業(yè)的實踐、總結(jié)和認(rèn)知。
十幾年前,我和當(dāng)時的團(tuán)隊在互聯(lián)網(wǎng)大廠,第一次用深度機器學(xué)習(xí)算法,開發(fā)了大概率是全中國第一個大規(guī)模廣告推薦系統(tǒng)。這個系統(tǒng)取得了不錯的效果,幫助我們建立了對AI的初步認(rèn)知。之后,我和一群志同道合的伙伴在教育領(lǐng)域進(jìn)行了第一次創(chuàng)業(yè),并有幸在紐交所上市,對教育行業(yè)也有了一定的認(rèn)知。當(dāng)生成式AI出現(xiàn)時,我們發(fā)現(xiàn)它可以給“科技向善”和教育普惠更大的空間。于是在2023年,我和我的伙伴們開啟了第二次創(chuàng)業(yè)。
我們認(rèn)為教育最重要的是有好老師,做到有教無類。也就是說,無論是男生還是女生,在城市還是鄉(xiāng)村,貧窮還是富有,孩子還是成人,每個人都能擁有一位很好的終身陪伴的AI老師,根據(jù)個體的興趣、階段、效率、潛力、狀態(tài)、性格等,進(jìn)行個性化的傳道、授業(yè)和解惑。當(dāng)然,實際上今天的教育資源依然非常稀缺,教育成本也比較高昂。當(dāng)生成式AI技術(shù)出現(xiàn)時,基于對科技和教育的認(rèn)知,我們判斷服務(wù)個體的教育資源在邊際成本上一定會越來越低,理論上應(yīng)該接近于實時的推理成本,大概率能在現(xiàn)有成本基礎(chǔ)上削減90%。隨著技術(shù)的發(fā)展,成本下降幅度也會越來越大。同時我們認(rèn)為,這樣的AI老師應(yīng)該具備隨時隨地的特性,不管你在哪里,只要想用就能用。而且它的知識儲備將隨著智能系統(tǒng)的增強而增強,有可能在所有領(lǐng)域為每個人提供最適配的個性化指導(dǎo)。
今天我并不想過多介紹產(chǎn)品或算法,這幾天在這里有很多相關(guān)展示,相信大家都已看到。因此想換一個視角,由于我們是連續(xù)創(chuàng)業(yè)團(tuán)隊,希望從創(chuàng)業(yè)的角度和大家做一些淺顯的分享。
我們認(rèn)為在AI應(yīng)用領(lǐng)域較大的創(chuàng)業(yè)機會是把服務(wù)業(yè)做成制造業(yè)。大量現(xiàn)有的服務(wù)業(yè)是人力密集型行業(yè),這些行業(yè)經(jīng)常會遇到“不可能三角”:既希望用低成本提供高質(zhì)量服務(wù),又需要大規(guī)模覆蓋,這基本上是個悖論。以醫(yī)生為例,生活中我們經(jīng)常有這樣的經(jīng)歷:到醫(yī)院可能要排兩小時隊,最后只和醫(yī)生聊十來分鐘;或者醫(yī)生開了檢查單,又要排隊做檢測,有時能排上,有時排不上,可能還得約下一次。這充分說明對大多數(shù)人而言,獲得高質(zhì)量服務(wù)很難,同時成本也很高。生成式AI讓我們看到了機會,能夠規(guī)?;靥峁﹤€性化服務(wù),實現(xiàn)質(zhì)與量的兼顧。在虛擬的數(shù)字世界里,我們常聽到“千人千面”這個詞,“千人”代表規(guī)模,“千面”代表個性。類似推薦系統(tǒng),像內(nèi)容分發(fā)這類應(yīng)用,已經(jīng)解決了規(guī)模化和個性化的并存問題,但在服務(wù)行業(yè)還未實現(xiàn),主要受限于推薦系統(tǒng)本身的能力邊界。
用生成式AI改造人力密集型行業(yè),首先用算力成本替代人力成本是更合適的。從趨勢看,算力成本會越來越低,而人力成本會越來越高。其次,人力密集型企業(yè)的人才選拔、使用和培養(yǎng)極其復(fù)雜,加上優(yōu)秀人才流失,管理成本非常高,幾乎不可能完全標(biāo)準(zhǔn)化。但如果采用生成式AI技術(shù),標(biāo)準(zhǔn)化服務(wù)是可以實現(xiàn)的。一旦用生成式AI技術(shù)把服務(wù)業(yè)做成制造業(yè),未來我們每個人身邊都可能擁有專屬的AI老師、AI律師和AI家庭醫(yī)生。
對于AI應(yīng)用,似乎尚未看到大規(guī)模落地與爆發(fā),這是為什么呢?作為對比,我們來回顧十多年前移動應(yīng)用爆發(fā)的前提。首先,當(dāng)時的5G網(wǎng)絡(luò)基本成形,智能手機也已普及,基礎(chǔ)硬件建設(shè)層面已然成熟。手機具備定位、相機和支付功能,為移動應(yīng)用提供了基礎(chǔ)保障。例如高德地圖、滴滴打車和美團(tuán)外賣都依賴手機的定位能力;快手、小紅書基于相機功能記錄生活,無論是視頻還是圖文;像高途這樣的在線教育公司則依賴音視頻直播互動,幫助用戶隨時隨地學(xué)習(xí)。同時,支付功能的普及使應(yīng)用商業(yè)化成為可能,否則大量商機將被錯過。正是有了這樣的基礎(chǔ)設(shè)施,移動互聯(lián)網(wǎng)的應(yīng)用公司只需要考慮應(yīng)用本身,而不需要考慮更底層的體系構(gòu)建。
而今天,我們會發(fā)現(xiàn)模型存在很多幻覺,推理能力依然不夠準(zhǔn)確,相同上下文場景下的輸出結(jié)果也不穩(wěn)定。同時,多模態(tài)能力如數(shù)字人的實時交互、大幅遮擋下的面部穩(wěn)定性、實時生成的表情神態(tài)、語音語調(diào)以及互動延遲等方面都還比較弱。此外,很多企業(yè)至今尚未遇到這樣的情況:在同一時間面臨數(shù)百、數(shù)千甚至數(shù)萬的推理并發(fā),這需要優(yōu)化大量底層架構(gòu)能力,對如今的創(chuàng)業(yè)團(tuán)隊要求較高。一方面需要判斷AI發(fā)展趨勢和迭代速度——實際上從去年到今年,發(fā)展速度已超越當(dāng)年的摩爾定律;另一方面要明確當(dāng)前模型的能力邊界,比如文生圖,也許這個圖片可以直接用,但文生視頻用于短劇制作還達(dá)不到要求。應(yīng)用過程中還需平衡模型不確定性與業(yè)務(wù)容錯度,這一點很關(guān)鍵。比如推薦系統(tǒng)做內(nèi)容分發(fā),用戶不喜歡的短視頻劃走即可;廣告推薦系統(tǒng)推送了用戶不感興趣的廣告,略過就行。但如果AI醫(yī)生要做手術(shù),能否允許它犯錯?因此模型輸出的不確定性與業(yè)務(wù)容錯度直接相關(guān),如何平衡何時使用模型能力、何時依賴系統(tǒng)能力,就是一個“真問題”。
對于AI應(yīng)用創(chuàng)業(yè)的路徑,我們的理解是:先建立業(yè)務(wù)閉環(huán),驗證應(yīng)用場景的有效性;然后用模型逐步輔助或替換閉環(huán)中的某些環(huán)節(jié),最終實現(xiàn)業(yè)務(wù)的AI化變革。這或許是一條比較務(wù)實的漸進(jìn)路徑。在此過程中,核心問題是整個閉環(huán)數(shù)據(jù)能否上到云端?是否有系統(tǒng)可以采集所有交互數(shù)據(jù)和靜態(tài)特征,形成高質(zhì)量的特征集合?之后用這些有效數(shù)據(jù)訓(xùn)練模型,完成AI應(yīng)用的最終變革。這一思路得益于對互聯(lián)網(wǎng)創(chuàng)業(yè)史的總結(jié)——許多顛覆性技術(shù)的應(yīng)用源于成熟業(yè)務(wù)的倒逼。例如阿里云和亞馬遜云,都是因為自身電商產(chǎn)品有集中爆發(fā)式的使用壓力,才推出了云服務(wù),云服務(wù)為內(nèi)部提供支撐,能力溢出后再為更多的外部機構(gòu)提供服務(wù)。
對于AI應(yīng)用,還有一個底層思考,關(guān)鍵在于用AI來賦能,還是用AI來替換?我們判斷這兩種情況都有可能,體現(xiàn)在不同業(yè)務(wù)或環(huán)節(jié)中。AI賦能如同將人變成鋼鐵俠,實現(xiàn)路徑是智能輔助、人為決策。由于當(dāng)前AI尚未達(dá)到頂級人類水平,人的頂線更高。通過AI助力實現(xiàn)部分標(biāo)準(zhǔn)化,大概率可以把人做事情的方差變小。因為最終還是由人來決策,我們可以想象,比如一個人一秒鐘做一次決策,一天做決策的上限也就是86400個,受限于此,業(yè)務(wù)的增長只能是線性的。當(dāng)然通過AI輔助,成本必然會有一定的下降。最終整個團(tuán)隊的組織能力是構(gòu)建在管理和系統(tǒng)上的。當(dāng)我們假設(shè)有一個工作可以用AI完全替換,也就是無人化,則采用智能系統(tǒng)驅(qū)動。鑒于當(dāng)前AI并非100%準(zhǔn)確,仍需人工兜底。長期來看,不受人力限制的算力擴(kuò)展可能實現(xiàn)指數(shù)級增長。就目前AI水平而言,頂線雖不及人類,但均線一定會提升,方差理論上應(yīng)該為零,成本將呈數(shù)量級下降。這種體系下,組織能力僅僅需要構(gòu)建在全智能系統(tǒng)上,效率更高、成本更低、迭代速度更快。
大家經(jīng)常會問一個問題,AI應(yīng)用是否存在數(shù)據(jù)飛輪?最近谷歌也好,OpenAI也好,都宣布模型在奧林匹克數(shù)學(xué)競賽的難題解答上已經(jīng)做得非常好。類似這樣一個有確定性答案的任務(wù),今天的模型能力已經(jīng)遠(yuǎn)超絕大部分人類,這時它和人在交互過程中取得的信息,已經(jīng)不足以再提升它自身的智能。例如詢問“英偉達(dá)股票還能買嗎”,如果信息足夠充分,理論上存在標(biāo)準(zhǔn)答案,此時無需通過交互獲取更優(yōu)解,也就不存在數(shù)據(jù)飛輪。再比如說有一個完整約束條件的任務(wù):“購買北京至上海7時的高鐵二等座車票”,Agent只需執(zhí)行即可,不存在迭代優(yōu)化的數(shù)據(jù)飛輪。
什么是數(shù)據(jù)飛輪?比如你現(xiàn)在要求“中午訂一份好吃的外賣”,Agent需要了解用戶身份、用餐時間、送餐時效、飲食偏好、地點、價格區(qū)間,以及近期點餐記錄是否需要避免重復(fù)等。這些都需要通過持續(xù)使用過程中個性化的交互沉淀用戶習(xí)慣,形成數(shù)據(jù)飛輪。更復(fù)雜的如“提高英語能力”,這個英語能力指的是聽、說、讀、寫中的哪種?應(yīng)該怎么提升?當(dāng)前的水平是怎樣的?個人的學(xué)習(xí)習(xí)慣是怎樣的?學(xué)習(xí)效率是怎樣的?這些都是與用戶的交互過程中持續(xù)沉淀下來的靜態(tài)特征和動態(tài)行為,結(jié)合長短期的上下文,才能實現(xiàn)個性化交互,逐步形成數(shù)據(jù)飛輪。
今天AI應(yīng)用的組織到底應(yīng)該是什么樣的?我們認(rèn)為最重要的還是人才,且人才密度需高于業(yè)務(wù)復(fù)雜度。如今既需要行業(yè)領(lǐng)域人才,也需要AI人才,實際上領(lǐng)域人才和AI人才放到一起融合,難度是非常大的。我們公司曾出現(xiàn)這樣的情況:AI人才認(rèn)為某些工作“不夠AI”,沒有充分運用模型;而領(lǐng)域人才則指出當(dāng)前模型能力有限,仍需沿用原來的方法。怎么把他們?nèi)诘揭黄?,形成合力,這非常關(guān)鍵。第二,需要建立務(wù)實與創(chuàng)新并存的企業(yè)文化。正如前文所述,先構(gòu)建業(yè)務(wù)閉環(huán),再通過AI進(jìn)行升級或變革。既要有基礎(chǔ)業(yè)務(wù)能力,務(wù)實地創(chuàng)造商業(yè)價值,還要持續(xù)關(guān)注全球技術(shù)發(fā)展,懂得如何把AI能力應(yīng)用到業(yè)務(wù)上。第三,硅基生命已成為組織的必要組成部分。例如在代碼研發(fā)中,可能需要Cursor等的協(xié)助;在銷售環(huán)節(jié),AI可承擔(dān)某些具體工作。因此,人機協(xié)同將成為智能時代企業(yè)的基礎(chǔ)運營范式。對于難以適應(yīng)這種轉(zhuǎn)變的資深員工,我們一方面要提供機會,給時間點推動這樣的員工做改變;另一方面,我們也會敦促員工:站在未來看現(xiàn)在,不換腦子就換人。
以上就是我的分享,總結(jié)我們在AI應(yīng)用探索中遵循的16個字:“業(yè)務(wù)牽引、智能驅(qū)動、人機協(xié)同、務(wù)實創(chuàng)新”。公司提倡延遲滿足,引導(dǎo)大家不高估短期收益,也不低估長期積累。
來源 | IPO早知道