首頁(yè)IT—正文
李彥宏:大模型基本消除幻覺 數(shù)字人直播銷量超真人
2024年11月18日 14:28 來(lái)源:中國(guó)新聞網(wǎng)

  李彥宏百度世界2024演講:不是要推出一個(gè)“超級(jí)應(yīng)用”,要打造數(shù)百萬(wàn)“超級(jí)有用”的應(yīng)用

  “過去24個(gè)月,AI行業(yè)發(fā)生的最大變化是什么?是大模型基本消除了幻覺!11月12日,百度創(chuàng)始人李彥宏在百度世界2024大會(huì)上,發(fā)表了主題為《應(yīng)用來(lái)了》的演講,發(fā)布兩大賦能應(yīng)用的AI技術(shù):檢索增強(qiáng)的文生圖技術(shù)(iRAG)和無(wú)代碼工具“秒噠”。文心iRAG用于解決大模型在圖片生成上的幻覺問題,極大提升實(shí)用性;無(wú)代碼工具“秒噠”讓每個(gè)人都擁有程序員的能力,將打造數(shù)百萬(wàn)“超級(jí)有用”的應(yīng)用。

  截至11月初,百度文心大模型的日均調(diào)用量已經(jīng)超過15億,相較一年前首次披露的5000萬(wàn)次,增長(zhǎng)約30倍。李彥宏表示,“這條陡峭的增長(zhǎng)曲線,代表著過去兩年中國(guó)大模型應(yīng)用的爆發(fā)!毖葜v中,李彥宏再次強(qiáng)調(diào),智能體是AI應(yīng)用的最主流形態(tài),即將迎來(lái)爆發(fā)點(diǎn),它將成為AI原生時(shí)代,內(nèi)容、信息和服務(wù)的新載體。

  以下為李彥宏的主要觀點(diǎn):

  文心大模型日調(diào)用量達(dá)15億,代表著過去兩年中國(guó)大模型應(yīng)用的爆發(fā)

  “過去24個(gè)月,這種全球性的大模型狂熱,究竟是一場(chǎng)新的技術(shù)革命還是新一輪泡沫?作為中國(guó)人工智能的扛旗者,我想我們是有資格回答這個(gè)問題的。大家請(qǐng)看這張圖:這是文心大模型的日均調(diào)用量變化曲線圖,到今天這個(gè)數(shù)字已經(jīng)超過了15億次。這是一條非常陡峭的增長(zhǎng)曲線,代表著過去兩年中國(guó)大模型應(yīng)用爆發(fā)。說(shuō)實(shí)話,這個(gè)增速是超出了我的預(yù)期的。我記得今年5月份,就是6個(gè)月之前,當(dāng)我們的日均調(diào)用量達(dá)到兩億的時(shí)候,我跟我的高管們討論,討論大模型的未來(lái),討論怎么就叫成了。我當(dāng)時(shí)說(shuō),如果我們的日均調(diào)用量一年之內(nèi)漲10倍,也就是從2億漲到20億,我認(rèn)為就成了,就說(shuō)明大家是真需要,F(xiàn)在僅僅半年過去,我們就比較接近這個(gè)數(shù)字了,勢(shì)頭非常猛!

  過去24個(gè)月,AI行業(yè)的最大變化是大模型基本消除了幻覺

  “去年三月,文心一言發(fā)布的時(shí)候,我們說(shuō)百度大模型的特色是知識(shí)增強(qiáng)、檢索增強(qiáng)。后來(lái)發(fā)現(xiàn),檢索增強(qiáng)不是百度特色,而是逐步成為了行業(yè)的共識(shí)。檢索增強(qiáng)的手段,英文叫RAG,就是Retrieval-augmented Generation。當(dāng)然,我們是做搜索起家的,這個(gè)方面理應(yīng)做得最好。這個(gè)手段的意義在哪呢?它就是讓大模型基本消除了幻覺。要想基于大模型開發(fā)應(yīng)用,消除幻覺是必須的,如果這個(gè)模型總是一本正經(jīng)的胡說(shuō)八道,就不會(huì)有人信你,就不會(huì)有應(yīng)用。有人說(shuō)我用模型來(lái)寫小說(shuō),有點(diǎn)幻覺可能更有意思,更能引人入勝?不對(duì)!即使是文學(xué)創(chuàng)作,也需要故事前后保持一致,否則就不是智能而是智障了!”

  “所以,如果你要問我,過去這24個(gè)月,對(duì)這個(gè)行業(yè)而言,最大的變化是什么?我的回答一定是,大模型基本消除了幻覺,它回答問題的準(zhǔn)確性大幅提升了,這讓AI從‘一本正經(jīng)的胡說(shuō)八道’,變得可用、可被信賴。我們知道,大模型是一個(gè)概率模型,生成的內(nèi)容具有不確定性。采用RAG技術(shù)后,大模型會(huì)利用檢索到的信息來(lái)指導(dǎo)文本或答案的生成,從而極大地提高了內(nèi)容的質(zhì)量和準(zhǔn)確性!

  檢索增強(qiáng)的文生圖技術(shù)iRAG發(fā)布,整體效果遠(yuǎn)遠(yuǎn)超過文生圖原生系統(tǒng)

  “今天,文字層面的RAG已經(jīng)做得很好了,但是圖像等多模態(tài)內(nèi)容和RAG的結(jié)合還不夠。大家請(qǐng)看這張圖,這是我們用一個(gè)開源模型生成的一張北京天壇的圖片,看上去確實(shí)有點(diǎn)像天壇,但總覺得哪兒不對(duì)。告訴大家,真正的天壇長(zhǎng)這樣,是三層,但模型生成了四層,這是文生圖比較典型的幻覺現(xiàn)象。這種幻覺現(xiàn)象,今天仍然很普遍,所以今天的多模態(tài)大模型,沒有什么成規(guī)模的應(yīng)用出來(lái)。就是幻覺沒有解決,至少?zèng)]有像文生文RAG解決得那么好!

  “今年年初,我們決定要解決圖像生成的幻覺問題。我們開發(fā)了一項(xiàng)顛覆性的技術(shù)叫做iRAG,就是image based RAG,檢索增強(qiáng)的文生圖技術(shù)。之前,完全基于大語(yǔ)言模型的文生圖系統(tǒng),生成的圖片常常是“一眼假”,甚至是邏輯不合常理。百度的iRAG,將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,就可以生成各種超真實(shí)的圖片,整體效果遠(yuǎn)遠(yuǎn)超過文生圖原生系統(tǒng),去掉了機(jī)器味兒!

  “隨著AI生成圖片的可用性大大提高,它的應(yīng)用空間也隨即打開了。比如在品牌宣傳場(chǎng)景,以前拍這樣一組海報(bào)動(dòng)輒需要一二十萬(wàn),甚至大幾十萬(wàn),但是現(xiàn)在創(chuàng)作的成本接近于0。簡(jiǎn)單說(shuō)來(lái),iRAG的商業(yè)價(jià)值體現(xiàn)在:無(wú)幻覺、超真實(shí)、沒成本,立等可取。

  當(dāng)基礎(chǔ)模型能力就緒,我們即將迎來(lái)AI應(yīng)用的群星閃耀時(shí)刻

  “基礎(chǔ)模型能力就緒,我們即將迎來(lái)AI應(yīng)用的群星閃耀時(shí)刻。每一個(gè)應(yīng)用都是一顆星,每一個(gè)應(yīng)用都將成為改變世界的力量。那么AI應(yīng)用從哪里來(lái)?到哪里去?有兩大AI應(yīng)用方向:一個(gè)是智能體,另一個(gè)是產(chǎn)業(yè)應(yīng)用!

  智能體是AI應(yīng)用的最主流形態(tài),即將迎來(lái)爆發(fā)點(diǎn)

  “智能體是AI應(yīng)用的最主流形態(tài),即將迎來(lái)它的爆發(fā)點(diǎn)。今天,全球所有頂尖科技公司都很關(guān)注智能體,但像百度這樣把智能體作為最重要戰(zhàn)略方向的并不多。我認(rèn)為,做智能體很像PC時(shí)代做網(wǎng)站,或者是移動(dòng)時(shí)代做自媒體賬號(hào)。不同之處是智能體更像人,更智能,更像你的銷售,你的客服,你的助理。智能體可能會(huì)變成AI原生時(shí)代,內(nèi)容、信息和服務(wù)的新載體!

  “為什么這么說(shuō)?一方面,做智能體的門檻足夠低,誰(shuí)都能上手,在百度的文心智能體平臺(tái)上,甚至已經(jīng)有11歲的小學(xué)生在創(chuàng)造智能體,然后通過搜索和其他渠道分發(fā)出去。另一方面,智能體的天花板又足夠高,可以做出功能非常強(qiáng)大的應(yīng)用。多個(gè)智能體的協(xié)作,還可以解決更加復(fù)雜的問題。”

  “目前,文心智能體平臺(tái)上,已經(jīng)吸引了15萬(wàn)家企業(yè)和80萬(wàn)名開發(fā)者參與,覆蓋的應(yīng)用場(chǎng)景非常非常多。文心智能體平臺(tái)的TOP100智能體是我們基于智能體的分發(fā)量、平均對(duì)話輪次、用戶喜愛度等指標(biāo)綜合遴選出來(lái)的。有角色類的,像農(nóng)民院士智能體,有工具類、行業(yè)類的智能體,更有職場(chǎng)、情感、娛樂等類型的智能體。”

  公司官方智能體很可能替代官網(wǎng),成為最直接面向消費(fèi)者的界面

  “公司類智能體相當(dāng)于AI時(shí)代的公司官網(wǎng)。傳統(tǒng)官網(wǎng)具有的那些能力,比如公司介紹、產(chǎn)品圖片和參數(shù)展示、線下門店位置等等,公司類智能體都有。而傳統(tǒng)網(wǎng)站沒有的主動(dòng)推薦、及時(shí)響應(yīng)和一對(duì)一服務(wù)能力,公司智能體也有!

  “智能體與傳統(tǒng)官網(wǎng)很不一樣的,那就是對(duì)最新信息或者最個(gè)性化問題的回答。傳統(tǒng)的官網(wǎng),對(duì)外界市場(chǎng)信息變化往往不敏感,客服人員對(duì)于個(gè)性化的問題也難以給出令人滿意的回答,就只能做記錄,再電話回訪。而智能體可以利用大模型的理解、生成、邏輯、記憶四大能力和檢索增強(qiáng)能力,快速?gòu)木W(wǎng)上獲取最新、最準(zhǔn)確的消息,并在一秒內(nèi)就給出一個(gè)令人滿意的答案。如果你還有更復(fù)雜的問題,智能體也可以通過不斷地跟你互動(dòng)、澄清、反問,來(lái)最終滿足你的需求!

  “不僅是比亞迪,像聯(lián)想、沙宣、洋河這些企業(yè),現(xiàn)在都已經(jīng)擁有了自己的官方智能體。比起傳統(tǒng)的官網(wǎng),智能體既是品牌顧問又是金牌銷售和客服,既專業(yè)又貼心,一對(duì)一的服務(wù),大幅地提升了互動(dòng)營(yíng)銷的效率。比亞迪的官方智能體上線后,銷售線索轉(zhuǎn)化率提升了119%。聯(lián)想AIPC智能體在9月份的互動(dòng)率提升了89%,銷售線索轉(zhuǎn)化率提升了80%。”

  “未來(lái),公司官方智能體很可能將替代官網(wǎng),成為最直接面向消費(fèi)者的界面!

  文心多模態(tài)大模型加持發(fā)布萬(wàn)能白板“自由畫布”

  “百度文庫(kù)和網(wǎng)盤聯(lián)合開發(fā)的“自由畫布”是一個(gè)全新的工具類智能體。我們以行業(yè)分析師撰寫研究報(bào)告為例。在很多人的認(rèn)知中,行研報(bào)告就是圖文結(jié)合的內(nèi)容。但今天,它可以是另一種形態(tài),有傳統(tǒng)的圖文、表格,也有發(fā)布會(huì)視頻、電話會(huì)錄音等,組成一種更全的多模態(tài)報(bào)告。這在自由畫布上,可以很好地實(shí)現(xiàn)!

  “自由畫布可以幫你完成從找資料、到編輯、再到生成和分享的全部任務(wù),輸入自由、編輯自由、創(chuàng)作自由、分享自由!

  “自由畫布就是一個(gè)由文心多模態(tài)大模型加持的萬(wàn)能白板,它能激發(fā)人們的靈感和創(chuàng)造力。因?yàn)樽杂僧嫴迹總(gè)孩子都能成為故事的主角。因?yàn)樽杂僧嫴,每個(gè)人都可以成為漫畫家、短視頻導(dǎo)演。而且,這不是期貨,而是立即可用的現(xiàn)貨,是真正服務(wù)于創(chuàng)造的新質(zhì)生產(chǎn)力!”

  不是要推出一個(gè)“超級(jí)應(yīng)用”,是要打造數(shù)百萬(wàn)“超級(jí)有用”的應(yīng)用

  “今天,我在這里發(fā)布大模型的100大產(chǎn)業(yè)應(yīng)用,它涵蓋了制造、能源、交通、政務(wù)、金融、汽車、教育、互聯(lián)網(wǎng)等眾多行業(yè),百度希望與更多合作伙伴和客戶一起推動(dòng)智能產(chǎn)業(yè)生態(tài)的建設(shè),共同來(lái)加速國(guó)家“人工智能+”行動(dòng)計(jì)劃的落地。發(fā)布這100大產(chǎn)業(yè)應(yīng)用,其實(shí)也代表我們的一種認(rèn)知和態(tài)度。百度不是要推出一個(gè)‘超級(jí)應(yīng)用’,而是要不斷地幫助更多人、更多企業(yè)打造出數(shù)百萬(wàn)‘超級(jí)有用’的應(yīng)用!

  無(wú)代碼工具“秒噠”發(fā)布,將迎來(lái)一個(gè)“只靠想法就能賺錢的時(shí)代”

  “今天,我們的確有條件讓一行代碼都看不懂的人具備程序員的能力,有讓任何一個(gè)想法都能迅速地、低成本地變?yōu)楝F(xiàn)實(shí)的能力。當(dāng)然,這需要工具,這個(gè)工具就是秒噠”

  “秒噠是一個(gè)不需要寫代碼就能夠?qū)崿F(xiàn)任意想法的軟件,一個(gè)由大模型和智能體組成的全新的軟件,我認(rèn)為它是‘迄今為止人類歷史上最復(fù)雜的多智能體協(xié)作工具’,它包括無(wú)代碼編程、多智能體協(xié)作以及規(guī)模化地調(diào)用各種工具等能力。注意,秒噠是跟任何輔助代碼生成工具很不一樣的,因?yàn)樗静恍枰隳芸炊a!

  “有了秒噠,一個(gè)人通過自然語(yǔ)言交互,就可以完成一整套系統(tǒng)的搭建,還可以做任意場(chǎng)景下的各種應(yīng)用,應(yīng)用的復(fù)雜度也會(huì)隨著我們技術(shù)的提升不斷提升。最早開始的時(shí)候,它只能做一些比較簡(jiǎn)單的編程,比如說(shuō)兩三百行代碼,以后隨著基礎(chǔ)模型能力提升,以及秒噠本身技術(shù)能力的演進(jìn),它就可以做越來(lái)越多的,越來(lái)越復(fù)雜的事情。這意味著什么?這意味著,你不需要去招募項(xiàng)目經(jīng)理、設(shè)計(jì)人員、開發(fā)人員、測(cè)試人員等等,自己就可以指揮多個(gè)智能體來(lái)協(xié)同完成任務(wù)。也就是說(shuō),只要有想法,你就可以心想事成,我們將迎來(lái)一個(gè)前所未有的只靠想法就能賺錢的時(shí)代。以前有個(gè)想法,你還要去執(zhí)行,把想法做出來(lái),F(xiàn)在只要你有想法,秒噠就可以幫你做了!

  “我想,AI之所以被稱為產(chǎn)業(yè)革命級(jí)的機(jī)會(huì),就是因?yàn)樗鼘?duì)于社會(huì)經(jīng)濟(jì),帶來(lái)了生產(chǎn)力的無(wú)限擴(kuò)張。秒噠讓每個(gè)人都具備程序員的能力,會(huì)說(shuō)話就能做出應(yīng)用來(lái),它對(duì)于人類工作效率的提升怎么說(shuō)都不為過。”

  軟件吞噬世界?“AI applications are creating the world”

  “在人類信息技術(shù)變革的不同歷史時(shí)期,應(yīng)用出現(xiàn)的樣貌也不一樣:在PC時(shí)期,它是一個(gè)個(gè)的軟件和網(wǎng)站;在移動(dòng)時(shí)期,它是一個(gè)個(gè)的APP和可被關(guān)注的賬號(hào);在AI時(shí)代,應(yīng)用主要的形態(tài)就是智能體。隨著大模型技術(shù)和能力的指數(shù)級(jí)躍遷,自然語(yǔ)言成為了這個(gè)時(shí)代最重要的編程語(yǔ)言。我們每一個(gè)人都能動(dòng)手創(chuàng)造一個(gè)屬于自己、也屬于他人的AI應(yīng)用,或者智能體!

  “我是軟件工程師出身,國(guó)外有一種說(shuō)法叫‘軟件吞噬世界’。但我認(rèn)為,這個(gè)世界不應(yīng)該被吞噬,而應(yīng)該被創(chuàng)造。AI時(shí)代,應(yīng)用創(chuàng)造世界。所以請(qǐng)大家和我一起見證,AI applications are creating the world!

編輯:沙見龍