“可以給我設(shè)計一個北京一日游計劃嗎?”近日,2024世界智能網(wǎng)聯(lián)汽車大會現(xiàn)場,在極狐阿爾法S5上體驗北汽AI智能體的李先生,感覺自己有了一名隨叫隨到的“出行顧問”,“只需一句語音指令,AI智能體就能自動規(guī)劃好路線,方便極了”。
近年來,AI(人工智能)大模型技術(shù)的涌現(xiàn),掀起新一代AI研究熱潮,而今,AI智能體(AI Agent)正成為行業(yè)新熱點。從智能汽車中的語音助手到網(wǎng)絡(luò)直播間的數(shù)字人主播,AI智能體正以其獨特的自主性和交互性,深度改造應(yīng)用生態(tài),持續(xù)構(gòu)建智慧生活新圖景。
重塑人與機器的互動方式
顧名思義,AI智能體就是具備AI能力的一個智能實體,其可能是硬件裝置,也可能是軟件系統(tǒng)。它能夠感知環(huán)境、進行決策,并依托AI能力執(zhí)行動作,最終實現(xiàn)特定的目標(biāo)任務(wù)。
“通俗來講,AI智能體就像一個有智商、有情商、能理解、會幫忙的‘小助手’。”北京通用人工智能研究院先進技術(shù)中心副主任陳浩表示,這個“小助手”不僅能理解人類的語言,還能通過學(xué)習(xí)和分析數(shù)據(jù)來不斷提高自己在特定領(lǐng)域的技能水平。
為何AI智能體能成為行業(yè)關(guān)注的熱點?其與大模型技術(shù)的關(guān)系是怎樣的?
字節(jié)跳動豆包大模型相關(guān)負責(zé)人接受本報采訪時表示,AI智能體是基于大模型技術(shù)出現(xiàn)的,AI智能體“有手有腳”,可以自己干活、自己執(zhí)行,而大模型就是它的“大腦”。
但AI智能體是更“立體化”的智能系統(tǒng),除了提供大模型廣泛使用的語言交流服務(wù),AI智能體還能根據(jù)上下文進行智能推理和情感分析,并模仿人類行為進行相應(yīng)的操作。
比如,下達“幫我做一道菜”這項任務(wù)指令,“大模型廚師”只能輸出一份食譜并指出需要哪些食材;“AI智能體廚師”則不僅能提供食譜,還會根據(jù)指令人的口味偏好和營養(yǎng)需求,選擇最合適的食材自動下單購買,甚至能夠監(jiān)控烹飪過程,確保食物的質(zhì)量和口感。
“傳統(tǒng)的人機對話往往受限于固定的模式和預(yù)設(shè)的規(guī)則,難以實現(xiàn)真正自然的交流?!卑俣燃瘓F資深副總裁梁志祥指出,依托大模型在理解、生成、邏輯、記憶方面的四大能力,AI智能體已經(jīng)能夠模擬出更加貼近人類真實對話的方式,這使得“人機交互”變得如同“人人對話”一樣流暢自然。
事實上,獲益于大模型的通用性和可擴展性,AI智能體的使用門檻得以大幅降低。無論是大型企業(yè)還是中小企業(yè),甚至是個人開發(fā)者,無需新硬件或大量額外的訓(xùn)練數(shù)據(jù),都能快速搭建起自己的AI智能體應(yīng)用。
前不久,百度“文小言”大模型App推出“一句話創(chuàng)建智能體”的新功能。每個人可以根據(jù)需求創(chuàng)建專屬于自己的AI智能體,其性格、音色、身份設(shè)定都取決于用戶的個性化選擇。創(chuàng)建者可與“專屬智能體”進行視頻對話、英語口語練習(xí),還可以模擬求職面試等。據(jù)相關(guān)統(tǒng)計,百度文心智能體平臺已吸引了10萬家企業(yè)、60萬名開發(fā)者,覆蓋了上百個應(yīng)用場景。
“未來,如果用戶使用及生成自己的AI智能體都更加便捷,這將真正釋放AI智能體的價值。”梁志祥說,“下一步,我們將把AI智能體精準、高效地分發(fā)給更多的用戶,讓每個人都能成為AI智能體的‘開發(fā)者’?!?/p>
應(yīng)用場景持續(xù)拓寬
當(dāng)前,一系列AI智能體技術(shù)正在蓬勃發(fā)展,應(yīng)用場景持續(xù)拓展。
“一年半以前,北汽極狐就開始著手研究AI智能體,主要應(yīng)用于研發(fā)效率提升、標(biāo)準化語言編譯以及用戶服務(wù)等多個方面。”北汽研究總院智能網(wǎng)聯(lián)中心主任馮碩介紹,AI賦能的駕駛艙告別了機械式、固定指令式“人機問答”的舊模式,可實現(xiàn)靈活性、定制化的“智能交互”,例如,AI智能體會根據(jù)駕乘人的工作習(xí)慣安排日程表,捕捉駕乘人的喜好、情緒推薦音樂、電影等。
當(dāng)識別出駕乘人過度疲勞時,AI智能體會迅速生成包括預(yù)訂車位、調(diào)節(jié)車內(nèi)環(huán)境、設(shè)定休息時長等在內(nèi)的服務(wù)方案,為用戶提供更加安全的智能駕駛體驗?!拔磥?,AI智能體還有望搭載‘一句話訂外賣’等功能,更方便駕乘人使用?!瘪T碩說。
與此同時,AI智能體技術(shù)也在快速發(fā)展并逐步落地到各種小型終端設(shè)備中。
“豆包豆包,寺中這個羅漢是誰?”“這是摩訶迦葉,釋迦牟尼的十大弟子之一……”自媒體運營者小范回憶道,在國慶假期參觀浙江臺州國清寺時,他與耳機Ola Friend之間常有這樣的問答。
據(jù)了解,Ola Friend是字節(jié)跳動旗下豆包大模型發(fā)布的首款A(yù)I智能體耳機,除了常規(guī)的聲樂播放功能,還能在信息查詢、旅游出行等場景為用戶提供即時幫助。
豆包大模型相關(guān)負責(zé)人介紹稱,Ola Friend可隨時化身為用戶的“私人導(dǎo)游”,并且用戶還能根據(jù)興趣點進行“追問”,如逛畫展時,用戶可以就某件具體的展品讓Ola Friend幫自己介紹,再延伸追問該展品創(chuàng)作者的藝術(shù)風(fēng)格、其他代表作品等,在一問一答中獲取更多知識。
今年以來,越來越多的手機廠商也紛紛加入AI智能體布局。vivo近期發(fā)布了名為PhoneGPT的手機智能體,能夠基于用戶意圖準確操作手機應(yīng)用以完成任務(wù),如打電話、發(fā)短信、訂餐廳等,極大提升用戶體驗;華為將智慧助手小藝升級為系統(tǒng)級智能體,不僅問答能力再進階,而且具備更強的感知推理能力;OPPO則推出了“1+N”智能體生態(tài)戰(zhàn)略,由AI超級智能體和AI Pro開發(fā)平臺組成,旨在提供更符合用戶偏好的個性化服務(wù)模式。
在商業(yè)服務(wù)場景中,AI智能體正與消費者進行深度互動。
百度電商數(shù)字人直播平臺“慧播星”5分鐘就能生成一個帶貨智能體,不僅可以24小時在線,且整個直播間實現(xiàn)了完全智能化、無人化。數(shù)字人主播和數(shù)字人副播各司其職,及時回答消費者提問,展示和講解商品時配合流暢自然,對來不及口頭回復(fù)的問題,還有AI助理進行文字回復(fù)。
“因為有了數(shù)字人直播智能體技術(shù),電商直播行業(yè)的成本高、時間受限、質(zhì)量不穩(wěn)定等難題得到有效緩解?!绷褐鞠榉Q,截至目前,“慧播星”已累計幫助數(shù)萬家商家實現(xiàn)收益增長,平均帶來62%的商品交易總額的提升。
當(dāng)前,AI智能體還在其他諸多場景中得到應(yīng)用,如編程、內(nèi)容創(chuàng)作、工業(yè)制造等,展現(xiàn)出強大的應(yīng)用潛力和市場價值。
帶給未來生活更多可能
不少業(yè)內(nèi)人士認為,AI智能體將是未來趨勢所在。
騰訊發(fā)布《2024數(shù)字科技前沿應(yīng)用趨勢報告》認為,大模型將走向多模態(tài),AI智能體有望成為下一代平臺。國際管理咨詢公司埃森哲在《技術(shù)展望2024》報告中稱,96%的企業(yè)高管認為AI智能體將在未來3年內(nèi)為其所在企業(yè)帶來重大發(fā)展機遇。
業(yè)內(nèi)人士表示,在可預(yù)見的未來,AI智能體將幫助多個行業(yè)構(gòu)建起以“人+AI數(shù)字員工”為核心的智能化運營新常態(tài)。例如,在醫(yī)療領(lǐng)域,AI智能體可以協(xié)助醫(yī)生進行診斷、治療和健康管理;在交通領(lǐng)域,AI智能體可以通過分析數(shù)據(jù)和實時路況,為交通管理和規(guī)劃提供科學(xué)依據(jù);在教育領(lǐng)域,AI智能體可以提供智能輔導(dǎo)和自適應(yīng)學(xué)習(xí)系統(tǒng),幫助學(xué)生更好掌握知識。
專家指出,隨著機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的不斷進步,AI智能體的特性和學(xué)習(xí)能力還將變得愈發(fā)強大,未來將更好地適應(yīng)復(fù)雜多變的現(xiàn)實世界,為社會發(fā)展帶來更多可能。
盡管AI智能體技術(shù)為未來生活帶來了更多可能,但目前其仍然處于起步階段——已出現(xiàn)的AI智能體僅能完成較為簡單、固定的工作,且應(yīng)用功能同質(zhì)化嚴重。
有觀點指出,AI智能體的發(fā)展瓶頸之一在于目前的大模型缺乏足夠的推理能力,無法在沒有人工介入的情況下真正解決復(fù)雜的問題。大模型技術(shù)本身就因算法等因素存在不可預(yù)測的先天缺陷,容易為AI智能體帶來一系列安全隱患。
除了技術(shù)風(fēng)險,AI智能體也面臨倫理和隱私等問題。業(yè)內(nèi)人士表示,AI智能體在提供服務(wù)的過程中會收集大量數(shù)據(jù),有可能導(dǎo)致個人隱私信息的泄露,比如AI智能體可能會根據(jù)用戶的購物習(xí)慣推斷出他們的某些私人愛好。這種“窺探”行為,無疑是對用戶隱私的侵犯。
專家認為,目前需盡快根據(jù)智能體的功能用途、使用時限進行分類管理,尤其對高風(fēng)險智能體的開發(fā)生產(chǎn)及應(yīng)用部署進行持續(xù)監(jiān)管,并及時制定相關(guān)法律法規(guī),改進現(xiàn)有互聯(lián)網(wǎng)標(biāo)準,從而更好地預(yù)防智能體引發(fā)的各種風(fēng)險。
(責(zé)任編輯:沈曄)