網(wǎng)校培訓(xùn)專業(yè)的網(wǎng)站優(yōu)化公司排名
大語言模型的最早應(yīng)用是Chatbot,其實(shí)我最早接觸語義理解在2014年,2014年做智能音箱的時(shí)候,那時(shí)也是國(guó)內(nèi)第一批做智能音箱的,在現(xiàn)在看起來當(dāng)時(shí)的智能音箱比較傻,很多問題無法回答,長(zhǎng)下文效果也不好,多輪對(duì)話效果就更差了,那時(shí)對(duì)話使用的主要技術(shù)是基于規(guī)則+知識(shí)圖譜,所以主要還是停留在命令詞識(shí)別基礎(chǔ)上的交互,比如放音樂類、操控智能家電以及問天氣等有限的幾個(gè)范疇,更多的扮演的事assistent角色,開放式聊天做的并不好。
當(dāng)時(shí)是設(shè)計(jì)階段就決定了對(duì)話的上限,雖然我們當(dāng)時(shí)模仿的Amazon Alexa如今“進(jìn)化”出了數(shù)以萬計(jì)的技能,但是相對(duì)于LLM,這些技能顯得有些過時(shí),如何將LLM接入Alex也是亞馬遜不得不面臨的事。
時(shí)至今日大型預(yù)訓(xùn)練的語言模型(如GPT、BERT等)使得對(duì)話機(jī)器人取得了顯著的進(jìn)展。這些模型通過在大規(guī)模文本數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,可以生成具有語法正確性、語義連貫性、具有記憶能力多輪對(duì)話的文本回復(fù),除了生成自由對(duì)話回復(fù)的模型,還有一些任務(wù)導(dǎo)向的對(duì)話系統(tǒng),如客服機(jī)器人、智能助理等。這時(shí)在運(yùn)行時(shí)才會(huì)決定對(duì)話的上限,聊天機(jī)器人再次被認(rèn)為是客戶服務(wù)、營(yíng)銷和內(nèi)部運(yùn)營(yíng)的潛在游戲規(guī)則改變者。
在訓(xùn)練模型的時(shí)候,常常提到模型的泛化能力,泛化能力使得模型可以高質(zhì)量回復(fù)訓(xùn)練集中并不存在的內(nèi)容,即可以將模型的訓(xùn)練過程看成是記憶+學(xué)習(xí)的過程,記憶是可以記住訓(xùn)練集中的內(nèi)容,而學(xué)習(xí)就是根據(jù)訓(xùn)練集中的內(nèi)容舉一反三、觸類旁通。在一個(gè)訓(xùn)練好的模型,如果觸發(fā)高質(zhì)量的記憶+學(xué)習(xí)能力以獲得高質(zhì)量的回復(fù)是信息獲取類的核心競(jìng)爭(zhēng)力之一。
就當(dāng)前的大語言模型的產(chǎn)品形態(tài)而言,基于我所處的行業(yè)和工作性質(zhì)認(rèn)知,我認(rèn)為集成大語言模型的工具類應(yīng)用將是第一波享受大語言模型紅利的應(yīng)用場(chǎng)景。盡管微軟基于大語言模型的代碼補(bǔ)全github copilot還處在虧損的階段,但是150萬這一龐大的付費(fèi)用戶規(guī)模,已經(jīng)驗(yàn)證了大量用戶愿意為此買單,對(duì)于copilot生產(chǎn)代碼的質(zhì)量是至關(guān)重要的。
大語言模型的用戶價(jià)值
總結(jié)來說,使用大語言模型的目的可以歸為一下幾類:
1.信息獲取:提供及時(shí)、準(zhǔn)確、可信的信息和答案,用戶可以問問題、需求建議獲取特定領(lǐng)域的知識(shí),這好處在于可以快速獲取信息而不需要再瀏覽搜索結(jié)果或者在工具間切換,突出優(yōu)勢(shì)是方便,這在信息爆炸的時(shí)代是非常突出的重點(diǎn)的,
2.娛樂和消遣:重點(diǎn)是消遣,這里必須突破的點(diǎn)是如何促進(jìn)用戶的多巴胺分泌,顯示生活中黃賭毒都能促進(jìn)大量的多巴胺分泌,同樣一樣?xùn)|西,具有兩面性,取決于人怎樣使用,好比刷抖音/快手,有些人是獲取知識(shí),而有些人就是為了看不費(fèi)腦子的爽圖和短視頻,如何在這一個(gè)過程中讓用戶不費(fèi)腦子的消遣是產(chǎn)品設(shè)計(jì)的重點(diǎn),但凡需要一些思考,就可能流失一部分用戶,但是如果能夠挖掘用戶的興趣點(diǎn),比如有些小朋友喜歡腦筋急轉(zhuǎn)彎,雖然費(fèi)腦子,猜不中,但是小朋友卻很喜歡玩,并且樂此不疲,雖然猜不中,但是總想征服下一個(gè)謎底,這個(gè)游戲的設(shè)計(jì)非常有挑戰(zhàn)性。
3.社交互動(dòng):這是人的情感需求,需要提供的事情緒價(jià)值,高質(zhì)量的共情是這個(gè)點(diǎn)必須突破的核心所在。這是滿足人的社交需求,在一些情況下,如孤獨(dú)感、需要傾訴和陪伴是,對(duì)話機(jī)器人可以提供一種無壓力和包容性的交流環(huán)境。
不同用戶在不同場(chǎng)景對(duì)于時(shí)間的看法是不一樣的,對(duì)于互聯(lián)網(wǎng)等科技工作者,在工作的時(shí)間,需要高質(zhì)量的信息獲取以便提升工作的產(chǎn)出和結(jié)果,而在下班之后的時(shí)間有些人人用來社交、有些人用來娛樂,有些人用來進(jìn)修,不同的選擇對(duì)于時(shí)間的價(jià)值期許是不一樣的。
以高鐵候車大廳為例,坐在凳子上等車的人中,約85%都盯著手機(jī),其中以30歲左右的人比例最高,在干的事情,主要為聊天(人面對(duì)面聊天),和手機(jī)交互,和電腦pad交互(極少),吃喝、帶娃以及發(fā)呆(盯著大屏或者其他場(chǎng)景看),手機(jī)占了90%的時(shí)間,主要使用的APP主要為微信、抖音、微博、游戲、電話、購(gòu)物等這幾大類,如果想要占據(jù)這些人的時(shí)間,那么娛樂類是重點(diǎn)。
如果是辦公室的白領(lǐng)場(chǎng)景,那么這些人溝通外界的方式更多的是電腦,且在家也多有個(gè)人電腦,辦公場(chǎng)景更多的需要高做出高質(zhì)量選擇,高質(zhì)量的信息獲取就至關(guān)重要,對(duì)于程序員、財(cái)務(wù)、律師、金融、醫(yī)療等不同的類型的白領(lǐng)又需要特定領(lǐng)域的知識(shí)。
所以在設(shè)計(jì)一個(gè)ChatBot的時(shí)候,需要想清楚服務(wù)于什么用戶(核心用戶),剛性需求是什么(痛點(diǎn)),典型的場(chǎng)景(什么時(shí)候用,就是你想吞噬用戶什么場(chǎng)景的時(shí)間,是高鐵候車大廳還是程序員辦公室工作場(chǎng)景?)以及競(jìng)品優(yōu)勢(shì)是什么。
大語言模型現(xiàn)狀
像GPT-4這樣的LLM的出現(xiàn)徹底改變了聊天機(jī)器人的設(shè)計(jì)格局,這些高級(jí)模型利用人工智能來理解上下文并生成類似人類的響應(yīng)。這種轉(zhuǎn)變對(duì)聊天機(jī)器人設(shè)計(jì)具有重大影響。
當(dāng)前各家的模型還處在初始階段,基本上是模型即服務(wù)的狀態(tài),通過測(cè)試在模型層面上回復(fù)質(zhì)量就是層次不齊的,而對(duì)于相同的模型,采用不同retrieve方法引導(dǎo)生成的回復(fù),質(zhì)量也是不一樣的。這種retrieve方法是交互范式的改變。
很多產(chǎn)品將對(duì)話機(jī)器人以web主打的形式接入公司的官網(wǎng)或者是瀏覽器插件的形式提供AI功能,web仍然是構(gòu)建對(duì)話機(jī)器人的最簡(jiǎn)單、最干凈的方式,并提供設(shè)計(jì)對(duì)話機(jī)器人的最大自由度。圍繞著的也會(huì)有各類平臺(tái)的app,以增加對(duì)話機(jī)器人的觸及度。
不同的場(chǎng)景中,用戶對(duì)對(duì)自身時(shí)間價(jià)值的看法是不一樣的,期望產(chǎn)生的價(jià)值也是不一樣的,當(dāng)前大一統(tǒng)的對(duì)話機(jī)器人并不能很好的覆蓋通用的日常場(chǎng)景,就目前而言并不認(rèn)為大語言模型會(huì)一統(tǒng)所有場(chǎng)景,比如現(xiàn)在吃飯會(huì)打開一個(gè)APP,購(gòu)物會(huì)打開一個(gè)app,比如餓了么,現(xiàn)在的交互范式是我主動(dòng)搜索,然后下拉一個(gè)個(gè)看評(píng)分看詳細(xì)介紹,個(gè)性化并不智能,大模型可以做到更了解一個(gè)人
商業(yè)盈利當(dāng)前仍不是重點(diǎn),圈地是重點(diǎn),但是商業(yè)化已經(jīng)在流量以及會(huì)員制付費(fèi)的模式上嘗試,并取得了一些進(jìn)展。
設(shè)計(jì)師現(xiàn)在可以更專注于完善聊天機(jī)器人的對(duì)話能力,在特定領(lǐng)域訓(xùn)練它,并確保它為最終用戶提供價(jià)值,從而產(chǎn)生更具吸引力和更有效的用戶體驗(yàn)。
信息獲取類都是如此,信息的質(zhì)量將是大語言模型之間競(jìng)爭(zhēng)的核心,為了提升大語言模型的回復(fù)質(zhì)量,由此引出了擴(kuò)充高質(zhì)量數(shù)據(jù)集、Fine-tune、RAG、聯(lián)網(wǎng)信息獲取都是在提升回復(fù)質(zhì)量。
大模型進(jìn)化的方向
用戶將從聊天中獲取怎樣的價(jià)值,或者說聊天機(jī)器人給用戶在什么場(chǎng)景提供怎樣的潛在價(jià)值是是出發(fā)點(diǎn),換句話說滿足了了人性中哪點(diǎn)或哪幾點(diǎn),相對(duì)于本我、自我、超我的馬斯洛分層模型,我更喜歡用人性劣根性的七宗罪來提煉價(jià)值。
設(shè)計(jì)對(duì)話機(jī)器人是藝術(shù)和科學(xué)的融合,結(jié)合了用戶界面設(shè)計(jì)UI、用戶體驗(yàn)UX、交互設(shè)計(jì)ID和大模型訓(xùn)練。是用戶針對(duì)其痛點(diǎn)場(chǎng)景的第一解決方案,產(chǎn)品自始至終的設(shè)計(jì)都應(yīng)該牢記對(duì)用戶提供價(jià)值。最核心的是理解用戶需求,用戶是不懂技術(shù)的,讓用戶學(xué)習(xí)如何寫好prompt的產(chǎn)品體驗(yàn)是不合理的,如果在用戶不感知的情況下幫助用戶生成高質(zhì)量的prompt,表面上式我想要,深挖到最后,都可以歸結(jié)到人性層面,所以有時(shí)候用戶的問,并不是用戶真正想的問題,所以挖掘背后的問并為用戶寫出正確的Prompt是產(chǎn)品設(shè)計(jì)中必須考慮的點(diǎn)。
從表面的形式上看,未來大模型發(fā)展的趨勢(shì)如下:
1.各種插件引入,給大模型補(bǔ)充數(shù)據(jù)、技能,搜索、地圖、財(cái)經(jīng)、天氣數(shù)據(jù)等;增加在數(shù)據(jù)專業(yè)性和時(shí)效性;
2.應(yīng)對(duì)隱私和幻覺,隱私包括個(gè)人電話、地址相關(guān)賬號(hào)登信息的泄露,也包括公司的一些文檔、信息、資料等泄露,幻覺是生成可靠的回復(fù),當(dāng)前的大語言模型是可能生成實(shí)事性的錯(cuò)誤或者捏造相關(guān)事實(shí)。
對(duì)于幻覺,當(dāng)前采用如下兩種方法居多。
-
Fine-Tuning
-
Retrieval Augmented Generation (RAG).
3.由于部分大語言模型對(duì)話已經(jīng)退出,因而當(dāng)前已經(jīng)收集到了海量的真實(shí)對(duì)話數(shù)據(jù),理解機(jī)器人失敗的原因仍然至關(guān)重要。分析見解不僅增強(qiáng)了用戶體驗(yàn),還揭示了聊天機(jī)器人設(shè)計(jì)中的潛在陷阱。通過研究機(jī)器人在用戶旅程或?qū)υ捔鞒讨械牟蛔阒?#xff0c;我們可以相應(yīng)地完善和改進(jìn)設(shè)計(jì)。
4.頭部互聯(lián)網(wǎng)公司繼續(xù)領(lǐng)跑,并且在已有業(yè)務(wù)和通用對(duì)話機(jī)器人繼續(xù)嘗試,具有行業(yè)數(shù)據(jù)(金融、醫(yī)療、法律、軟件等)將會(huì)構(gòu)建行業(yè)大語言模型并司內(nèi)嘗試使用;
5.預(yù)計(jì)24年底到25年上半年,頭部互聯(lián)網(wǎng)通公司根據(jù)已有對(duì)話機(jī)器人收集的數(shù)據(jù)分析后,大概率會(huì)反應(yīng)過來其以前的通用大模型全品類聊天注定是失敗的產(chǎn)品,構(gòu)建個(gè)人助理(類似企業(yè)高管的個(gè)人助理,只不過這里是大語言模型)大模型才是出路,并且即可可能成長(zhǎng)為一下阿里、騰訊、字節(jié),如果是上面三家中的一家,那么市值翻個(gè)好幾倍也不在話下,個(gè)所以如何構(gòu)建好個(gè)人場(chǎng)景的衣食住行等相關(guān)服務(wù)至關(guān)重要,這對(duì)于大公司是有優(yōu)勢(shì)的,比如字節(jié)跳動(dòng),旗下的抖音有電商、本地生活、休閑娛樂以及住房等多個(gè)維度的產(chǎn)品矩陣,當(dāng)然在一兩個(gè)領(lǐng)域里能成功已經(jīng)是非常大的成功了,比如食這個(gè)領(lǐng)域里干掉美團(tuán),其實(shí)美團(tuán)的體量很大,但是美團(tuán)的壁壘并不高。
6.當(dāng)前規(guī)模的大模型門檻越來越低,生態(tài)會(huì)越來越好,更多的中小公司會(huì)依靠大模型帶來的能力,將企業(yè)提升一個(gè)等級(jí),這在民營(yíng)企業(yè)中最有可能出現(xiàn)。
7.未來大模型的規(guī)模會(huì)越來越大,涌現(xiàn)的能力會(huì)令人越來越吃驚,全民擁抱大模型的時(shí)代將在10年后來臨,當(dāng)前正處于大模型的進(jìn)化、技術(shù)應(yīng)用普及階段。