楊立昆是法國計(jì)算機(jī)科學(xué)家 Yann LeCun 的中文名,他任 Meta 首席人工智能科學(xué)家和紐約大學(xué)教授,他帶領(lǐng) Meta 的團(tuán)隊(duì)推出了開源大模型領(lǐng)域 Llama。他與 Yoshua Bengio、Geoffrey Hinton 一同獲得2018年的圖靈獎(jiǎng)。2024年3月28日,楊立昆在哈佛大學(xué)做了一場學(xué)術(shù)演講,其中提到了自己關(guān)于 AI 的7個(gè)觀點(diǎn)。
楊立昆在哈佛大學(xué)的演講現(xiàn)場
1.AI 應(yīng)該能夠理解、記憶、推理、規(guī)劃
動(dòng)物和人類可以通過嘗試和學(xué)習(xí),理解世界是如何運(yùn)作的,他們可以進(jìn)行推理和規(guī)劃,他們有常識(shí),這是今天絕大多數(shù) AI 系統(tǒng)做不到的。
盡管硅谷的炒作總是告訴你 AGI 即將到來,但我們實(shí)際上并沒有那么接近。我們目前擁有的 AI 系統(tǒng),在一些能力上極其有限。
如果我們有了接近人類智力的系統(tǒng),我們就會(huì)有能夠在20小時(shí)練習(xí)中學(xué)會(huì)駕駛汽車的系統(tǒng),就像任何17歲的青少年那樣;我們就會(huì)有家用機(jī)器人,能夠一次性學(xué)會(huì)清理餐桌和清空洗碗機(jī),就像10歲孩子那樣。
所以我們漏掉了一些重要的東西。我們應(yīng)該讓 AI 像人類那樣學(xué)習(xí)世界是如何運(yùn)作的,不僅僅是從文本中學(xué)習(xí),還應(yīng)該從視頻或者其他感官輸入中學(xué)習(xí)。
我們需要一個(gè)擁有世界模型,擁有記憶,能夠推理,能夠規(guī)劃行動(dòng)的系統(tǒng),而且它是可控和安全的,這就是目標(biāo)驅(qū)動(dòng)的 AI。
2. 現(xiàn)在的大模型沒有前途
LLM 以及圖像識(shí)別、語音識(shí)別、翻譯等,現(xiàn)在 AI 中所有很酷的這些東西,都?xì)w功于自監(jiān)督學(xué)習(xí)。
它的工作方式是,你拿一段數(shù)據(jù),比如一段文本,以某種方式轉(zhuǎn)換或破壞它,比如用空白標(biāo)記替換其中的一些單詞。然后你訓(xùn)練一些巨大的神經(jīng)網(wǎng)絡(luò)來預(yù)測缺失的單詞,這就是 LLM 的訓(xùn)練方式。
它們工作得很好,是因?yàn)?LLM 會(huì)在數(shù)十萬億個(gè) token 上訓(xùn)練,但這種東西會(huì)犯愚蠢的錯(cuò)誤。它們并不真正理解邏輯,如果你告訴它們 A 和 B 是一回事,它們不一定知道 B 和 A 也是一回事。它們并不真正理解排序關(guān)系的傳遞性以及類似的東西。它們不會(huì)做邏輯推理,你必須明確地教它們做算術(shù),或者讓它們調(diào)用工具來做算術(shù)。
它們對底層現(xiàn)實(shí)沒有任何了解。它們只是在文本上訓(xùn)練。它們只知道語言中包含的知識(shí)。但大多數(shù)人類知識(shí)實(shí)際上與語言無關(guān)。
它們也真的不能規(guī)劃,每當(dāng)它們看似可以規(guī)劃時(shí),基本上是因?yàn)樗鼈冇?xùn)練過類似的規(guī)劃,它們基本上只是重復(fù)一個(gè)非常相似的計(jì)劃。
3.目標(biāo)驅(qū)動(dòng)的 AI 系統(tǒng)
我們希望 AI 可以做分層規(guī)劃。
舉個(gè)例子,假設(shè)我坐在紐約大學(xué)的辦公室里,我想去巴黎。我不會(huì)做毫秒級的計(jì)劃,這是不可能的,因?yàn)槲也恢缹?huì)發(fā)生的情況。我是否必須避開一個(gè)我還沒看到的特定障礙?紅綠燈會(huì)是紅色還是綠色?我要等多久才能打到出租車?所以,我不能從一開始就計(jì)劃好一切。
但我能做高層規(guī)劃,我知道我需要到機(jī)場,并登機(jī),這是兩個(gè)宏觀動(dòng)作,對吧?然后再?zèng)Q定較低層次的子目標(biāo),我如何到達(dá)機(jī)場?嗯,我在紐約,所以我需要下樓到街上打車,就是下一層的目標(biāo)。我如何到達(dá)我要去的街道,我必須坐電梯下去,然后走到街上?我如何去電梯?我需要從椅子上站起來,打開辦公室的門,走到電梯,按下按鈕。
所以你可以想象有這種分層規(guī)劃在進(jìn)行。我們完全不費(fèi)力氣就能做到這一點(diǎn),動(dòng)物也能很好地做到這一點(diǎn)。今天沒有任何 AI 系統(tǒng)能夠做到這一點(diǎn)。
所以我設(shè)計(jì)了目標(biāo)驅(qū)動(dòng)的 AI 系統(tǒng),結(jié)構(gòu)如下:
目標(biāo)驅(qū)動(dòng) Al 的模塊化認(rèn)知結(jié)構(gòu)
在這個(gè)架構(gòu)中,有一個(gè)感知模塊,用來觀察世界,并將其轉(zhuǎn)化為對世界的表示;有一個(gè)持久記憶模塊,用來記錄事實(shí);有一個(gè)世界模型,這是系統(tǒng)的核心;有一個(gè)行動(dòng)模塊,一個(gè)成本模塊,一個(gè)配置器。系統(tǒng)的工作方式如下: