diff --git a/content/posts/2025-12-29_history_of_intelligence_3.zh-TW.md b/content/posts/2025-12-29_history_of_intelligence_3.zh-TW.md new file mode 100644 index 0000000..f8e9315 --- /dev/null +++ b/content/posts/2025-12-29_history_of_intelligence_3.zh-TW.md @@ -0,0 +1,118 @@ +--- +title: "《智慧簡史》筆記(三)" +date: 2025-12-29 +draft: false +--- + +智慧的第一個重大突破是移動。 + +寒武紀到來,新的環境激發了新的升級。主要是節肢動物稱霸了海裡,各種動物之間激烈捕食對方。我們的祖先那時候是在海裡,長得像魚的脊椎動物。 + +因應這種激烈的你追我跑,純粹靠上一代的反射動作已經不夠支應。現在決策神經全部整在一起,變成稱作腦袋的東西。腦袋現在需要新的功能。 + +1896 年,桑代克(Edward Lee Thorndike)想研究怎麼教小朋友最有效率。但哈佛大學不想給他小朋友研究。 + +他沒小朋友只好去研究雞、貓、狗。他設計了一些密室逃脫箱。箱子裡的動物可能要拉拉桿、按按鈕、或做一些特定姿勢,門就會自動或手動開啟。動物就能出門領賞。 + +他本來想研究動物可不可以透過觀察同類,學會開門。實際發現沒辦法這樣(劇透:需要之後靈長類的另一種升級,才能解鎖這個技能)。 + +實際上貓會在密室箱裡嘗試各種可能性,最後可能碰巧碰到正確的機關而開門。 + +同樣的密室再重複做一次時,貓嘗試的時間變短了。更多重複時,貓一下子就找到正確機關開門了。某種程度,貓透過嘗試錯誤,學會了正確開門的方式。 + +這實驗驚人的地方是,給定夠多的嘗試,貓可以學會超級複雜的一系列動作。但這個學習的機制都是嘗試錯誤:好的結果強化了正確的行為。 + +看完他的研究方式,我完全能理解哈佛大學的決定。應該沒有人想被他這樣實驗。 + +桑代克接下來把腦筋動到魚的身上。因為魚是比雞、貓、狗、人更古老的脊椎動物祖先。書裡面說魚是最被人們歧視的脊椎動物。人們都說魚笨,說他們金魚腦。 + +桑代克設計了一個水族箱,裡面有幾道有開口的玻璃。魚會在水中亂走,撞到這些隱形牆壁,但找到開口就可以進到下一關。桑代克可以測量魚過到哪一關要花多少時間。 + +一樣魚可以透過試誤學習,最後速通全部關卡。這個實驗後人不斷重製,發現魚可以記得這些路線長達「多年」。 + +試誤學習屬於脊椎動物特有。在線蟲、蛞蝓這些兩側對稱但還沒長出脊椎的動物並不存在。 + +1951 年,馬文明斯基(Marvin Minsky) 想試著把桑代克動物實驗的結論,轉化成電腦演算法。演算法的名字縮寫( stochastic neural analog reinforcement calculator, SNARC)和零知識證明的 snark 好像,不知道為什麼大家這麼愛這個縮寫。 + +明斯基用這個演算法學習怎麼走迷宮。演算法是一個類神經網路,只要 AI 通過迷宮,程式就會強化最近有激發過的突觸。這樣理論上要可以讓正確的結果強化正確的行為。 + +但這演算法實際上不成功,除了走迷宮之外沒辦法再處理更複雜的題目了。 + +想像拿這套試誤機制來下棋。一開始 AI 會隨便亂下,然後下贏或下輸會來評斷前面的棋步是好棋還是壞棋。下久了 AI 總會學會下棋吧? + +問題在於,一盤棋可能幾十步,輸贏是最後才發生的。那到底是哪步棋讓你贏或害你輸的?是你的第一手天元?中間翻盤那手?還是結尾大意的一手?這是強化學習會遇到的歸因問題(Credit Assignment Problem) + +第一次升級的兩側對稱動物也遇過這個問題。當食物出現時,同時有聲音或光線,那哪樣才是有食物出現的訊號?他們用的急就章是這樣:同樣情況下,選較新的刺激、教強的刺激、已關連過的刺激。 + +第一次升級的歸因問題,其實解決的是訊號和獎勵「同時」出現的歸因問題。但寒武紀的魚和下棋,他們要解決的是獎勵在訊號「一段時間之後」的歸因問題,稱為時序歸因問題。 + +1984 理查薩頓( Richard Sutton)提出了一個解決方法。他把系統分成兩個角色:一個行為者(Actor)和一個評斷者(Critic)。行為者負責下棋,評斷者負責評估這個盤面的勝率。 + +多了這個評斷者,可以在棋還沒下到終局前,先評價一下前幾步棋下得好不好。 + +他的演算法叫:時序差分學習(Temporal difference learning,TD learning) + +時序差分學習最後在雙陸棋上(Backgammon)取得成功。這裡要學到最重要的經驗是:要強化正確的行為,不能用「實際」的獎勵,而是用「預測」的獎勵。因為實際的獎勵通常來得太晚了,而預測的獎勵已經能告訴我們很多重要的事。這個洞見也順手解決了一個神經科學的謎團。 + +1950 年代的科學家發現,可以用電極去刺激老鼠的多巴胺分泌中樞。只要老鼠推拉桿的時候,對多巴胺中樞電幾下,老鼠會每小時推五千下拉桿,連推 24 小時。 + +而且如果要老鼠選擇食物或多巴胺拉桿,老鼠永遠是寧願挨餓選多巴胺。 + +但多巴胺並不會產生愉悅感。所以追求多巴胺並不是因為喜歡。 + +後來的猴子實驗發現,多巴胺並不對實際的獎勵反應,而是對預測的獎勵反應。原本神經科學家對實驗的結果感到困惑,但撒頓的同事把時序差分學習的結論套進去才得到解釋。 + +我們的人腦是在演化中的屎山代碼中,一層一層套件堆砌出來的。下視丘算是古老兩側對稱動物腦袋的豪華版,他掌管效價(Valence)的感知和反應。寒冷的時候會發冷顫,熱的時候會流汗。下視丘也會檢測血液中的飢餓訊號,出發飢餓反應。他掌管真實報酬的部分。 + +豪華版的部分是下視丘會送多巴胺給基底核。其他比較高級先進的腦袋部分,最後都要來和基底核匯報。基底核掌握了我們全身的行動。而基底核就是想盡辦法得到多巴胺,滿足下視丘的索求。 + +但從時序差分學習來看,如果基底核不應該是學來自下視丘的真實報酬,而是要學預測的未來報酬。現在主流的理論是說基底核裡面有一塊迴路,專門實作了時序差分學習。基底核本來只學下視丘的回饋,逐漸變成學會在下視丘開口之前就滿足其需求。 + +## 模式辨認 + +有了基底核和強化學習還不夠。 + +掠食者奇蝦就半掩在海底的沙子裡,魚類祖先不能等他衝出來才開始跑。 + +這時候大家已經有光線和化學物質的感測器了。而且比兩側對稱動物時代進步一些。以前是用單一細胞感測的,但現在用多個細胞感測。這帶來一個新的問題:要怎麼詮釋多個細胞的訊號? + +這難的地方是掠食者的身影會用不同角度和不同的背景進到感測器。所以要詮釋感測器的訊號,必須要能在物體旋轉時不會認錯(Invariance problem),同時也要能夠容忍各種必要的背景噪音。 + +我們知道魚類腦袋長出了一些皮質層,來詮釋視覺和嗅覺的訊號。 + +人們模仿了哺乳動物的視覺皮質層,比魚類的先進一些,開發出了捲積神經網路(CNN)。CNN 勉強解決了物體縮放的問題,但沒辦法真的理解 3D 物件的旋轉。 + +2022 的實驗,訓練金魚去敲青蛙的照片來得到食物。他們可以證明魚可以從不同的新角度辨認出同樣一隻青蛙。到底金魚腦是怎麼運作的,現在人們還不太明白。 + +## 好奇心 + +時序差分學習在雙陸棋成功後,不斷被拿去挑戰其他的電玩遊戲。在這些 90 年代的簡單遊戲之中,時序差分學習大多取得成功。但有一款遊戲:蒙特蘇馬的復仇,時序差分學習表現不佳。 + +這款遊戲要求玩家去探索不同房間,雖然沒有立即的利益,但有些房間才能進入後面的關卡。這反應出強化學習的第二個挑戰:探索與利用權衡(Exploration Exploitation trade off)。 + +只往眼前報酬最高的地方走(Exploitation),會被困在某個局部最佳處。有些環境需要先利益放一邊,純粹好奇心探索,才能得到更長遠的獲利。 +原版的時序差分學習是有實作簡單的探索,但只是偶爾讓主角亂走。但遊戲中有用的探索需要完全走到一個陌生房間。 + +現在的 AI 是把驚訝(surprise)也當成報酬的一環。當看到一個沒看過的新房間時,本身就是一種報酬。這樣 AI 就會探索房間了。 + +脊椎動物看起來也是用驚訝當報酬。桑代克的傳人史金納,發現要讓老鼠推更多次拉桿的最好方式,不是讓每次拉拉桿都會有食物掉出來。而是要隨機掉食物,老鼠陷入好奇之後就會狂拉拉桿,期待有食物會掉出來。 + +## 空間感 + +我們人有辦法在半夜抹黑去上廁所,是因為腦袋對空間有建模。 + +魚也會記得一些食物的地點。海馬迴負責這個功能。移除海馬迴的魚就不記得地點了。 + +## 總結:智慧的第二次重要升級是「強化學習」 + +身為一隻寒武紀的脊椎動物,面臨眾多節肢動物的追捕軍備競賽。需要各種新型的智慧功能,以取代前代反射系統的不足。 +- 多巴胺實質成為強化學習中,作為報酬的溝通標準。 +- 基底核實作了時序差分學習。讓動物可以用多巴胺玩強化學習 +- 新增好奇心,解決探索與利用權衡 +- 加入模式辨別功能:大腦新增皮質層,能分辨掠食者的光線與化學訊號。 +- 對時間的感知:這應該是強化學習與試誤實際帶來的好處。不只知道什麼情況該做什麼,而是「何時」要做。 +- 對三度空間的感知:新增 3D 地圖。這也是實作在皮質層。 + +--- + +下回預告:泥盆紀的爬蟲類吃到飽,與土遁而出的哺乳類祖先演變出新的超能力。 \ No newline at end of file diff --git a/content/posts/2026-01-11_history_of_intelligence_4.zh-TW.md b/content/posts/2026-01-11_history_of_intelligence_4.zh-TW.md new file mode 100644 index 0000000..fe7a1b8 --- /dev/null +++ b/content/posts/2026-01-11_history_of_intelligence_4.zh-TW.md @@ -0,0 +1,77 @@ +--- +title: "《智慧簡史》筆記(四)" +date: 2026-01-11 +draft: false +--- + +時間來到了四億兩千萬到三億七千五百萬年前的泥盆紀。魚類祖先長出了硬質化的盔甲,有些開始變得大隻,變成鎧之巨魚。本來是被追獵的物種慢慢變成獵食者。 + +節肢動物和無脊椎則慢慢變小,有些也長出硬殼。極端的節肢動物決定出海,到地面上討生活。 + +為什麼他們之前不上陸但現在突然有辦法了?因為陸生的植物先幫他們開路。陸生植物演化出葉子,能更佳吸收陽光。發展出了種子可以到處擴散。最後植物開發出了維管束:樹的高度可以長到數公尺以上。植物強壯的根系可以穩固土壤,讓節肢動物生活。 + +陸地本來是魚不敢碰的地方,不小心擱淺會致命。但現在陸地有蟲有草,報酬值得冒風險,魚祖先從腮變出肺,用他們短短的鰭慢慢來陸地討吃。一開始是從一個小水窪跳到另外一個。 + +泥盆紀晚期有個滅絕事件,地球變得冰冷。有些在溫暖水窪還幸運活下來的魚,最後捨棄了腮,長出了四隻腳,變成四足類。 + +四足類的一支仍生活在溫暖小水窪旁邊,變成今天的兩棲類。另一支往陸地深處走去,變成後來的羊膜動物。最早的羊膜動物長得像現在的爬蟲類。 + +到了三億五千萬到兩億五千萬年前的石炭紀和二疊紀,是羊膜動物大爆發的時候。 + +想在陸地上生活,要面臨的挑戰是日夜的巨大溫差。在水裡,日夜的溫差在水深處其實沒什麼差別。 + +早期的羊膜動物,長得像魚,怎麼處理溫差?太冷是不是?自己移動到溫暖的地方就好。 + +羊膜動物後來長出一支,叫爬蟲類。他們有個對付溫差的新策略:躺平。晚上太冷了就不要動,關機減少代謝。 + +因為爬蟲類晚上都躺平,所以只要有哪種生物晚上還能活動,就有源源不絕的爬蟲類吃到飽。 + +有隻外表很像哀傷小恐龍的獸孔目,看到了這種機會,想說來做一場豪賭。他們使用巨大的能量把自己的身體加熱,讓他們在寒冷的夜晚也能活動。 + +獸孔目加熱的代價是必須要大量進食,才能維持能量的消耗。但活生生的爬蟲類吃到飽不就在那? + +所以在二疊紀,獸孔目的豪賭是賭贏了。一堆能吃的爬蟲類加節肢動物,把他們養成二疊紀最成功的陸生生物。他們也開始長出毛來加強保暖,看起來像是毛茸茸蜥蜴。 + +不過,獸孔目的好日子結束在二疊紀和三疊紀之間的大滅絕。滅絕的原因現在還有爭議,但確定的是 96% 的地球生物滅絕。這也代表維持獸孔目能量的食物不見了。 + +爬蟲類因為食量小小,所以在這次滅絕中有活下來,還活到了今天。獸孔目,就滅絕了。 + +但有一支嬌小、吃素的獸孔目分支,叫犬齒獸亞目。他們本來都躲在地洞裡,躲避大隻的獸孔目。犬齒獸亞目有活過大滅絕。 + +大滅絕之後,整個爬蟲類的氣勢都翻過來了。他們變得超大隻,長出尖牙和利爪,變成恐龍稱霸地球。 + +犬齒獸亞目則躲在地洞裡,變得嬌小再嬌小,身長不到一公尺。外型看起來像老鼠或松鼠。他們只在半夜裡悄悄獵食昆蟲。犬齒獸亞目最後變成日後的哺乳類。 + +鋪陳了兩億年的演化史,可以來談智慧的部分了。 + +這些早期的哺乳類躲在「地洞」裡這件事非常關鍵。這讓他們在獵食時,擁有「先手」優勢。 + +這先手優勢不得了。 + +哺乳類開始在腦袋加裝了新皮質,這讓他們得到了新的超能力:模擬。在出手之前,他們能在洞裡觀察環境,並且使用腦袋模擬整場獵食的經過。只要他們一出手,戰鬥就已經結束了。 + +強化學習讓脊椎動物可以做中學。模擬可以早期哺乳類可以還沒做就學,靠想像學習。 + +那魚跟螃蟹也躲在珊瑚礁或水草間,怎麼他們沒學會模擬這招?目前有兩種說法。第一種是模擬要有用,必須要能看到周遭很多的環境。在陸地上,即使是在夜晚,能看到的距離也比水中多幾百倍。因此模擬在水裡用處不大。 + +第二種說法是模擬的運算量很大,運算時間長。神經元的電信號對溫度很敏感。溫度高信號才傳得快。溫血科技需要先點開,才能解鎖更多算力。這個說法可以解釋魚在水裡住那麼久了,還是沒點出模擬來。但鳥類是唯一非哺乳類,也有解鎖模擬的 -- 因為鳥也有溫血。 + +模擬基本上就是給我們一個腦內小劇場,可以在規劃時,比較各種可行的方案。因此比較兩側對稱動物和脊椎動物,早期哺乳類的模擬是解決強化學習中歸因問題的更進一步方案。 + +你也用腦內小劇場能對過去的事情進行「反事實學習 Counterfactual learning」。懊悔或是模擬人生中採取了另外一條路發生了什麼事。 + +電腦的類神經網路可以拿來辨識圖片,也能生成圖片。這個啟發是生成和預測是一體兩面的。研究者推測,人們會用模擬的畫面來比較感官收到的實際資訊。 + +回憶(Episodic memory)是我們記得過去事情的方式。這必須和記得怎麼說話、打字、打球這種工作記憶(Procedural memory)區分。 + +我們並不真的擁有回憶。回憶只是在腦袋中生成的近似過去事件的幻覺。作用機制和想像未來的情境是一樣的。我們記憶中丟失的細節會被自動腦補進去。在一些翻案計畫中,77%被錯誤定罪的人都是因為錯誤的目擊證人證詞。 + +最後模擬也能幫助精細的肢體動作。貓在動作皮質受損之後,就會沒辦法精準的做出一些高難度動作。 + +--- + +我發現在讀這本書的時候,我最感受到娛樂感的應該是演化的部分。雖然我也是記年代苦手,還沒累積足夠的脈絡能記得幾億年前發生什麼事,但一堆動植物的故事對我來說是有趣的。 + +其次是腦科學的部分吧,但這要區分一下。知道自己哪些習以為常的事情其實是某種精煉幾百萬年的超能力,這些還蠻有趣的。知道腦袋的能力和限制也蠻有用。但那些腦袋哪個區是什麼功能,是什麼實驗發現和支持這件事,就會覺得可能不是我現在想熟練的事。 + +最後是 AI 的部分,是我最看不太下去的。並不是書寫得不好,而是很多事還在發展中,可能過幾年再回頭看書有沒有講對比較有趣。 diff --git a/content/posts/2026-01-14_history_of_intelligence_5.zh-TW.md b/content/posts/2026-01-14_history_of_intelligence_5.zh-TW.md new file mode 100644 index 0000000..84c2d3d --- /dev/null +++ b/content/posts/2026-01-14_history_of_intelligence_5.zh-TW.md @@ -0,0 +1,128 @@ +--- +title: "《智慧簡史》筆記(五)" +date: 2026-01-14 +draft: false +--- + +恐龍滅絕之後迎來了哺乳類的時期。大多的哺乳類腦容量沒有再比早期的哺乳類變化太多了。例外是大象、海豚、和早期的靈長類,他們腦容量暴增。 + +靈長類要那些腦容量做什麼?社交腦袋理論(提出者包含鄧巴數的鄧巴)說那些腦容量是要拿來搞關係的。如果把靈長類的平均團體大小和腦皮質大小作圖,會發現團體越大的靈長類,腦皮質越多。 + +然而這種團體大小和腦皮質的關係只對靈長類有意義。一團就數千隻的水牛,腦容量沒獨居的麋鹿大。 + +所以關鍵問題是:靈長類聚在一起都在瞎忙些甚麼事?或群聚的意義是什麼? + +早期的哺乳類也會群聚,老鼠小朋友會互相玩耍、打架,訓練一下動作皮質。 + +群聚的話可能有些生存優勢,找食物比較便利。但如果遇到時機不好的時候,食物不夠分了,怎麼辦? + +團體內互相廝殺太傷元氣。因此動物發展出玩訊號賽局的招數。鹿或羚羊去撞對方的角。大家比劃一下,點到為止。大家約好投降的姿勢是什麼。這樣可以避免血光之災,浪費能量,又能分配資源。 + +有了這些訊號賽局的技巧,哺乳類會發展出不同的組織型態:一公一母、一公多母、多公多母。團體內也有各種階級形式。 + +那靈長類的團體是特別在哪裡? + +靈長類生活在樹冠層,變成吃水果維生。他們趁水果快熟還沒掉到地上之前就趕快吃掉。這讓他們得到好多好處。 + +第一是沒什麼其他生物的競爭者。再來他們獲得特別高的卡路里,可以拿來養肥腦袋。最後是時間很多。大多的動物幾乎醒著的時間得一直覓食,但靈長類可以每天花 20 趴時間專門社交。 + +因為這樣的背景,靈長類腦袋的軍備競賽不再是躲避天敵或覓食,而是拿來 -- 搞政治!越能打好關係的靈長類,越能在群體裡複雜的猴際關係中取得資源。 + +好,那要打好猴際關係,腦袋需要長出什麼新的超能力呢?到底靈長類的腦袋比哺乳類做了什麼新硬體升級呢? + +## 靈長類的腦袋硬體升級 + +比起一般哺乳類,靈長類有更大的後腦、基底核、和新皮質 --- 只是硬體變得豪華。真正新的東西,是有一塊前額葉皮質(granular prefrontal cortex, gPFC)。先前的升級有塊 agranular prefrontal cortex aPFC ,那塊壞掉的患者比較嚴重:會變啞巴,不是因為失去語言能力,而是失去回話的意圖。aPFC 和模擬有關係。 + +那失去 gPFC 的人呢?好像乍看之下沒什麼事。如果說有什麼的話,這個人好像 IQ 還增加了。 + +後來因為 fMRI 的研究,人們比較了解 gPFC 的用途。 + +2015 的研究,受試者被要求從一組中性的詞,例如:鳥、餐廳,然後去告訴研究者不同的句子,描述一個自己在和那些詞有關的場景。 + +gPFC 受損、但 aPFC 和海馬迴正常的受試者,有辦法想像非常複雜的場景。但他們沒辦法想像自己在那些場景中。有時句子完全忽視自己的存在。 + +gPFC 受損的人在辨認鏡子中的自己也有障礙,堅信鏡子裡的人是其他人。 + +這些實驗顯示 gPFC 的功能是把「自己」帶入模擬的腦內小劇場中。這裡的自己包含:自己的意圖、情緒、人格、知識等等。 + +## 靈長類時代超能力 + +gPFC 給我們的第一個超能力是理解我們自己在想甚麼。 gPFC 會去詮釋 aPFC 的意圖。這讓我們去「思考自己的思考」,又稱作 metacognition +第二個超能力是我們有辦法推論其他人的知識和意圖。這有個名字叫「心智理論(Theory of Mind)」 + +著名的 Sally Ann 測試是這樣: + +- 莎莉有個籃子,安有個箱子。 +- 莎莉有個彈珠,莎莉把彈珠放到籃子裡。 +- 莎莉離開現場去散步。 +- 安把彈珠從籃子拿出,並放到箱子裡。 +- 莎莉回來了,他會去哪裡找彈珠呢? + +要正確回答這個問題,必須要能意識到莎莉和你的知識不一樣。人類小孩大概四歲能正確回答這個問題。 + +gPFC 受損者回答莎莉安這類問題有困難。他們也不太會辨認別人的情緒,不太會區分謊言和笑話,也很不會騙人。 + +到底我們是怎麼理解其他人的想法的呢?柏拉圖說我們是先了解自己的想法,然後再用這層了解去理解別人。這個思路現代的名稱是「模擬理論(Simulation theory)」或「社會投社理論(Social Projection Theory)」(暫譯) + +些微的證據是在某些需要了解我們自己意圖和他人意圖的任務中,兩者用到的腦袋區域是同樣的靈長類特區。 + +目前心智理論在演算法上到底怎麼運作還不知道。這看起來是某種 AI 聖杯。 + +## 衍生超能力 + +智慧的第四個突破 :也就是 gPFC 的能力。總的來說有個名字綜合他,叫 Mentalizing 。中文我看到有人翻「心智化」。但這篇文章我想叫他移魂大法。 + +移魂大法幫靈長類及其後代開了兩樣新的超能力:模仿學習和預測未來需求。 + +### 模仿學習 + +模仿學習是靈長類可以「使用工具」的關鍵。 + +珍古德發現黑猩猩會折斷樹枝、摘除葉子、搗入蟻窩,並享用新鮮的白蟻。 + +但大象也會捲起樹幹趕蒼蠅和抓癢,狐獴會用石頭敲開堅果,烏鴉會用樹枝戳幼蟲吃。隆頭魚會用石頭砸開蚌殼。他們抗議了,憑甚麼說黑猩猩那招比較厲害? + +第一是那些來抗議的動物就只會那麼一招,但黑猩猩會用 20 幾種工具。 + +黑猩猩還懂「加工」,戳白蟻窩的樹枝有先摘除葉子、弄短、削尖。 + +最後是其他動物的工具都是天賦技能。兩隻不同種類的隆頭魚都會同樣的招式。黑猩猩的工具是學會的,不同群體間有他們獨門祖傳的招式。某個天才發明了某種工具之後,一隻教一隻傳下去。 + +靈長類的移魂大法,能夠讓他們看著老師的動作,模擬他們的行動,並理解他們的意圖。只要光觀看別人的動作就能學會技能。 + +### 未雨綢繆 + +早期的靈長類靠吃樹冠層的水果維生。但要在果子掉到地上之前吃到他們並沒想像中容易。 + +他們會去記哪裡的果子差不多熟了,在夜晚安排紮營地時,會安排離明天要採集的地方近一點。 + +所以這裡靈長類必須展現出優異的行程規劃和評估未來需求的能力。他要能用移魂大法穿越到未來,想像自己餓的樣子。 + +老鼠抗議了。老鼠說他也為了要過冬,會提前囤積堅果。難道這不算未雨綢繆? + +這裡的問題是我們不知道老鼠在囤積食物時,是不是有想過他冬天肚子會餓。 + +我們知道的是這樣。在實驗室養的老鼠,他們一輩子沒因為冬天餓過肚子。但只要冷氣調降個幾度,這些老鼠就會開始囤積食物。 + +這說明老鼠的行為是先天寫死的,並不是根據實際情況去評估的。 + +那猴子會評估未來需求的證據是什麼呢? + +2006 的實驗這麼設計。給定兩個選項:小盤食物和大盤食物。兩種受試者:猴子和老鼠。一般情況下,猴子和老鼠都會選大盤食物。 + +不過大盤食物裡面有葡萄乾,吃了會口渴。下個實驗這樣設計。吃小盤的可以 15~30 分喝到水;吃大盤的要一小時後才喝得到水。老鼠一樣是選大盤的。但猴子,有辦法判斷之後會口渴,知道現在要忍耐先選小盤的。 + +## 結論 + +人類智慧演化的第四個階段是 Mentalizing 。和先前的幾個階段不同,先前的一次升級都是加入好幾種不同的功能。但這次的功能:心智理論、模仿學習、預測需求,則都是移魂大法衍生出來的湧現功能。 + +所以靈長類會算賽局理論和貝爾曼方程式?? + +我自己在看這部分時,一直覺得遠距工作困難的地方是我沒有辦法想像對方在做甚麼。他們的心情怎麼樣?對工作充滿熱情還是已經失望? + +雖然我自己的風格是盡量不要對鍵盤的另一邊施展讀心術,可能見面也不會。但如果照心智理論來看,好像我們就是天生有意識無意識的推測一下別人意圖。 + +所以可能要約 check-in 。但又有些人覺得你不 check-in ,你是個冷淡的人,被你冷死。有些人又覺得 check-in 是在浪費他的時間,何不專心 ship 。 + +可能這種煩惱也是多餘的,以後大家都跟 Agent 工作就好了。 diff --git a/content/posts/2026-01-15_history_of_intelligence_6.zh-TW.md b/content/posts/2026-01-15_history_of_intelligence_6.zh-TW.md new file mode 100644 index 0000000..e68a3db --- /dev/null +++ b/content/posts/2026-01-15_history_of_intelligence_6.zh-TW.md @@ -0,0 +1,178 @@ +--- +title: "《智慧簡史》筆記(六)" +date: 2026-01-15 +draft: false +--- + +從靈長類演化到人類這一段,腦袋除了堆疊更多的皮質、更大的基底核,每種功能都更多一點更大一點之外,沒有什麼新東西了。硬體上只有量變沒質變。 + +超能力的方面,古人到近代心理學家羅列了一堆「就人類最特別」的能力:理性思考、預期未來需求、用工具。在經歷各種研究之後,如同前面章節所見,大多的超能力也都不是只有人類才有。真要講的話:就是人類會說話、使用語言溝通。 + +這裡的溝通要稍微講究一下。因為其他生物又要抗議了。 + +單細胞生物會使用化學訊號分享基因或關於環境的資訊。蜜蜂會跳舞分享食物的方向。老鼠會吱吱叫來表達危險或興奮。黑猩猩會用手勢來表達需求。長尾猴會有不同的聲音表達不同的威脅,像「獵豹!」或「老鷹!」之類。 + +人類的語言有兩個地方相異於其他動物的。第一個是我們可以指定一個物件,給予該物件一個任意宣告式標籤(declarative label)。例如:大象、樹、跑。 + +黑猩猩的手勢和長尾猴的叫聲是與生俱來的。不同群體的黑猩猩或長尾猴有同樣的手勢和叫聲。被剝奪社交互動的黑猩猩和長尾猴也一樣。 + +「異議あり」狗抗議。人類說坐下的時候,狗也會坐下。狗可以學會指令,而且沒在管這些指令是英文還是中文。 + +語言學家做了一些區分。狗之所以服從指令,是因為有獎賞。這是用時序差分學習學會把指令與獎賞連結在一起。狗學會的標籤是命令式標籤(imperative label),是因為利害關係綁定的,而不是能把任意物件或行為與標籤綁定。 + +結論:沒有其他動物能學會宣告式標籤。 + +人類語言第二個特殊的地方是文法。「甲打乙」和「乙打甲」是不同的意思。人類可以用有限的詞彙組出幾乎無限的意義。 + +人類操著各種不同語言。但即使是與世隔絕五萬年,深山雨林中的原住民也使用和其他人一樣複雜的語言。都有宣告式標籤和文法。 + +不過我們這樣也只能說明目前只看到人類會用「語言」,不代表其他動物不會。也許人類只是碰巧會? + +到底是人類的腦袋結構比較特別所以會講話?還是語言是種文化現象,剛好五萬年前有個天才學會了然後世世代代傳下來? + +要回答這種問題,不如來試著教我們演化上的親戚黑猩猩講話。如果他們學不會,代表我們腦袋真的比較特別;如果他們學會了,那很可能語言就是文化現象。 + +1930年代人們就開始做這件事。我們沒辦法真的教黑猩猩講人話,因為他們缺乏必要的聲帶結構。所以這類的研究都是教黑猩猩打手語。 + +各種實驗和軼事顯示的結果不是那麼清楚。黑猩猩的確展現某種程度的語言能力。但語言學家、 靈長類學家、心理學家的論戰至今仍然持續:到底黑猩猩表現出的語言行為,標籤是算宣告式還是命令式,他們那些超簡單的句子能不能算是文法。 + +至少能知道的是,猩猩再怎麼用力訓練,語言能力也沒超越小孩。人類在語言上是有些先天的天份的。 + +如果語言能力為人類所特有,那語言又是怎麼幫人類爬上食物鏈頂端的呢? + +語言幫我們傳遞觀念、想法、思想到別人身上。能把我們皮質層的模擬小劇場的畫面傳送給別人。書裡面有這麼一個總複習的表格,總結這些最近幾次超能力升級的關係: + +- 早期脊椎動物的強化學習:向自己的真實行為學習 +- 早期哺乳類的模擬:從自己的想像行為學習 +- 靈長類的心智理論:從別人的真實行為學習 +- 人類的語言:從其他人的想像行為學習 + +能夠分享想像的能力是很強大的,有人說人們分享的神話(myth)甚至是人類現代文明的基礎。金錢、神明、企業、國家,都是只存在人腦的抽象概念。 +這個思路一開始是哲學家 John Searle 闡述,然後被哈拉瑞(Yuval Harari)捧紅。後者曾說:兩個從來沒見過面的律師,可以合力為一個從沒見過的陌生人辯護,是因為他們相信法律、司法正義、人權的存在,還有相信作為律師費支出的金錢。 + +如果人類只透過直接的人際關係協調,那人類組織的大小只會到 150 多人。然而,透過共同的神話協調,人的組織大小可以到無限大。 +要能夠使用共同的神話,語言是不可或缺的。這是為什麼語言讓人類文明可以累積。 + +--- + +那語言在腦袋裡是怎麼運作呢? + +人們從腦袋受傷的患者學到:布洛卡區受損的患者,能聽得懂語言,卻不會講話;而威尼卡區受損的患者,講話沒問題,但聽不懂別人說話。 +所以語言就是這兩區負責的?沒那麼簡單。 + +先前說過我們並沒有比靈長類多新的硬體。他們也有布洛卡區和威尼卡區,但沒來放語言。 + +靈長類會用手勢、吼叫(hoot)或吱吱叫來溝通。但這些區域放杏仁核。 + +曾有人類患者面部癱瘓,沒辦法主動微笑。但聽到笑話時他有辦法笑。人類的哭和笑和靈長類的吱吱叫都是放杏仁核。哭和笑是和語言不一樣的古老靈長類迴路。 + +人類的嬰兒會哭會笑,但只要小時候沒學語言,長大就學不會了。 + +所以神經生物學上,語言還是個難解之謎。人腦沒比猴腦多新硬體,所以語言不來自腦袋的新硬體。語言也不來自人類對喉部或面部特有的皮質控制。語言也不是靈長類原本溝通方式的進化版。 + +那到底語言是怎麼解鎖出來的呢? + +有種理論是說腦袋裡面並沒有完整的語言系統,而是只有語言教材。 + +鳥並不是一出生就會飛。每隻鳥都要獨立學會飛。他們會揮舞翅膀,試著滑翔,重複夠多次後才學會飛。 + +為什麼基因不內建完整的飛行軟體?因為飛行是一件複雜的事,全部寫到基因裡可能不太有效率。所以基因只保留教材的部分:想從高處跳下的直覺、拍拍翅膀的直覺、滑翔的直覺。這些足夠讓所有的鳥寶寶學會飛了。 + +人類身上有哪些內建的語言學習教材呢? + +四個月大的寶寶會進行原始對話( proto-conversation)。他們會和照顧者一來一回交換聲音、表情、和手勢。 + +九個月大時,他們會有一個新的行為:對物體的聯合關注(Joint attention to objects)。他們會注意某樣物體,然後用非言語的方式確認家長和他是看著同樣一個物體。 + +研究者想盡辦法,確認了這個行為的意圖不是想要取得某樣物品,或純粹要討好家長。這個行為也只有人類嬰兒才有,黑猩猩沒有。 + +原始對話和聯合關注的目的不是為了模仿學習,也不是為了社交,而是要把物體貼上語言的標籤。 + +如果一歲以下有越多聯合關注的活動,嬰兒在十二個月後的詞彙量會比較多。 + +人類也有先天內建問問題的能力,而且是問和別人內心模擬的問題。 + +即使是最有語言天份的黑猩猩,他們問的問題都只是要吃或要玩。但人類嬰兒在還不會建構完整句子時,就會問「想要這個嗎?」「會餓嗎?」這些關於別人內心世界的問題。 + +所有語言的問句都有抬升的語調。這顯示「問句」本身在基因的語言教材中有根本性的地位。 + +被剝奪所有外界接觸的嬰兒有基本的情緒表現,但不會學會語言。因為基因的語言教材需要有老師教。 + +隨著這個語言教材啟用,威尼卡區布洛卡區這些古老的皮質層就會拿來安裝學到的語言。他們只是預設的安裝路徑而已。 + +失去左腦的小朋友仍然可以學語言,他會用其他右腦的皮質層裝語言。大概有一成的人口,他們語言是裝在右腦而不是左腦。 + +更新的研究甚至推論威尼卡區布洛卡區可能只是個語言的集合點。實際上語言可能是散佈各個皮質層或甚至在基底核。 + +推論是這樣:大腦沒有語言器官,就像鳥腦沒有飛行器官一樣。問大腦的語言區在哪就好像問我們大腦的籃球區還是吉他區在哪一樣。語言可能不是單一局處負責的,而是跨部門的協調合作完成。 + +這可以解釋說為什麼人腦和猴腦幾乎一模一樣。我們有辦法學語言,猴子也該有辦法學會。但為什麼猴子學不會?因為他們沒有內建教材。他們嬰兒不搞原始對話和聯合關注,所以語言成就有限。這就像不會想從高處跳下,也沒有拍拍翅膀直覺的鳥一樣學不會飛。 + +--- + +好,到目前為止,我們知道人腦和猴腦沒那麼多差別。語言很棒,可以分享想像的畫面、累積文明什麼的。為什麼就人類最特別? +怎麼猩猩、小鳥、鯨魚不也來學講話? + +演化上,有用的好東西會被不同的分支獨立演化出來。眼睛好用,所以很多動物都獨立演化出來。翅膀好用,所以蝙蝠和鳥都變出翅膀來了。鳥有學會模擬,也有其他靈長類之外的動物學會心智理論。語言,好像就人會。 + +也許先看人的語言是怎麼演化來的。書到這邊花了一個章節交代了人類的演化史。包含從東非大裂谷和猩猩分家、用火、用工具、直立行走、腦容量變大、流汗、跑馬拉松累死獵物、投擲石頭、早產等等。但化石給我們的資訊有限,目前知道這些: + +- 聲帶喉嚨結構是五十萬年前形成。尼安德塔人也有聲帶。如果在這個時間點以前有語言,那語言一定是很簡單的,或甚至只有手語。 +- 語言至少在十萬年前就有。考古有挖到一些雕像、壁畫、珠寶。這些東西需要象徵手法,應該是先有語言,才有象徵可言。 + +有些人認為語言是慢慢發生的,有人認為是瞬間發生的。有人認為是口說語言先,有人認為是手語先。 + +總之我們對人類語言起源這件事的了解沒比十九世紀法國哲學家厲害多少。 + +語言在演化論上也是個奇怪的存在。如果有個好功能,例如看得遠的眼睛,可以幫助生存,那這樣可以讓好眼睛的基因傳遍整個群體。 + +但語言是要拿來和別人講的,對自己好像沒什麼好處。除非其他人用語言來做一些有用的事。 + +是有一種演化的邏輯叫族群選擇(Group Selection)。也許有語言的甲族群會比沒語言的乙族群容易活下來,所以好基因會在甲族群傳下去。 + +但族群選擇其實有點爭議。有些現代生物學家承認其可能發生,但通常發生方式是有點複雜。 + +舉個例子來說明這個爭議。假設族群中有 10% 的利他個體:他們分享資訊、分享工具、食物的地點。但剩下 90% 是搭便車仔,只伸手拿但不回饋。那為什麼這些利他個體有辦法日子過得比較好?便車仔看起來比較滋潤,也比較有機會把基因傳下去。 + +那那些團體生活的動物到底是怎麼形成的?魚會形成魚群,讓群體受到保護。但實際上解釋魚群最簡單的解釋是因為邊邊的魚都想擠到比較安全的中心點,所以自利行為之下意外形成集體的保護。羚羊群也是一樣的道理。 + +但自利似乎沒辦法解釋語言利他可以變成族群選擇的狀況。 + +使用語言,最自利的方式就是說謊和隱藏資訊。如果一個群體裡面每個個體都這麼做,那那些不會講話的個體應該會因為對謊言免疫而受益。最終結果應該會是群體裡大家都不會講話。 + +所以我們可能又要寄望其他的利他演化機制。 + +一種是親屬選擇(kin selection)。兄弟姊妹會有 50% 機會和自己分享同樣的基因。孫輩有 25% 機率,而表親有 12.5% 機率。所以如果為了兩個兄弟姊妹犧牲,那對基因而言,這個利他行為是划算的。 + +著名的演化學家曾這麼說:「我很樂意為了我的兩個兄弟,或是八個表親犧牲生命」 + +前面提到長尾猴會警告天敵出現,其實是只會幫家庭成員警告。細菌會分享基因,因為它們彼此是複製體。蜂巢內的無私合作是因為它們只有蜂后負責生產,這確定整巢都是值得為其犧牲的兄弟姐妹。 + +第二種利他機制是互惠利他主義(Reciprocal altruism)。我會幫你是因為你之後得幫我。要形成這種機制,必須要有懲罰便車仔的手段,不然會整個族群都變便車仔。 + +紅翅黑鸝會幫非親非故的鄰居,冒風險趕走入侵者。但如果鄰居下次不幫忙,小紅下次也就不幫了。 + +書裡是說現代的人類好像也不太能歸類在親屬選擇或互惠利他。人類會利他,偶爾捐個慈善之類。但人類也特別殘忍,世界上最殘酷的事情只有人類做得出來。 + +不過親屬選擇有些支持論點。可能家長教小孩使用工具這種家庭投資,讓語言變成一種支持親屬的功能。 + +鄧巴也有另外一種觀點:語言是拿來八卦的。他量過我們人 70% 的對話都是在八卦。 + +如果八卦加上直接傷害可以阻止說謊者,或增加說謊成本,那這樣可以形成穩定的互惠利他均衡。 + +八卦讓語言形成一個成長飛輪。 + +更多的八卦和懲罰欺騙者 -> 驅使對非親屬者更多利他行為 -> 驅使人們得到更多語言技能(以獲得他人利他行為) -> 驅使更多的八卦和懲罰 ... +當然這套敘事並不是所有化石學家和語言學家都買單。也有一堆競爭的理論在打架。 + +--- + +所以智慧的第五個突破就是語言。 + +作者說第六個可能是 superintelligence 。聽聽就好,還好他沒再花三個章節去闡述。 + +的確到越後面階段的智慧就越難定義。能用實驗或證據確立下來的結論也越難。理論和臆測很多。 + +這本書作者真的蠻厲害,可以綜合好幾個領域的不同雜七雜八細節,抓出一個敘事的大主軸。 + +儘管如此,我一直覺得我消化好像沒有很好。為了把前因後果交代,幾乎把書的內容快要複製貼上。