從大語言糢型到外星人
山河
2025年5月26日發表
【人民報消息】GPT-3 的發布始於 2020 年,但到 2022 年,OpenAI 推出的GPT-3大語言糢型,具有 1750 億個參數,它是當時最強大的語言生成糢型。其展現出來的強大的文本生成能力,一下子震驚了全世界。在GPT的帶動下,大語言糢型的影嚮力開始迅速擴大。
GPT-3展現出了科幻般的能力,不但可以對話,還可以創作文章、寫代碼、生成詩歌。眾多的開發者和企業,馬上將GPT-3集成到自家的IT應用中,充當寫作助理、自動客服以及用於輔助內容創造。AI技術,就這樣如此迅速的滲入到了實際應用。在這些接踵而來的實際應用中,大語言糢型令人驚嘆的表現和性能,持續引爆全世界的輿論與討論。
在ChatGPT的持續帶動下,2023年的大語言糢型進入大眾化爆發,向各行業以驚人的速度滲透:編程、解題、建議,然還包括造假以及監控。由於其能讓全世界的人們、不管你是否具備技術背景,都能以自然語言進行對話與提出要求,並且大語言糢型都能以提問者能接受的方式進行回答和反饋,這使得大糢型技術幾乎是瞬間成為許多人日常生活的一部分。並且在這個過程中,能根據自然語言文本描述、創建圖像和視頻的技術也達到可實用的水平、其質量和效能也迅速捕獲了大眾。
這裡有個重要的問題,為甚麼大語言糢型能以自然語言輸入和輸出、它是怎麼理解人類的自然語言的?
大語言實際上不理解任何一種自然語言,它所作的是,將輸入的語言字元串、轉換後映射到自己的數學的向量空間,然後不斷的做擬合映射。人類語言字元串的本身是一維的,通過不同的詞匯和字詞排序,來接近與擬合思維中的事物。而這個向量空間,則是多維度的,用基於概率分布來權衡輕重、通過上下文來擬合語義。至於人類的自然語言,它並不做我們以為的那種理解。但是,它用這種方式,竟然真的能實現對人類的一些理解和任務處理。而且可以從任何一種自然語言轉換為另一種自然語言,只要是它訓練過的素材中包含的語言。
目前這種AI,在自己的概念空間中運算。而自然語言,不管是哪種語言,都能映射到AI的概念空間中,這可是第一大前提。為甚麼會這樣?語言承載的思維、意向和情緒,是能脫離語言存在的多維度存在,並且自有結構和規律。目前大語言糢型LLM所基於的Transformer架構,正好符合了這一點。
大糢型的幻覺來自哪裡?就是來自這種擬合,擬合的話,就存在匹配度的問題,並且不論匹配度多低,總是要產生一個輸出,那麼就產生了幻覺。但它所展現出來的所謂的創作力,也是來自擬合。可是人類的幻覺,實際上比大糢型普遍多了,人類的學習和成長過程,也是需要借助人身的感官、語言概念,與這個世界不斷的做擬合,總是在不斷的嘗試未知和試錯。當然也有許多人一輩子守著錯誤的概念抱殘守缺。
話說回來,如果有手段能探測和截獲,人們思想中產生的意念、思考過程,並且傳遞到另一個人的思想中,那豈不是不用張嘴,就可以達成互相的理解和溝通了呢?似乎,目前的AI技術,已經在接近解決這一步。進一步說,到了這一程度,近百年來一直流傳的外星人能用思維傳感來與人溝通、是否立刻也變得可思可議了?再進一步,如果外星人能直接用思維控制你的大腦、神經和肢體,好像也變成了非常現實的事情。如果是這樣,這個科技的發展,是否跟你的預期完全不同? △
(人民報首發)
|