從大語言糢型到外星人

【人民報消息】GPT-3 的發布始於 2020 年，但到 2022 年，OpenAI 推出的GPT-3大語言糢型，具有 1750 億個參數，它是當時最強大的語言生成糢型。其展現出來的強大的文本生成能力，一下子震驚了全世界。在GPT的帶動下，大語言糢型的影嚮力開始迅速擴大。 GPT-3展現出了科幻般的能力，不但可以對話，還可以創作文章、寫代碼、生成詩歌。眾多的開發者和企業，馬上將GPT-3集成到自家的IT應用中，充當寫作助理、自動客服以及用於輔助內容創造。AI技術，就這樣如此迅速的滲入到了實際應用。在這些接踵而來的實際應用中，大語言糢型令人驚嘆的表現和性能，持續引爆全世界的輿論與討論。在ChatGPT的持續帶動下，2023年的大語言糢型進入大眾化爆發，向各行業以驚人的速度滲透：編程、解題、建議，然還包括造假以及監控。由於其能讓全世界的人們、不管你是否具備技術背景，都能以自然語言進行對話與提出要求，並且大語言糢型都能以提問者能接受的方式進行回答和反饋，這使得大糢型技術幾乎是瞬間成為許多人日常生活的一部分。並且在這個過程中，能根據自然語言文本描述、創建圖像和視頻的技術也達到可實用的水平、其質量和效能也迅速捕獲了大眾。這裡有個重要的問題，為甚麼大語言糢型能以自然語言輸入和輸出、它是怎麼理解人類的自然語言的？大語言實際上不理解任何一種自然語言，它所作的是，將輸入的語言字元串、轉換後映射到自己的數學的向量空間，然後不斷的做擬合映射。人類語言字元串的本身是一維的，通過不同的詞匯和字詞排序，來接近與擬合思維中的事物。而這個向量空間，則是多維度的，用基於概率分布來權衡輕重、通過上下文來擬合語義。至於人類的自然語言，它並不做我們以為的那種理解。但是，它用這種方式，竟然真的能實現對人類的一些理解和任務處理。而且可以從任何一種自然語言轉換為另一種自然語言，只要是它訓練過的素材中包含的語言。目前這種AI，在自己的概念空間中運算。而自然語言，不管是哪種語言，都能映射到AI的概念空間中，這可是第一大前提。為甚麼會這樣？語言承載的思維、意向和情緒，是能脫離語言存在的多維度存在，並且自有結構和規律。目前大語言糢型LLM所基於的Transformer架構，正好符合了這一點。大糢型的幻覺來自哪裡？就是來自這種擬合，擬合的話，就存在匹配度的問題，並且不論匹配度多低，總是要產生一個輸出，那麼就產生了幻覺。但它所展現出來的所謂的創作力，也是來自擬合。可是人類的幻覺，實際上比大糢型普遍多了，人類的學習和成長過程，也是需要借助人身的感官、語言概念，與這個世界不斷的做擬合，總是在不斷的嘗試未知和試錯。當然也有許多人一輩子守著錯誤的概念抱殘守缺。話說回來，如果有手段能探測和截獲，人們思想中產生的意念、思考過程，並且傳遞到另一個人的思想中，那豈不是不用張嘴，就可以達成互相的理解和溝通了呢？似乎，目前的AI技術，已經在接近解決這一步。進一步說，到了這一程度，近百年來一直流傳的外星人能用思維傳感來與人溝通、是否立刻也變得可思可議了？再進一步，如果外星人能直接用思維控制你的大腦、神經和肢體，好像也變成了非常現實的事情。如果是這樣，這個科技的發展，是否跟你的預期完全不同？ △ （人民報首發）

讀者留言反饋: