在人工智能(Artificial intelligence / AI)快速發展的今天,LLM(Large Language Model / 大型語言模型)已成為技術創新的核心驅動力。LLM 是人工智能(AI)的一個類別,是由擁有大量參數(通常數十億個權重或更多)的類神經網路組成的一類語言模型,使用自我監督學習或半監督學習,並對大量未標記文字進行訓練。LLM 在 2018年左右出現,並執行各種任務和工作。
![]() |
| 人工智能(圖片來源:截取自互聯網網頁) |
大型語言模型(Large Language Model / LLM)的簡史:
LLM(Large Language Model / 大型語言模型)是一項現代的開發,但自然語言處理 (NLP) 的研究早在 1950 年由美國人艾倫圖靈 (Alan Turing) 啟動 ,艾倫圖靈測試以測量電腦之間的智能行為時就已開始。在該測試中,人類裁判會使用一組問題和電腦進行對話,然後判斷與自己對話的是電腦還是人類。
到了 1980 和 1990 年代,自然語言處理 (NLP) 從邏輯實驗移轉到更資料導向的方法。由於系統能夠根據句子中的字詞預測接下來會出現的字詞,例如 n元語法(n-grams )等統計語言模型為新紀元奠定了前進的方向。到了 2010 年初,較新的神經網路進一步擴充了這些語言模型的功能,讓他們超越判斷字詞順序,進一步瞭解字詞的表示方式和意義。
這些新進展在 2018年取得了突破,當時 8位 Google 科學家撰寫並發表了機器學習領域的里程碑研究《基於注意力機制的機器翻譯模型》。最顯著的突破是本研究引進了一個創新的網路神經網路架構: 轉換器(Transformer)架構,這個架構可以更精準且更大規模地管理及理解複雜的文字資訊。轉換器是現今一些功能最強大的 LLM 的基礎,包括 GPT 系列以及 BERT。
![]() |
| 人工智能大型語言模型 LLM (圖片來源:截取自互聯網網頁) |
LLM(Large Language Model / 大型語言模型)是一種 AI 模型類別,旨在模仿人類智能並執行各種任務的深度學習演算法。簡單來說,LLM 是一種經過大量文本數據訓練的電腦程式,它能夠理解、辨識人類語言、生成和處理人類語言。它可以快速讀遍了大量的書籍、文章和網頁,從中學習語言的規律和知識,並再依照學習產出。在大量資料集上接受了廣泛的訓練,使它們能夠識別、翻譯、預測和生成文字和其他內容。可以被廣泛應用於聊天機器人、內容生成、翻譯、客服等領域。
![]() |
| 大型語言模型 LLM發展 (圖片來源:截取自互聯網網頁) |
2025年 8月 31日(Sun)天氣報告
氣溫:59.0°F / 15.0°C @ 07:00
風速:每小時 6公里
降雨機會:0%
相對濕度:百分之 88%
天氣:大致晴朗



沒有留言:
張貼留言