LLM 模型預訓練(Pre-training)與微調(Fine-tuning)
LLM(Large Language Model /大型語言模型)通常經過兩個階段的訓練, 預訓練和微調。預訓練階段,LLM 在海量文本資料上進行無監督學習,學習語言的通用知識和模式。微調階段,在特定任務的資料集上對預訓練模型進行微調,使其更好地適應特定任務。
![]() |
| 模型預訓練(Pre-training)訓練流程(圖片來源:截取自互聯網網頁) |
LLM 模型預訓練(Pre-training)
預訓練 - 其目標在於使模型掌握語言的統計模式與語義資訊。主流的預訓練階段流程大致相同,其中關鍵要素是資料,需收集海量無標注資料,像互聯網上的文本、新聞、博客、論壇等。這些資料可以涵蓋多種語言,且要經過一定的清理和處置,去除雜訊、無關資訊以及涉及個人隱私的內容,它使模型能夠根據上下文中不同詞語(Tokens 詞元)的重要性來權衡輸入序列中每個詞語的重要性。最後以 Tokenizer 細微性輸入到前述的語言模型中。經清洗處理後的這些資料用於訓練和優化語言模型。在預訓練過程中,模型會習得詞彙、句法和語義的規律以及上下文的關係。
資料收集 – 預訓練語料有兩種來源, 通用語料和專業語料, 資料收集完後需要對這些資料進行預處理,包括去噪、去冗餘、去除不相關和潛在的錯誤資料。
基礎大模型訓練 - 由於模型參數量和所使用的資料量巨大,所以普通伺服器單機無法完成訓練過程,因此通常採用分散式架構完成訓練 。
LLM 模型預訓練(Pre-training)與微調(Fine-tuning)
指令微調 - 在完成預訓練後,就可以通過指令微調去挖掘和增強語言模型本身具備的能力,這步也是很多企業以及科研研究人員利用大模型的重要步驟。為了讓模型訓練更加高效和簡單,這個階段還有一種高效的 fine-tuning 技術,這為普通的從業者打開了通向使用大模型的捷徑。大模型高效微調(Parameter-Efficient Fine-Tuning, PEFT)。工業界常用的 Adapter Tuning 的技術是 Low-Rank Adaptation(LoRA)。使得在大規模預訓練模型上進行微調更加高效和可行,為實際應用提供了更多可能性。
類人對齊 – 由於模型輸出的結果與人類回答差距很大,因此需要進一步優化模型,使模型的輸出與人類習慣對齊。其中 OpenAI 開發 ChatGPT 的人類回饋強化學習是最具代表性也是最成功的 。
獎勵建模 – 獎勵建模(Reward Modeling)階段的目標是構建一個文本品質對比模型,對於同一個提示詞,SFT 模型給出的多個不同輸出結果的品質進行排序。
強化學習 - 強化學習(Reinforcement Learning)階段根據數十萬使用者給出的提示詞,利用前一階段訓練的 RM 模型,給出 SFT 模型對使用者提示詞補全結果的品質評估,並與語言模型建模目標綜合得到更好的效果。
![]() |
| LLM 模型預訓練(Pre-training)與微調(Fine-tuning)(圖片來源:截取自互聯網網頁) |
預訓練與微調:
- LLM 通常經過兩個階段的訓練:預訓練和微調。
- 預訓練階段,LLM 在海量文本資料上進行無監督學習,學習語言的通用知識和模式。
- 微調階段,在特定任務的資料集上對預訓練模型進行微調,使其更好地適應特定任務。
核心能力:
LLM 的核心能力包括生成(生成文本)、總結(文本摘要)、提取(資訊抽取)、分類(文本分類)、檢索(資訊檢索)和改寫(文本改寫)等。
生成是 LLM 最核心的能力,能夠生成連貫、自然的文本內容。
應用場景:
˙ LLM 的應用非常廣泛,包括但不限於:
- 文本生成:創作各種類型的文本,如文章、代碼、故事等。
- 語言翻譯:實現不同語言之間的互譯。
- 問答系統:根據使用者提問提供準確的答案。
- 情感分析:判斷文本的情感傾向。
- 信息抽取:從文本中提取關鍵資訊。
- 代碼生成:根據自然語言描述生成代碼。
總結:
LLM 的核心在於深度學習和 Transformer 架構,通過海量資料訓練,學習語言的模式和結構,從而實現各種自然語言處理任務。這種技術在文本生成、語言翻譯、問答系統等領域具有廣泛的應用前景,並且還在不斷發展和完善中。目前 LLM 最大的缺點是產生幻覺 (Hallucination) 嚴重,經常會產生無中生有的回復,如果你沒有對應的專業知識,很容易被帶偏。所以如果你要用於工作、教育等嚴肅場景,人工二次校驗是必要的。幻覺短期內是無法消除的,連 LLM 的泛化能力也跟幻覺有關。為瞭解決 LLM 回覆準確性的問題,RAG 技術被廣泛應用。另外還有一些問題:訓練資訊更新不及時、邏輯能力差、推理速度慢和安全性方面等。
2025年 9月 30日(Tue)天氣報告
氣溫:56.0°F / 13.0°C @ 07:00
風速:每小時 6公里
降雨機會:0%
相對濕度:百分之 93%
天氣:晴朗有雲








