庫存狀況
「香港二樓書店」讓您 愛上二樓●愛上書
我的購物車 加入會員 會員中心 常見問題 首頁
「香港二樓書店」邁向第一華人書店
登入 客戶評價 whatsapp 常見問題 加入會員 會員專區 現貨書籍 現貨書籍 購物流程 運費計算 我的購物車 聯絡我們 返回首頁
香港二樓書店 > 今日好書推介
   
區政新角度
  • 定價64.00元
  • 8 折優惠:HK$51.2
  • 放入購物車
二樓書籍分類
 
LLM走進你的電腦:自己動手開發大型語言模型應用

LLM走進你的電腦:自己動手開發大型語言模型應用

沒有庫存
訂購需時10-14天
9786267383766
張奇,桂韜,鄭銳,黃萱菁
深智數位
2024年6月19日
293.00  元
HK$ 249.05  






ISBN:9786267383766
  • 規格:平裝 / 408頁 / 17 x 23 x 2 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣


  • 電腦資訊 > 概論/科技趨勢 > 人工智慧/機器學習

















      本書共分四部分,第一部分詳細介紹大型語言模型的基礎理論知識,包括語言模型的定義、Transformer 結構,以及大型語言模型框架等內容,並以 LLaMA 所採用的模型結構為例的程式碼。

    ?

      第二部分主要介紹預訓練的相關內容,包括在模型分散式訓練中需要掌握的資料平行、流水線並行和模型平行等技術也介紹了ZeRO 最佳化,介紹預訓練資料分佈和資料預處理,以DeepSpeed 為例,介紹大型語言模型的預訓練。

    ?

      第三部分為大型語言模型在指令理解,如何在基礎模型的基礎上利用有監督微調和強化學習方法,理解指令並給出回答,包括高效微調方法、有監督微調資料構造方法、強化學習基礎和近端策略優化方法,並以 DeepSpeed-Chat和 MOSS-RLHF 為例訓練類 ChatGPT 系統。

    ?

      第四部分重點介紹了大型語言模型的擴充應用和評估。包括與外部工具和知識源連接的LangChain 技術。

    ?

      【本書看點】

      ●LLM基礎,包括GPT、Transformer、LLAMA

      ●常用的模型倉庫Huggingface的介紹

      ●LLM的預訓練資料的介紹及整理

      ●多GPU分散式訓練的基礎及實作

      ●SFT有監督微調的應用實例及基礎,包括LORA、PEFT

      ●強化學習在LLM中的應用,包括獎勵模型及PPO

      ●LLM的應用,包括COT及LLM瑞士刀LangChain

      ●用科學方式來評估LLM的能力



     





    第 1 章緒論









      緣起




    其 他 著 作