tsfmakko 的人工智慧學院
2026年2月25日 上午 3:18
要了解 LLM,我們可以把這個詞拆成三個部分來看:
大型 (Large):指的是規模極度龐大。這包含兩個層面:
資料量大:它在訓練階段閱讀了網際網路上龐大的文本資料(包括書籍、維基百科、新聞、論壇文章等)。
參數多:模型本身包含了數十億甚至數兆個「參數」(Parameters)。參數可以想成是人工神經網路裡的神經元連結,參數越多,模型能捕捉到的語言細節和邏輯關聯就越複雜。
語言 (Language):代表它的核心專…