LLM (Large Language Model) 大语言模型
LLM 是 AI 助手的大脑和语言核心。你可以把它看作是一个经过海量文本训练的“超级读者”和“预测专家”。
1. 核心本质
它是一种基于Transformer架构的深度学习模型,通过学习庞大的文本语料(书籍、网页、文章等),来理解和生成人类语言。它的核心能力是预测:根据给定的一段文字(提示词/Prompt),预测下一个最可能出现的词。
2. 关键能力
- 自然语言理解 (NLU):能读懂你的指令、问题,甚至能捕捉隐含的意图。
- 自然语言生成 (NLG):能用流畅、符合逻辑的人类语言回答问题、写文案、写代码。
- 知识储备:内置了海量的世界知识(尽管有知识截止日期)。
3. 在你工作流中的角色
在你构建的 AI 助手架构中,Claude 就是一个典型的 LLM。它负责处理你的核心请求,比如解释技术文档、生成代码、总结内容。它是所有交互的基础,但它本身通常是“静态”的,只在收到指令后进行一次响应。