第 1 章
什么是大语言模型?
大语言模型(Large Language Model,简称LLM)是近年来最令人兴奋的AI技术之一。
简单来说,大语言模型就是一个"超级阅读理解高手"和"文字接龙大师":
"超级阅读理解高手" - 它学习了海量的文字资料,包括书籍、文章、网站对话 - 通过学习,它理解了语言的规律、知识和逻辑
"文字接龙大师" - 当你给它一段文字时,它会预测下一个最可能出现的词 - 就像你玩文字接龙游戏一样,但它的"词汇量"是天文数字
当我们说"大"的时候,是真的很大: - GPT-3训练使用了约45TB的文本数据 - 相当于读完了几百万本书!
小贴士
- •ChatGPT就是基于大语言模型(GPT)开发的对话AI
- •"语言模型"的概念早在几十年前就存在,但"大"字代表了现代模型前所未有的规模