一文读懂什么是AI大模型(纯小白向)
最近总是听到”AI大模型”、”LLM”、”GPT”这些词,到底是什么意思?今天用最通俗的话解释清楚。
什么是”大模型”?
类比理解:
普通模型就像一个专业狭窄的运动员,只会100米短跑。
大模型就像一个十项全能选手,跑步、游泳、举重、跳远都会。大模型之所以叫”大”,主要是因为:
- 参数多:GPT-3有1750亿个参数,可以简单理解为它有1750亿个”神经元”
- 数据大:训练时看了整个互联网的文字资料
- 能力泛:不只是做一件事,能做很多事
常见的AI大模型有哪些?
国外
- GPT-4(OpenAI)- 目前最强大
- Claude(Anthropic)- 擅长长文本
- Gemini(Google)- 多模态能力强
- Llama(Meta)- 开源模型
国内
- 文心一言(百度)
- 通义千问(阿里)
- 智谱ChatGLM(清华)
- Kimi(月之暗面)- 长上下文很强
大模型能做什么?
语言相关:
- 写文章、写信、写代码
- 翻译、总结、扩写
- 问答、对话、客服
分析相关:
– 数据分析
- 报告生成
- 方案策划
创意相关:
– 写小说、诗歌
– 起标题、写文案
- 生成图片(搭配绘图模型)
大模型的局限
再强大也有做不到的事:
- 数学计算:复杂数学题可能出错
- 实时信息:不知道最新新闻
- 事实准确性:会”一本正经地胡说八道”
- 专业领域:医疗、法律建议要谨慎
普通人怎么用?
免费渠道:
– Kimi(kimi.moonshot.cn)- 免费,长文本强
– 文心一言(yiyan.baidu.com)- 免费
– 通义千问(tongyi.aliyun.com)- 免费
付费渠道:
– ChatGPT Plus($20/月)- 最全面
– Claude Pro($20/月)- 适合长文本处理
– 各平台会员
写在最后
AI大模型本质是一个”超级大脑”,它学习了人类几乎所有公开的文字,所以什么都知道一点。
但它不是万能的,用好它的关键是:知道它擅长什么,也知道它的边界在哪里。
下一期我们讲讲:怎么给AI下指令,让它回答更准确。
相关阅读:
– 5个ChatGPT高级技巧