AI小学生

「努力搬砖、拒绝画饼」

一文读懂什么是AI大模型(纯小白向)

最近总是听到”AI大模型”、”LLM”、”GPT”这些词,到底是什么意思?今天用最通俗的话解释清楚。

什么是”大模型”?

类比理解:

普通模型就像一个专业狭窄的运动员,只会100米短跑。

大模型就像一个十项全能选手,跑步、游泳、举重、跳远都会。大模型之所以叫”大”,主要是因为:

  1. 参数多:GPT-3有1750亿个参数,可以简单理解为它有1750亿个”神经元”
  2. 数据大:训练时看了整个互联网的文字资料
  3. 能力泛:不只是做一件事,能做很多事

常见的AI大模型有哪些?

国外

  • GPT-4(OpenAI)- 目前最强大
  • Claude(Anthropic)- 擅长长文本
  • Gemini(Google)- 多模态能力强
  • Llama(Meta)- 开源模型

国内

  • 文心一言(百度)
  • 通义千问(阿里)
  • 智谱ChatGLM(清华)
  • Kimi(月之暗面)- 长上下文很强

大模型能做什么?

语言相关:

  • 写文章、写信、写代码
  • 翻译、总结、扩写
  • 问答、对话、客服

分析相关:
– 数据分析

  • 报告生成
  • 方案策划

创意相关:
– 写小说、诗歌
– 起标题、写文案

  • 生成图片(搭配绘图模型)

大模型的局限

再强大也有做不到的事:

  1. 数学计算:复杂数学题可能出错
  2. 实时信息:不知道最新新闻
  3. 事实准确性:会”一本正经地胡说八道”
  4. 专业领域:医疗、法律建议要谨慎

普通人怎么用?

免费渠道:
– Kimi(kimi.moonshot.cn)- 免费,长文本强
– 文心一言(yiyan.baidu.com)- 免费
– 通义千问(tongyi.aliyun.com)- 免费

付费渠道:
– ChatGPT Plus($20/月)- 最全面
– Claude Pro($20/月)- 适合长文本处理
– 各平台会员

写在最后

AI大模型本质是一个”超级大脑”,它学习了人类几乎所有公开的文字,所以什么都知道一点。

但它不是万能的,用好它的关键是:知道它擅长什么,也知道它的边界在哪里

下一期我们讲讲:怎么给AI下指令,让它回答更准确。


相关阅读:
5个ChatGPT高级技巧

发表回复

Your email address will not be published. Required fields are marked *.

*
*

关于本站

这里也许是个介绍您自己的好地方,也能介绍您的站点或放进一些工作人员名单。

联系我们

地址
123 Main Street
New York, NY 10001

营业时间
星期一—五:9:00–17:00
星期六—日:11:00–15:00