人工智能简介
相关概念:
人工智能 (AI)
│
├── 机器学习 (Machine Learning, ML)
│ ├── 深度学习 (Deep Learning, DL)(基于神经网络)
│ │ │── 卷积神经网络(CNN)
│ │ │── 递归神经网络(RNN)
│ │ │── 长短期记忆网络(LSTM)
│ │ └── Transformer
│ └── 传统机器学习 (Traditional ML)
│
└── 自然语言处理 (Natural Language Processing, NLP)
├── LLM (Large Language Models)(基于DL.Transformer)
│ ├── GPT系列(Generative Pre-trained Transformer)
│ ├── BERT(Bidirectional Encoder Representations from Transformers)
│ ├── T5(Text-to-Text Transfer Transformer)
│ ├── PaLM(Pathways Language Model)
│ └── LLaMA(Large Language Model Meta AI)
└── 其他NLP方法(如规则、统计方法等)
AI 基础概念 11 个
【函数】万物皆函数。
【符号主义】早期人们用符号主义思想找到精确函数试图解释一切原理,但遇到了瓶颈。
【联结主义】后来人们转用联结主义思想,啥都不管先弄一个非常复杂的函数,然后根据计算出的预测值与真实值的误差,不断调整里面的未知参数。
【模型】这个函数叫做模型。
【权重】模型里的参数叫做权重。
【大模型】如果模型中的参数量特别大就叫做大模型。
【大语言模型】用于自然语言处理的大模型就叫做大语言模型 LLM。
【训练】调整参数的过程就是模型的训练。
【预训练】事先训练好一个基础模型的方式叫做预训练。
【微调】基于预训练的模型继续训练让模型学会具体的任务的方式叫做微调。
【推理】参数调整好后根据函数的输入计算输出结果的过程就叫做推理。
产品 10
【涌现】这些概念在大模型时代到来之后逐渐火热了起来,当模型参数量足够大的时候,对话能力有了质的提升,产生了一定程度的推理能力。这种量变引起质变而突然出现的之前没有的能力的现象,叫做涌现。
【ChatGPT】大语言模型爆火的产 品是 2023 年的 ChatGPT,但其实它就是一款用于聊天的产品而已
【GPT】而它背后使用的的大语言模型是 GPT,是个系列
【OpenAI】开发这个模型的公司是 OpenAI
这也是一开始挺多人搞混淆的概念
【CloseAI】而由于这家公司推出的产品一直保持不开放源代码也就是闭源,所以也正式更名为 CloseAI(开个玩笑)
一个模型需要有训练它的代码,有了代码就可以训练出一组权重,有了权重就可以进行推理,也就是可以对外提供服务了。
【闭源模型】不开放代码和权重,只对外提供服务并收钱的模型叫作闭源模型,如 ChatGPT,Claude,Gemini 等。
【开放权重】开放模型结构和权重,可以直接下载到自己电脑上部署的模型叫作开源模型,但实际上大部分现在说的开源模型只是开放了权重,而不开放训练代码和训练数据,所以准确说叫开放权重模型。如最近爆火的 deepseek,以及 meta 的 llama 等。
【完全开源】而不但开放了模型结构和权重,还开放了训练代码的模型叫做完全开源模型,比较有名的是 Mistral。
【私有化部署】当然,有了模型权重其实就可以下载到本地进行部署并使用了,很少有人需要重新训练它。这个不依赖于他人的服务而是把模型下载到本地进行使用的过程叫做私有化部署。
【云桌面】私有化部署依赖很多复杂的环境配置,就是要装很多依赖的软件和工具包,且需要性能较为强劲的 GPU 支持,对于仅仅想尝鲜的个人专门为此去买一台电脑不太合适,因此就有了云桌面的概念。
比如青椒云就是一款高性能的云桌面,你只需要一个能上网的电脑,就可以用几秒钟时间花费几毛钱体验众多需要极高电脑配置的大模型应用。