DeepSeek推出的LLM推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言模型(LLM)的推理能力。这项研究在如何仅依靠强化学习而不是过分依赖监督式微调的情况下,增强LLM解决复杂问题的能力上,取得了重要进展。 DeepSeek-R1 技术概述模型架构DeepSeek-R1 不是一个单独的模型,而是包括DeepSeek-R1-Zero和DeepSeek-R1的模型系列。 下面我来阐明 DeepSeek-R1 和 DeepSeek-R1-Zero 之间的关键差异: 主要区别DeepSeek-R1-Zero是团队初步尝试仅用纯强化学习而不进行任何监督式微调的实验。他们从基础模型出发,直接运用强化学习,让模型通过不断试错来发展其推理能力。这种方法虽然取得了较好的成果(在 AIME 2024 测试中达到了 71% 的准确率),但在可读性和语言连贯性上存在明显不足。该模型拥有 6710 亿个参数,使用了混合专家(MoE)架构,其中每个词触发的参数约为 370 亿。此模型展现了一些新兴的推理行为,例如自我核查、反思和长链推理(CoT)。 与之对比,DeepSeek-R1采用了更复杂的多阶段训练方法。它不仅仅采用强化学习,而是先在一小组精心挑选的示例(称为“冷启动数据”)上进行监督式微调,然后再应用强化学习。这种方法克服了 DeepSeek-R1-Zero 的局限,同时取得了更优的表现。这个模型同样维持了 6710 亿的参数数量,但在回答的可读性和条理性上有所提高。 训练过程对比训练方法概述:
DeepSeek-R1-Zero 的训练流程:
DeepSeek-R1 的训练流程包含四个阶段:
性能指标:
局限性及未来发展该论文指出了若干改进领域:
未来的研究将致力于解决这些问题,并拓展模型在函数调用、多轮交互和复杂角色扮演场景等领域的能力。 部署与可获取性开源与许可:DeepSeek-R1及其变体基于 MIT 许可证发布,支持开源合作和商业使用,包括模型蒸馏。此举对促进创新和降低人工智能模型开发门槛具有关键意义。 模型格式:这些模型及其蒸馏版本支持 GGML、GGUF、GPTQ 和 HF 等多种格式,使其在本地部署上具有灵活性。 DeepSeek使用方式我们可以通过三种方式使用DeepSeek:官方web访问、API使用、本地部署。 1. 通过DeepSeek聊天平台进行网页访问:DeepSeek聊天平台提供了一个友好的用户界面,允许用户无需任何设置即可与DeepSeek-R1进行互动。
2. 通过 DeepSeek API 访问:DeepSeek 提供了一个与 OpenAI 格式兼容的 API,方便开发者将其嵌入各种应用程序中进行程序化访问。 当前注册还可以享有10块钱的赠送额度 使用 API 的步骤: a. 获取 API 密钥:
b. 配置您的环境:
c. 发起 API 调用:
# 请先安装 OpenAI SDK:`pip3 install openai`from openai import OpenAIclient = OpenAI(api_key='<DeepSeek API Key>', base_url='https://api.')response = client.chat.completions.create( model='deepseek-chat', messages=[ {'role': 'system', 'content': 'You are a helpful assistant'}, {'role': 'user', 'content': 'Hello'}, ], stream=False)print(response.choices[0].message.content) 3. 在本地部署 DeepSeek-R1:两种模型(R1 和 R1-Zero):
DeepSeek本地部署步骤:1.Ollama:您可以使用Ollama来在本地部署和运行模型:(Ollama 是一个工具,允许您在个人计算机上本地运行开源 AI 模型。您可以从这里下载它: 2. 验证 Ollama 安装情况在进一步操作之前,我们需要确保 Ollama 已经正确安装。请打开您的终端或命令提示符,输入以下命令: ollama--version 如果您看到版本号显示出来,说明安装成功了!如果没有显示,那么请仔细检查您是否已按照安装步骤正确执行。 3.Download Deepseek R1通过 Ollama 下载 DeepSeek R1 非常便捷。您只需在终端中执行以下命令: ollama run deepseek-r1 默认版本是:7B 模型(CPU 大概需要4G内存,1.5B大概需要1.7G内存),DeepSeek R1 的参数范围从 1.5B 到 671B,可以使用ollama run deepseek-r1:1.5b适合自己的模型版本,下载时间可能会根据您的网络速度而异。下载期间,可以喝杯水或者活动一下身体,稍作等待吧? 4. 运行 DeepSeek R1下载完成后,您就可以启动 DeepSeek R1 了。使用以下命令: ollama run deepseek-r1 就这样,您已经在本地机器上顺利启动了 DeepSeek R1!感觉如何,是不是so easy? 本地运行试用Deepseek R1现在我们已经成功启动了 DeepSeek R1,接下来就是更加有趣的部分——实际使用它!让我们一起探索这款强大的 AI 模型能做些什么神奇的事情。 1.创意写作DeepSeek R1 在创意写作方面非常擅长。尝试给它这样一个写作提示: 写一个短故事,讲述一个机器人发现自己拥有情感的经历。 您会对它输出的既有创意又条理清晰的故事感到惊喜! 本地运行 DeepSeek R1:探索人工智能的未来可能本文即将结束,这次我们讲解了在本地环境中使用 Ollama 运行 DeepSeek R1。 DeepSeek R1 这样的强大 AI 模型运行在个人电脑上,不仅仅是展示一项引人注目的技术,更是我们对未来人工智能发展方向的一种探索。这样做让高级语言模型的强大功能直接落在我们的手中,使得个性化定制、深入实验以及更好的隐私保护成为可能。让我们想象以下几种可能:
这一切都指向一个无限的可能性世界! |
|