本地化部署Chatglm和防踩坑攻略

最近想搞点什么东西练练手,传统crud又没有意义,于是就看到了给介绍AI的文章,然后就慢慢自己摸索,从0到1,独自部署应用。

项目简介

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,ChatGLM3-6B 引入了如下特性:

  1. 更强大的基础模型: ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示,* ChatGLM3-6B-Base 具有在 10B 以下的基础模型中最强的性能*。
  2. 更完整的功能支持: ChatGLM3-6B 采用了全新设计的 [Prompt 格式] ,除正常的多轮对话外。同时原生支持[工具调用](Function Call)、代码执行(Code Interpreter)和 Agent 任务等复杂场景。

环境

python

项目要求python环境最低3.10,安装完成后执行 python -v查看python版本

conda

安装conda

这里我选的是miniconda,具体请自行选择[docs.conda.io/en/latest/]

安装完成使用conda -V 查看版本号即可表示安装成功

image.png

部署

先把项目拿下来

git clone https://github.com/THUDM/ChatGLM3

切换到根目录,使用pip安装依赖

cd ChatGLM3
pip install -r requirements.txt

ChatGLM3\basic_demo目录下执行命令

streamlit run web_demo_streamlit.py

第一次执行需要下载很大的模型文件,大概11g左右

dcf3eb17fca9d2eeb56647e31ef336a.png

特别注意,此处需要使用魔法(非国内节点),否则会报错。

image.png

启动成功后,如果你的控制台出现以下一句话就说明你使用的是cpu在运算

WARNING:root:Some parameters are on the meta device device because they were offloaded to the cpu and disk.

image.png

因为CPU跑太慢了,我们必须要使用GPU进行运算。 在web_demo_streamlit.py文件里面有这么一段代码

def get_model():tokenizer = AutoTokenizer.from_pretrained(TOKENIZER_PATH, trust_remote_code=True)model = AutoModel.from_pretrained(MODEL_PATH, trust_remote_code=True, device_map="auto").eval()return tokenizer, model

我们把他改造一下

def get_model():tokenizer = AutoTokenizer.from_pretrained(TOKENIZER_PATH, trust_remote_code=True)model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True,device_map="cuda").quantize(4).cuda()return tokenizer, model

然后再启动我们的项目,心想美滋滋啊,终于能跑了。

但是事情没有想象中那么简单启动后还是会出现WARNING:root:Some parameters are on the meta device device because they were offloaded to the cpu and disk.

pytorch

查阅资料后发现,是因为我们的pytorch没有安装正确的版本

使用python交互模式输入

import torch as t    
print(t.cuda.is_available())  
print(t.__version__)

可以看到输出是False和xxx+cpu这样的数据

既然是错误的版本,那重新安装就可以了吧。 我们去到PyTorch官网根据我们的机器进行版本安装 [pytorch.org/get-started…]

image.png

cuda版本

控制台输入

nvidia-smi

查看GPU信息

image.png

右边的cuda是最高支持的版本,左边是GPU驱动信息

然后根据你的驱动版本在cuda官网查看对应的cuda版本 [docs.nvidia.com/cuda/cuda-t…]

image.png

找到对应的cuda版本之后我们到

[developer.nvidia.com/cuda-toolki…]

下载你的GPU对应的版本号。

安装cuda的时候注意,这个界面只是把安装程序解压到此目录,真正的安装在后面。

image.png

这个目录cuda安装完成后会自动删除,但是还是不建议放在c盘。 等待一段时间后会出现以下窗口。

69ff129d91bb3855091a5c4ccce45a1.png

此处才是真正的cuda安装路径,还是不要放在c盘,安装过程屏幕可能会闪烁,这属于正常现象。

安装完成后控制台使用 nvcc -V查看版本

image.png

ok,cuda和pytorch都安装完成了,我们测试一下能不能使用到cuda```
import torch
print(torch.cuda.is_available())

![image.png](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/ec9f39c1fce443ef875486d83598f7c3~tplv-k3u1fbpfcp-jj-mark:3024:0:0:0:q75.awebp#?w=316&h=67&s=2426&e=png&b=0c0c0c)

import torch
print(torch.version)

![image.png](https://p6-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/f745bf3c2c834a0587e0be84dc9e90df~tplv-k3u1fbpfcp-jj-mark:3024:0:0:0:q75.awebp#?w=266&h=78&s=2472&e=png&b=0c0c0c)注意,笔者使用conda安装pytorch后运行出现以下情况![4c7ef9c29be6b33cb068e5daf7590c6.png](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/10fad49ca9a84e94ace1fdbb62cd7c20~tplv-k3u1fbpfcp-jj-mark:3024:0:0:0:q75.awebp#?w=606&h=149&s=8546&e=png&b=fff0f0)结果一看还是cpu版本的pytorch,不知道是什么情况,欢迎评论区指出。再来启动一次AI,等待一段时间后会自动跳转到以下界面![image.png](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/ea780172d93a4bb79ed894b2451e67fb~tplv-k3u1fbpfcp-jj-mark:3024:0:0:0:q75.awebp#?w=2964&h=2326&s=1006453&e=png&a=1&b=ffffff)此图为官网图,~~我的忘记截图了~~我本来以为我的显卡能跑起来的,但是试了之后发现,三分钟跑一个字 ![image.png](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/12b6dcaa0fc04f049bff079334c0edf9~tplv-k3u1fbpfcp-jj-mark:3024:0:0:0:q75.awebp#?w=1794&h=805&s=477761&e=png&b=ffffff) 右边GPU使用和显存直接爆了,风扇转得飞起,下次还是去租一个云服务器跑吧。总结
==虽然跑起来很吃力,但是总算是踩了几个坑跑完了了,只是有点慢(朋友们安装pytorch的时候要注意版本以及cuda的版本对应关系,坑都是这两个比较深。

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3269743.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

CVPR`24 | 4D编辑哪家强?浙大首次提出通用指导4D编辑框架:Instruct 4D-to-4D

文章链接:https://arxiv.org/pdf/2406.09402 项目地址:https://immortalco.github.io/Instruct-4D-to-4D/ 今天和大家一起学习的是Instruct 4D-to-4D,可以通过2D扩散模型实现4D感知和时空一致性,以生成高质量的指令引导的动态场景…

selenium----CSS表达式选择元素

前面我们学习了根据 id、class属性、tag名 选择元素。 如果我们要选择的 元素 没有id、class 属性,或者有些我们不想选择的元素 也有相同的 id、class属性值,怎么办呢?这时候我们通常可以通过 CSS selector 语法选择元素。 选择元素 通过 …

22.jdk源码阅读之Thread(上)

1. 写在前面 Java 中的 Thread 类是多线程编程的基础,也是我们日常工作中用的比较多的类,但是你真的了解它吗?下面这几个问题你是否有思考过? start() 和 run() 方法有什么区别?什么是线程的生命周期?什么…

邮件攻击案例系列三:动态 IP 池爆破员工邮箱钓鱼重要客户

案例描述 2023 年 11 月,某制造业企业员工 Emily 接到海外客户电话,向其核实一封电子邮件的真实性,因为客户认为,该邮件所给出的链接不像是该公司的官网网址。Emily 查看自己的邮箱,并未发现客户所说的邮件。但从客户…

RPA:如何一次回答多个问题

洞悉技术的本质,享受科技的乐趣 先完成10%目标,迈出100%之一行动 2分钟的努力也有价值 从每天解决1个小问题开始。 本文介绍如何使用playwright来处理新页面 三句话说清楚问题 一天回答一个问题太慢了,我想一天回答 3个问题 了解基本原理 新页…

YOLOv5改进 | 卷积模块 | 即插即用的递归门控卷积gnConv

秋招面试专栏推荐 :深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 💡💡💡本专栏所有程序均经过测试,可成功执行💡💡💡 专栏目录: 《YOLOv5入门 改…

概率模拟(sigmoid、softmax)

概率模拟(sigmoid、softmax) 1. sigmoid1.1 sigmoid 定义1.2 sigmoid 主要特性1.3 sigmoid 的缺点1.4 代码画 sigmoid 函数图像 2. softmax2.1 softmax 定义与原理2.2 softmax 特点与优势2.3 softmax 应用场景2.4 softmax 实现方式2.5 softmax 注意事项2…

C++从入门到起飞之——友元内部类匿名对象 全方位剖析!

🌈个人主页:秋风起,再归来~🔥系列专栏:C从入门到起飞 🔖克心守己,律己则安 目录 1、友元 2、内部类 3. 匿名对象 4、完结散花 1、友元 • 友元提供了⼀种突破类访问限定符封装的…

在 Jetpack Compose 中使用 CameraX示例

在使用Jetpack Compose开发安卓应用,当在学习使用CameraX组件时发现官方提供的教程不是Compose的。教程地址如下: https://developer.android.com/codelabs/camerax-getting-started?hlzh-cn#1 与是我就记录一下,简单的示例。 内容参考&…

吴恩达的TranslationAgent学习

TranslationAgent构成 整个[TranslationAgent (github.com)]在流程上分为短文本的一次性翻译和长文本的分chunk翻译(按照Token进行划分)。 但是不论长文本翻译还是短文本翻译,总体流程遵循执行、纠正再执行的逻辑循环实现。 这种按照自省思路…

基于JSP的电子商城系统

你好呀,我是计算机学姐码农小野!如果有相关需求,可以私信联系我。 开发语言:Java 数据库:MySQL 技术:JSPJavaB/S架构 工具:Eclipse、Tomcat 系统展示 首页 管理员功能界面 用户功能界面 医…

Kylin 入门教程

Apache Kylin 是一个开源的分布式数据仓库和 OLAP(在线分析处理)引擎,旨在提供亚秒级查询响应时间,即使在处理超大规模数据集时也是如此。Kylin 可以有效地将原始数据预计算为多维数据立方体(Cube),并利用这些预计算结果来提供快速查询。本文将带你从基础知识到操作实践…

项目管理工具-Maven-创建一个mavenweb项目

文章目录 IDEA开发maven项目依赖范围 IDEA开发maven项目 点击NewProject,填写项目名字Name为javaWeb-maven,填写项目的存储地址,选择Archetype为org.apache.maven.archetypes:maven-archetype-webapp,然后再点击Create&#xff0…

Android WebViewClient 的 `shouldOverrideUrlLoading` 方法

简介 在Android开发中,WebView是一个强大的工具,可以在你的应用中显示网页内容。了解 WebViewClient 中的 shouldOverrideUrlLoading 方法是至关重要的,因为这个方法允许你控制 URL 在 WebView 中的处理方式。 在本文中,我们将详…

基于FFmpeg和SDL的音视频解码播放的实现过程与相关细节

目录 1、视频播放器原理 2、FFMPEG解码 2.1 FFMPEG库 2.2、数据类型 2.3、解码 2.3.1、接口函数 2.3.2、解码流程 3、SDL播放 3.1、接口函数 3.2、视频播放 3.3、音频播放 4、音视频的同步 4.1、获取音频的播放时间戳 4.2、获取当前视频帧时间戳 4.3、获取视…

OZON打开哈萨克斯坦市场,OZON测试开通哈萨克斯坦市场中国产品

在全球化日益深入的今天,跨境电商成为了连接不同国家和地区消费者的重要桥梁。2024年7月26日,Ozon Global宣布了一项重大扩展计划,正式将中国卖家的销售版图拓展至哈萨克斯坦市场,为中国企业打开了新的增长机遇之门。 OZON哈萨克斯…

实现共模噪声电流相互抵消的方法

共模传导路径中噪声电流相互抵消,从而使总的共模电流减小, 终达到降噪的目的。目前为实现共模噪声电流相互抵消,主要是采用动点电容抵消法。 动点电容抵消法原理 动点电容抵消法就是选取合适的动点,添加原副边跨接电容&#xff0c…

【Leetcode】二十、记忆化搜索:零钱兑换

文章目录 1、记忆化搜索2、leetcode509:斐波那契数列3、leetcode322:零钱兑换 1、记忆化搜索 也叫备忘录,即把已经计算过的结果存下来,下次再遇到,就直接取,不用重新计算。目的是以减少重复计算。 以前面提…

深度强化学习 ②(DRL)

参考视频:📺王树森教授深度强化学习 前言: 最近在学习深度强化学习,学的一知半解😢😢😢,这是我的笔记,欢迎和我一起学习交流~ 这篇博客目前还相对比较乱,后面…

【算法刷题】【力扣】| 最长回文子串|

给你一个字符串 s,找到 s 中最长的 示例 1: 输入:s "babad" 输出:"bab" 解释:"aba" 同样是符合题意的答案。示例 2: 输入:s "cbbd" 输出&#x…