前言
本文面向深度学习初学者或者工程师,推荐几个常用的深度学习模型快速开发平台。可以帮助初学者快速跑通模型,帮助工程师快速对模型进行部署和应用。
huggingface
简介
不多介绍,全球最大的模型托管平台,该平台最大的特点是:
- 模型多,截止发文共有模型76万+;
- 易应用,通过模型卡片页的简介,简单几十行代码就能进行模型的推理;
- 要翻墙,国内目前被墙了,不能直接下载其模型。这里提供一个国内镜像网站:链接。
使用流程
1.配置相应环境,huggingface的模型需要安装transformers库,这个库基于深度学习,因此需要安装相应的深度学习环境,比如pytorch、tensorflow等。
pip3 install transformers
2.搜索相应的模型,并下载模型文件(自动下载,由于被墙代码自动下载失效,可以通过镜像网站下载好模型文件,放在相应位置,windows位置在:C:\Users\username.cache\huggingface\hub下,Linux在当前用户文件夹下:/home/username/.cache/huggingface/hub,也可以通过自动以文件夹存放,模型读取时改为自定义文件夹)。
3.在模型卡片页找到相应的推理代码,进行推理。
modelscope
简介
和huggingface类似,modelscope是国内最大的模型托管平台。
平台地址
使用流程
1.配置相应环境。
pip3 install modelscope
2.搜索相应的模型,并下载模型文件(自动下载)。
3.在模型卡片页找到相应的推理代码,进行推理。
OpenMMLab
简介
OpenMMLab累计开源超过30个算法库、2400个预训练模型,涵盖图像识别分类、目标检测、图像分割、姿态估计、视频理解、OCR、3D目标检测、3D人体姿态估计、模型轻量化、自监督、少样本、光流、预训练、多模态、AIGC、推理部署等等计算机视觉任务,在Github上累计获得十万颗star,超过了Pytorch。
平台地址
使用流程
1.配置相应环境。
pip3 install mmcv mmdetection
2.进入github站到相应的库,比如:mmdetection、MMClassification、MMDetection3D、MMRotate、MMSegmentation、MMOCR、MMPose、MMHuman3D、MMAction2、MMTracking、MMEditing、MMGeneration等。
3.从文档中找到快速开始,按照教程部署模型。
Paddle
简介
Paddle是百度提出的一个深度学习框架,内置很多通用模型。不过根据本人使用体验来看,版本控制比较混乱。
官方链接
使用流程
1.配置相应环境。
pip3 install paddle-gpu paddleocr
2.进入github站到相应的库,比如:PaddleOCR、PaddleNLP、PaddleDetection、PaddleSpeech、PaddleSeg、PaddleGAN、PaddleClas、PaddleRec等。
3.从文档中找到快速开始,按照教程部署模型。
Torch
简介
Pytorch是现如今最受欢迎的深度学习框架之一。
官方链接
使用流程
1.配置相应环境。
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu118
2.使用内置模型进行训练或推理了,以下是一个推理的实例。
import time
import torch
from PIL import Image
from torchvision import transforms
from torchvision import modelsdevice = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
print(f'Using {device} for inference')resnet50 = models.resnet50(pretrained=True)
resnet50.eval().to(device)img_rgb = Image.open('./bus.jpg').convert('RGB')
norm_mean = [0.485, 0.456, 0.406] # 均值
norm_std = [0.229, 0.224, 0.225] # 方差
inference_transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize(norm_mean, norm_std), # 转换到-1 - 1
])img_tensor = inference_transform(img_rgb)
img_tensor.unsqueeze_(0) # 1x3x800x800
img_tensor = img_tensor.to(device) # use cudawith torch.no_grad():output = torch.nn.functional.softmax(resnet50(img_tensor), dim=1)
ultralytics
简介
Ultralytics 是一个视觉库,能够实现目标检测和跟踪、实例分割、图像分类和姿态估计任务。
官方链接
使用流程
1.配置相应环境。
pip3 install ultralytics
2.使用内置模型进行训练或推理了,以下是一个推理的实例。
from ultralytics import YOLO# Load a model
model = YOLO("yolov8n.pt") # load an official model# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg") # predict on an image