魔塔 | 在线中文AI模型开源社区

Original 魔塔大邓和他的Python

2024-09-09

关于ModelScope

ModelScope社区成立于 2022 年 6 月，是一个模型开源社区及创新平台，由阿里巴巴达摩院，联合CCF开源发展委员会，共同作为项目发起方。

社区联合国内AI领域合作伙伴与高校机构，致力于通过开放的社区合作，构建深度学习相关的模型开源，并开源相关模型服务创新技术，推动模型应用生态的繁荣发展。

期待ModelScope会有不一样的表现。

与ModelScope类似的网站有

国际 huggingface是较早将AI模型开源的网站，用户群体庞大，社区内有丰富的数据集、模型，文档详实。
国内百度飞桨是国内AI模型开源较好的网站，用户群体较大，更新活跃，但是文档质量。。。

目前ModelScope刚刚上线不久，模型和数据集都不怎么多

/model_scope_homepage.png)

名词解释

ModelScope平台是以模型为中心的模型开源社区，与模型的使用相关，您需要先了解如下概念。

基础概念	定义
任务	任务（Task）指某一领域具体的应用，以用于完成特定场景的任务。例如图像分类、文本生成、语音识别等，您可根据任务的输入输出找到适合您的应用场景的任务类型，通过任务的筛选来查找您所需的模型。
模型	模型（Model）是指一个具体的模型实例，包括模型网络结构和相应参数。ModelScope平台提供丰富的模型信息供用户体验与使用。
模型库	模型库（Modelhub）是指对模型进行存储、版本管理和相关操作的模型服务，用户上传和共享的模型将存储至ModelScope的模型库中，同时用户也可在Model hub中创建属于自己的模型存储库，并沿用平台提供的模型库管理功能进行模型管理。
数据集	数据集（Dataset）是方便共享及访问的数据集合，可用于算法训练、测试、验证，通常以表格形式出现。按照模态可划分为文本、图像、音频、视频、多模态等。
数据集库	数据集库（Datasethub）用于集中管理数据，支持模型进行训练、预测等，使各类型数据具备易访问、易管理、易共享的特点。
ModelScope Library	ModelScope Library是ModelScope平台自研的一套Python Library框架，通过调用特定的方法，用户可以只写短短的几行代码，就可以完成模型的推理、训练和评估等任务，也可以在此基础上快速进行二次开发，实现自己的创新想法。

一、模型探索

首先访问平台网址https://www.modelscope.cn/models，您将看见平台上已有的所有公开模型，根据任务筛选或者关键词搜索可查找您感兴趣的模型。

二、环境准备

2.1 本地开发环境

如果您需要在本地运行模型，需要进行相应的环境安装准备，包括：

安装python环境。支持python3，不支持python2，建议3.7版本及以上。我们推荐您使用Anaconda进行安装。
安装深度学习框架。ModelScope Library目前支持Tensorflow，Pytorch两大深度学习框架进行模型训练、推理。您可根据模型所需的框架选择适合的框架进行安装。
安装ModelScope Library。我们提供两种安装方式，您可选择适合的方式进行安装。

pip安装。ModelScope提供了根据不同领域的安装包，您可根据对应的模型选择所需的安装包。
使用源码安装。
更完整的安装信息参考：环境安装指南。

2.2 在线Notebook

若您觉得本地安装较为复杂， ModelScope平台也提供在线的运行环境，您可直接在Notebook中运行，Notebook中提供官方镜像无需自主进行环境安装，更加方便快捷，推荐大家使用！

注意：该功能需要您登录后使用，新用户注册ModelScope账号并完成阿里云账号绑定后即可获得免费算力资源，详情请参阅免费额度说明。

三、2分钟跑通模型推理

若您准备好本地环境或者已经打开一个Notebook的预装环境实例，则根据下述代码可对该模型进行推理。使用modelscope pipeline接口只需要两步，同样以上述中文分词模型（damo/nlp_structbert_word-segmentation_chinese-base）为例简单说明：

首先根据task实例化一个pipeline对象

from modelscope.pipelines import pipeline
word_segmentation = pipeline('word-segmentation',model='damo/nlp_structbert_word-segmentation_chinese-base')

输入数据，拿到结果

input_str = '今天天气不错，适合出去游玩'
print(word_segmentation(input_str))

Run

{'output': '今天 天气 不错 ， 适合 出去 游玩'}

精选文章

管理世界 | 使用文本分析词构建并测量短视主义
管理世界 | 使用经营讨论与分析测量企业数字化指标
支持开票 | Python实证指标构建与文本分析
推荐 | 社科(经管)文本分析快速指南
视频分享 | 文本分析在经管研究中的应用
从符号到嵌入：计算社会科学的两种文本表示
资料 | 量化历史学与经济学研究
长期征稿 | 欢迎各位前来投稿
17G数据集 | 深交所企业社会责任报告
70G数据集 | 上市公司定期报告数据集
27G数据集 | 使用Python对27G招股说明书进行文本分析
百度指数 | 使用qdata采集百度指数
Maigret库 | 查询某用户名在各平台网站的使用情况
MS | 使用网络算法识别创新的颠覆性与否
认知的测量 | 向量距离vs语义投影
Wordify | 发现和区分消费者词汇的工具
Asent库 | 英文文本数据情感分析
PNAS | 文本网络分析&文化桥梁Python代码实现
BERTopic库 | 使用预训练模型做话题建模
tomotopy | 速度最快的LDA主题模型
Wow~70G上市公司定期报告数据集
100min视频 | Python文本分析与会计
安装python包出现报错：Microsoft Visual 14.0 or greater is required. 怎么办？
R语言 | 使用posterdown包制作学术会议海报
R语言 | 使用ggsci包绘制sci风格图表
R语言 | 使用word2vec词向量模型

R语言 | 将多个txt汇总到一个csv文件中

继续滑动看下一个

大邓和他的Python

向上滑动看下一个

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

魔塔 | 在线中文AI模型开源社区

关于ModelScope

名词解释

一、模型探索

二、环境准备

2.1 本地开发环境

2.2 在线Notebook

三、2分钟跑通模型推理

精选文章

R语言 | 将多个txt汇总到一个csv文件中

您可能也对以下帖子感兴趣

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

生成图片，分享到微信朋友圈

魔塔 | 在线中文AI模型开源社区

关于ModelScope

名词解释

一、模型探索

二、环境准备

2.1 本地开发环境

2.2 在线Notebook

三、2分钟跑通模型推理

精选文章

R语言 | 将多个txt汇总到一个csv文件中

您可能也对以下帖子感兴趣