Transformers框架之Model学习
Transformers框架之Model学习
在Transformers快速入门中介绍了pipeline()方法的使用。Model是Transformers中重要组件之一,主要负责加载和使用模型。接下来,以翻译任务为例子,使用huggingface中的现有模型进行翻译。
一、快速使用
1 | # pileline中指定从英文翻译到中文(只针对多语言,这里是可以不指定的) |
接下来,就逐步操作,了解一下Model组件。
二、加载模型
我们需要先在huggingface中找到自己想要的模型,这里我选择Helsinki-NLP/opus-mt-en-zh,更多模型,可以在https://huggingface.co/models中获取
在线加载模型
1 | # Load model directly |
它自动从huggingface下载完模型后,会保存到 ~/.cache/huggingface/hub/models 目录下。
保存模型到本地
保存模型到本地,方便下次加载:
1 | # 保存模型 |
离线加载模型
1 | tokenizer = AutoTokenizer.from_pretrained("../model/opus-mt-en-zh") |
使用模型
1 | # 编码 |
三、查看与修改模型配置
1 | print(model.config) |
本章暂只介绍一下Model的基础用法,比如训练模型操作,后续会给出示例。
更多内容
- 查看Transformers 框架学习
- 关注微信公众号codeCraft编程工艺

本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 小鱼吃猫!

