首页
起源大模型
文档中心
交流社区
应用中心
公共资源
资讯
关于我们
为什么需要算力测评
大模型和人类社会的未来
全部资讯
发布
创建话题
创建版块
发布帖子
登录
注册
找回密码
首页
起源大模型
文档中心
交流社区
应用中心
公共资源
资讯
关于我们
为什么需要算力测评
大模型和人类社会的未来
全部资讯
登录
注册
找回密码
AheadAI 社区
算力出租 / 模型微调 / 需求外包 / 资源互换 / 模型定制
Find what you want
热门搜索
分享
算力
A100
2024
图标卡片
这是一个图标卡片示例
原创作品
这是一个图标卡片示例
灵感来源
NEW
这是一个图标卡片示例
系统工具
GO
这是一个图标卡片示例
AheadAI 公告1
AheadAI 公告2
综合
关注
版块
热门
精华
问答
投票
最新回复
最高评分
syliu
11个月前发布
101次阅读
关注
私信
深度学习中,训练精度是什么?
概述在深度学习训练中,训练精度决定了模型计算过程中所使用的浮点数位数。不同的训练精度会直接影响显存占用、计算速度以及训练的稳定性。主流的浮点数精度有以下两种:FP32(单精度浮点数):即 32 位浮点数,是传统深度学习中最常用的精度类型。FP16(半精...
模型训练
评分
回复
分享
jiangce
10个月前发布
258次阅读
关注
私信
使用DeepSpeed遇到object has no attribute train
使用DeepSpeed运行项目时遇到报错:deepspeedzerooptimizer_stage3' object has no attribute train这可能是由于版本不兼容导致的问题。可以尝试将 transformers 模块版本降级到 4.44.2 pip install transformers==4.44.2
模型训练
评分
回复
分享
syliu
11个月前更新
116次阅读
关注
私信
Huggingface的日志系统和Python 标准日志系统的区别
我们在学习或者开发大模型的时候,经常会用到Huggingface的模型和工具,甚至Huggingface有专门的log系统。那么它和传统的Python标准日志有神区别呢?1. 什么是 Huggingface?Huggingface 是一个专门做自然语言处理(NLP)的开源平台,提供了很多现成的模型和工...
模型训练
评分
回复
分享
2217814016ltj
10个月前发布
54次阅读
关注
私信
现代深度学习处理只有预训练、微调和推理?
预训练想想看,如果你需要搭建一个网络模型来完成一个特定的图像分类的任务。首先,你需要随机初始化参数,然后开始训练网络,不断调整参数,直到网络的损失越来越小。在训练的过程中,一开始初始化的参数会不断变化。当你觉得结果很满意的时候,你就可以将训...
深度学习微科普
评分
回复
分享
jiangce
10个月前发布
150次阅读
关注
私信
unexpected keyword argument ‘padding_side’
用huggingface框架跑Chatglm项目遇到报错:TypeError: ChatGLMTokenizer._pad() got an unexpected keyword argument 'padding_side'解决方案:将 transformers 下降版本到 4.34.0或者 考虑pip install transformers==4.44.2pip install transformers==4.34.0
...
HuggingFace
评分
回复
分享
上一页
1
2
HI!请登录
登录
注册
创建话题
创建版块
发布帖子
在手机上浏览此页面
登录
没有账号?立即注册
用户名/手机号/邮箱
登录密码
记住登录
找回密码
登录
注册
已有账号,立即登录
设置用户名
手机号
验证码
发送验证码
设置密码
注册