社区 | AheadAI

AheadAI 社区

算力出租 / 模型微调 / 需求外包 / 资源互换 / 模型定制

热门搜索

分享算力 A100 2024

等级-LV1-社区 | AheadAI

1年前发布169次阅读

推理、演绎、归纳：为何只有神经网络一家独大？

前言：机器学习算法思想归类在神经网络火起来之间前，其实由各种流派的存在，而不仅仅是神经网络一家独大。在机器学习中，我们学过许多分类聚类问题的解决办法，比如：纯概率论的K均值聚类、基于先验知识的贝叶斯分类、支持向量机、神经网络等等。那为什么到...

深度学习微科普

评分

等级-LV1-社区 | AheadAI

2年前发布143次阅读

模型训练时，验证集是什么？验证的过程是推理吗？

出现此错误的原因是 evaluation_strategy="epoch" 指定了每个 epoch 后进行验证，但 Trainer 未传入 eval_dataset，导致验证数据...

模型训练时，验证集是什么？验证的过程是推理吗？-社区 | AheadAI

模型训练时，验证集是什么？验证的过程是推理吗？-社区 | AheadAI

8

等级-LV1-社区 | AheadAI

2年前发布236次阅读

MAX_STEPS 和 NUM_EPOCHS 的定义

在深度学习中，"迭代"(iteration)通常指的是step，也就是每一次参数更新的过程。下面两个是训练模型时常见的参数。1. MAX_STEPS ...

MAX_STEPS 和 NUM_EPOCHS 的定义-社区 | AheadAI

MAX_STEPS 和 NUM_EPOCHS 的定义-社区 | AheadAI

MAX_STEPS 和 NUM_EPOCHS 的定义-社区 | AheadAI

MAX_STEPS 和 NUM_EPOCHS 的定义-社区 | AheadAI

1

等级-LV1-社区 | AheadAI

2年前更新188次阅读

OpenCV 报错问题及解决方案

问题描述：在已经pip安装了 opencv-python 的情况下，运行程序时依然报错如下：ImportError: libGL.so.1: cannot open shared ob...

OpenCV 报错问题及解决方案-社区 | AheadAI

4

等级-LV1-社区 | AheadAI

2年前更新123次阅读

ModuleNotFoundError: No module named ‘tensorflow’解决方案

问题描述：模型训练运行 `transformers` 库时，尽管未直接使用 TensorFlow，仍出现以下错误：ModuleNotFoundError: No module named 'tensorflow'原因分析：`transformers` 库支持多个深度学习框架（如 PyTorch、TensorFlow、Flax）。即使只使用 PyTorch，...

评分

等级-LV1-社区 | AheadAI

2年前发布181次阅读

训练日志设置：更新了log的名字和路径，为什么没有生效？

问题：我在训练脚本中将log的命名更改如下，logging.basicConfig(filename="training_log_large.log", level=logging.INFO, form...

训练日志设置：更新了log的名字和路径，为什么没有生效？-社区 | AheadAI

评分

等级-LV1-社区 | AheadAI

2年前发布166次阅读

深度学习中，训练精度是什么？

概述在深度学习训练中，训练精度决定了模型计算过程中所使用的浮点数位数。不同的训练精度会直接影响显存占用、计算速度以及训练的稳定性。主流的浮点数精度有以下两种：FP32（单精度浮点数）：即 32 位浮点数，是传统深度学习中最常用的精度类型。FP16（半精...

评分

等级-LV1-社区 | AheadAI

2年前更新160次阅读

Huggingface的日志系统和Python 标准日志系统的区别

我们在学习或者开发大模型的时候，经常会用到Huggingface的模型和工具，甚至Huggingface有专门的log系统。那么它和传统的Python标准日志有神区别呢？1. 什么是 Huggingface？Huggingface 是一个专门做自然语言处理(NLP)的开源平台，提供了很多现成的模型和工...

评分

等级-LV1-社区 | AheadAI

2年前发布187次阅读

安装pydensecrf报错Preparing metadata (pyproject.toml) error

安装pydensecrf的时候直接采用：pip install pydensecrf或者通过下载到本地手动安装都会报错：Preparing metadata (pyproject.toml) error这里首先考虑python版本问题，考虑使用python10.0或者python3.7.或者，输入：python -c "import platform; print(platf...

5

等级-LV1-社区 | AheadAI

2年前发布103次阅读

conda create报错’conda init –help’

conda create创建conda环境时报错如下：See 'conda init --help' for more information and options.
IMPORTANT: You may need to close and restart your shell after running 'conda init'. 说明当前环境conda还未正确配置，需要根据当前的环境来配置conda...

5

等级-LV1-社区 | AheadAI

2年前发布143次阅读

监督or半监督or无监督

1. 监督学习模型定义：监督学习使用标注数据进行训练，即每个输入样本都对应一个已知的正确输出（标签）。模型的目标是学习输入与输出之间的映射关系。优点：准确性高：因为使用了标注数据，模型通常能取得高预测性能。目标明确：直接优化任务相关的指标（...

评分

等级-LV1-社区 | AheadAI

2年前发布158次阅读

模块不在python搜索路径中？

在复现sam2Long项目中报错：Traceback (most recent call last): File "/data/coding/./tools/vos_inference.py", line 14, in <module> from sam2.build_sam import build_sam2_video_predictor
ModuleNotFoundError: No module named 'sam2' 报错原...

评分

等级-LV1-社区 | AheadAI

2年前发布129次阅读

如何使用HuggingFace镜像站

HuggingFace镜像站：https://hf-mirror.com首先将环境变量的配置命令写入到终端的配置文件中，使得终端自动加载该环境变量：export HF_ENDPOINT="https://hf-mirror.com"Linux 写入到~/.bashrc中：echo 'export HF_ENDPOINT="https://hf-mirror.com"' >>...

评分

等级-LV1-社区 | AheadAI

2年前发布105次阅读

Git LFS (Large File Storage) 使用笔记

Git LFS 用于管理 Git 仓库中的大文件。如果你看到你本来下载的文件应该很大，但是使用ll命令发现文件很小，那说明你并没有成功地完整下载你的文件。以下是使用 git lfs pull 命令的基本笔记和示例：1. 安装 Git LFS首先需要确保你已经安装了 Git LFS。如果没...

评分

等级-LV1-社区 | AheadAI

2年前更新483次阅读

安装mamba时报错bare_metal_version

Pip subprocess error: error: subprocess-exited-with-error × python setup.py egg_info did not run successfully. │ exit code: 1 ╰─> [13 lines of output] /tmp/pip-install-7e7f_vg1/causal-conv1d_3fd110caa2f74677ba1ef37b4d457a12/setup.py:...

评分

等级-LV1-社区 | AheadAI

2年前发布967次阅读

no_sync 与 ZeRO Stage 3 冲突

如遇报错：AssertionError: no_sync context manager is incompatible with gradient partitioning logic of ZeRO stage 3这个错误是由于在 ZeRO Stage 3（DeepSpeed 的梯度优化阶段 3）中，使用了 no_sync 上下文管理器，而 no_sync 与 ZeRO Stage 3 的梯度...

5

等级-LV1-社区 | AheadAI

2年前发布354次阅读

使用DeepSpeed遇到object has no attribute train

使用DeepSpeed运行项目时遇到报错：deepspeedzerooptimizer_stage3' object has no attribute train这可能是由于版本不兼容导致的问题。可以尝试将 transformers 模块版本降级到 4.44.2 pip install transformers==4.44.2

评分

等级-LV1-社区 | AheadAI

2年前发布102次阅读

现代深度学习处理只有预训练、微调和推理？

预训练想想看，如果你需要搭建一个网络模型来完成一个特定的图像分类的任务。首先，你需要随机初始化参数，然后开始训练网络，不断调整参数，直到网络的损失越来越小。在训练的过程中，一开始初始化的参数会不断变化。当你觉得结果很满意的时候，你就可以将训...

深度学习微科普

评分

等级-LV1-社区 | AheadAI

2年前发布242次阅读

unexpected keyword argument ‘padding_side’

用huggingface框架跑Chatglm项目遇到报错：TypeError: ChatGLMTokenizer._pad() got an unexpected keyword argument 'padding_side'解决方案:将 transformers 下降版本到 4.34.0或者考虑pip install transformers==4.44.2pip install transformers==4.34.0
...

评分

等级-LV1-社区 | AheadAI

2年前发布482次阅读

is not supported for `4-bit` or `8-bit` bitsandbytes models

用huggingface框架项目遇到报错：ValueError: `.to` is not supported for `4-bit` or `8-bit` bitsandbytes models. Please use the model as it is, since the model has already been set to the correct devices and casted to the correct `dtype`.解决...

评分