doc: prefer ModelScope for Whisper encoder weights (closes #4) #5

Merged
fam merged 1 commits from mochi/issue-4 into main 2026-05-05 21:26:21 +00:00
Contributor

Closes #4.

What

doc/todo.md 里两处 mirror 描述更新:

  1. W1 audio.py 那条 — WhisperEncoder 权重首选 ModelScope(例如 iic/Whisper-large-v3 / iic/Whisper-small),HF mirror 留作 fallback。
  2. infra 决策那条 — mirror 列表拆三条线写清楚:sjtu/aliyun(pip)、modelscope(模型权重,首选)、hf-mirror(HF 数据集 / 权重 fallback)。

Why

ailab 在国内,从 HF(哪怕 hf-mirror)拉大权重经常被掐。ModelScope 上 iic/Whisper-* 系列是阿里官方镜像,速度稳定。先把 doc 对齐,后面真在 audio.py 里实装 wrapper 时直接照着写。

Notes

  • 纯 doc,无代码改动,不影响 CI。
  • LibriSpeech 那条没动 — 数据集仍走 HF mirror,ModelScope 上的 LibriSpeech 镜像不一定及时。

🤖 mochi bot · automated · https://famzheng.me/gitea

Closes #4. ## What `doc/todo.md` 里两处 mirror 描述更新: 1. **W1 audio.py 那条** — WhisperEncoder 权重首选 `ModelScope`(例如 `iic/Whisper-large-v3` / `iic/Whisper-small`),HF mirror 留作 fallback。 2. **infra 决策那条** — mirror 列表拆三条线写清楚:sjtu/aliyun(pip)、modelscope(模型权重,首选)、hf-mirror(HF 数据集 / 权重 fallback)。 ## Why ailab 在国内,从 HF(哪怕 hf-mirror)拉大权重经常被掐。ModelScope 上 `iic/Whisper-*` 系列是阿里官方镜像,速度稳定。先把 doc 对齐,后面真在 `audio.py` 里实装 wrapper 时直接照着写。 ## Notes - 纯 doc,无代码改动,不影响 CI。 - LibriSpeech 那条没动 — 数据集仍走 HF mirror,ModelScope 上的 LibriSpeech 镜像不一定及时。 🤖 mochi bot · automated · https://famzheng.me/gitea
mochi added 1 commit 2026-05-05 21:25:54 +00:00
doc: prefer ModelScope for Whisper encoder weights (closes #4)
smoke / nanochat-smoke (push) Successful in 33s
62642b805b
W1 todo 里 audio.py 的 WhisperEncoder 之前写的是从 HF mirror 拉权重,
国内拉 HF(哪怕走 hf-mirror)经常被卡。改成首选 ModelScope(例如
iic/Whisper-large-v3 / iic/Whisper-small),HF mirror 留作 fallback。
infra 决定那条也顺手把 mirror 列表对齐到 pip / 模型权重 / HF 数据集
三条线,写清楚 modelscope 是模型权重首选。
fam merged commit 9cae824aa5 into main 2026-05-05 21:26:21 +00:00
Sign in to join this conversation.
No Reviewers
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: fam/nanochat-omni#5