7b29fff2c82633897232450a2a5af00af33e3d18
调研内容包括: - 总体技术方案 (Encoder + Projection + LoRA, 三阶段训练) - 硬件对比 (3090/4090/5090/GB10/B40) - 数据集规划 (S1 弱对齐 + S2 指令 + S3 偏好) - 8 周执行计划, 4 周 MVP - 结论: 可行, 建议立即启动
nanochat-omni
NanoChat 多模态增强实验 (Omni) — 质感感知语音输入
Languages
Python
76.7%
Jupyter Notebook
16.2%
HTML
3.7%
Shell
3.4%