Overfitting: From Algorithms to Silicon
LLM预训练大模型非正式评论
正在初始化搜索引擎
    • 博客
    • 标签
    • 代码片段
    • 博客
        • 2025
        • 2024
        • FP8
        • LLM
        • RL
        • Training
        • Training Dynamics
    • 标签
    • 代码片段
    回到主页
    • 元数据
      • 2024年1月20日
      • 分类于 LLM
      • 需要 1 分钟阅读时间
    LLM Pretrain

    LLM预训练大模型非正式评论

    最近调研预训练大模型时,发现了颇有意思的一些内容,准备写一些关于预训练大模型的非正式评论:

    • 关于Scaling Law的非正式评论
    • 关于模型结构的非正式评论
    • 关于优化器的非正式评论
    • 关于分布式并行训练的非正式评论
    2024年1月25日 2021年12月29日
    下一页
    关于Scaling Law的非正式评论
    Copyright © 2023 - 2025 Reiase
    Made with Material for MkDocs