AI创业公司MosaicML发布其语言模型MPT-30B 具有300亿参数
发布日期: 2023-06-26 16:50:14 来源: IT之家
6 月 25 日消息,AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,该模型具有 300 亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大 AI 模型在更广泛领域的运用。
MosaicML 公司的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元(约 502.44 万元人民币),远低于 GPT-3 等同类产品所需的数千万美元训练成本。此外,由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上。
据悉,MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型,可以实现更长的文本长度和对 GPU 计算的更高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往成果,当下每块 GPU 的吞吐量增加了 2.4 倍以上,可带来更快的完成时间。
除了让 AI 技术更容易获得之外,MosaicML 还专注于提高数据质量并提高模型性能。他们目前正在开发一款工具,可以帮助用户在预训练过程中分层加入特定领域的数据,以确保训练中开业实现多样化和高质量的数据组合。
MosaicML 公司表示,将模型扩展到 300 亿参数只是第一步,接下来他们将以降低成本为前提,推出体积更大、质量更高的模型。
IT之家注意到,目前开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,开发者还可以在本地硬件上使用自己的数据,对模型进行微调。
关键词:
推荐内容
- AI创业公司MosaicML发布其语言模型MPT-30B 具有300亿参数 a>
- 她将“不可能”变成“可能” a>
- 机构调研快报:超100家机构扎堆这家公司(名单) a>
- 全自动绕线市场需求旺盛,技术优势之下科瑞思有望占据先机|热消息 a>
- 【直播预告】书记、县长挂帅督战 山区教育“超速”发展 | 融媒体局长访谈 a>
- 平舆县射桥镇:积极改善人居环境 点亮“生态宜居星” 每日报道 a>
- 新蔡县化庄乡开展打击和处置非法集资宣传活动 a>
- 新蔡县自然资源局:助企再提速 实现首例项目竣工“验收即发证” a>
- 全球观天下!新蔡县栎城乡开展“践初心、奋笃行 喜迎建党102周年”主题党日活动 a>
- 文旅市场复苏势头强劲 继续释放消费潜力 a>
- 合康新能拟向美的集团定增募不超14.7亿 股价涨7.37% a>
- 中际旭创拟3亿收购君歌电子62%股权 股价跌7.44% 当前热点 a>
- 环球速读:俄罗斯动乱加剧供应担忧 欧洲天然气价跳涨13% a>
- 大摩知名空头再度唱衰美股:大幅回调的风险很高-全球速看 a>
- 传汇丰控股(00005)将宣布总部搬迁计划 依旧驻守英国伦敦 a>
- 东方帝国战斗技巧_东方帝国 新手玩法技巧攻略提示 a>
- 天天速看:加班到晚上十一点算加班吗_加班到晚上十一点 a>
- 欧股周一盘初下跌 势将创下去年10月以来最长连跌记录 a>
- 李家超:拨款100亿港元设立“产学研1+计划” 设立微电子研发院和人工智能超算中心 当前最新 a>
- 办信用卡看不看银行流水?信用卡怎么用会有利息? a>