项目与服务
AceGPT:阿拉伯文-中文-英文大语言模型
2024-11-01 项目与服务
项目介绍
深圳市大数据研究院联合香港中文大学(深圳)(CUHK-Shenzhen)、沙特阿拉伯阿卜杜拉国王科技大学(KAUST)于2023年9月16日发布了AceGPT——一款针对阿拉伯语特点精心打造、具有领先性能的开源大语言模型。截止2024年底,AceGPT共有7B, 13B, 32B, 70B多个尺寸的模型,在阿拉伯语、中文和英文能力方面,该模型在多个数据集上的表现不仅远超竞争对手--由阿联酋开发的Jais模型,成为世界上最领先的开源阿拉伯语大模型,同时AceGPT的阿拉伯语能力也超越了GPT-3.5(175B),逼近GPT-4(1.7T?)。
· 项目研究重点
(1)模型训练:包括本地化数据的收集与清洗、本地化指令的构建、本地化RLAIF。
(2)模型功能研发:多模态功能、长文本、词表扩充、function call功能等。
· 主要产出
(1)顶级会议论文3篇。(2)申请中沙两国国家级项目。
· 具体应用场景及作用
服务中国出海中东的企业,为其提供阿拉伯语大模型技术,完成国产软硬件产品在中东市场的本地化开发。
· 合作模式
(1)提供API
(2)项目合作
(3)成立合资公司
访问网址:chat.acegpt.org