千亿参数的对话模型ChatGLM
发布日期:2023-05-14
信息来源:国际科技创新中心网络服务平台

ChatGLM 是一个基于千亿基座模型 GLM-130B 开发得到的对话语言模型。斯坦福报告显示 GLM-130B 是全球唯一性能上可与 GPT-3 原版基座对标的双语开源千亿模型;支持英伟达和国产昇腾、海光及申威处理器进行训练和推理,也是国内唯一上榜的语言模型,已有53个国家369家机构申请使用。ChatGLM 在 GLM-130B 的基础上持续进行文本和代码预训练并通过有监督微调等技术实现人类意图对齐,具备文案写作、信息抽取、角色扮演、问答、对话等能力,在国内处于领先地位。其开源版本 ChatGLM-6B 在 Github 上收获了2.2万星标,社区内自发涌现出一大批基于 ChatGLM-6B 的二次开发项目。千亿参数的 ChatGLM 现已开启内测,申请内测可扫码关注公众号“GLM大模型”。

主办:全国科技活动周组委会 北京市人民政府 承办:全国科技活动周组委会办公室 北京市科普工作联席会议办公室
京ICP备05060936号-2  京公安备11040202500067号
千亿参数的对话模型ChatGLM
2023-05-14
信息来源:国际科技创新中心网络服务平台

ChatGLM 是一个基于千亿基座模型 GLM-130B 开发得到的对话语言模型。斯坦福报告显示 GLM-130B 是全球唯一性能上可与 GPT-3 原版基座对标的双语开源千亿模型;支持英伟达和国产昇腾、海光及申威处理器进行训练和推理,也是国内唯一上榜的语言模型,已有53个国家369家机构申请使用。ChatGLM 在 GLM-130B 的基础上持续进行文本和代码预训练并通过有监督微调等技术实现人类意图对齐,具备文案写作、信息抽取、角色扮演、问答、对话等能力,在国内处于领先地位。其开源版本 ChatGLM-6B 在 Github 上收获了2.2万星标,社区内自发涌现出一大批基于 ChatGLM-6B 的二次开发项目。千亿参数的 ChatGLM 现已开启内测,申请内测可扫码关注公众号“GLM大模型”。

主办:全国科技活动周组委会 北京市人民政府

承办:全国科技活动周组委会办公室

北京市科普工作联席会议办公室

京ICP备05060936号-2 

京公安备11040202500067号