9月6日,在北京市科委、中关村管委会,海淀区政府指导下,百川智能在中关村展示中心召开主题为“百川汇海,开源共赢”的大模型发布会,宣布正式开源微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat与其4bit量化版本,并且均为免费可商用。
百川智能此次还开源了模型训练的Check Point,并宣布将发布Baichuan 2技术报告,详细介绍Baichuan 2的训练细节,帮助大模型学术机构、开发者和企业用户更深入地了解其训练过程。
据介绍,Baichuan 2-7B-Base 和 Baichuan 2-13B-Base均基于2.6万亿高质量多语言数据进行训练,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。其中,Baichuan 2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。
Baichuan2-7B 和 Baichuan2-13B 不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。
不久前,首批8家大模型通过《生成式人工智能服务管理暂行办法》备案,其中5家为京企研发的大模型。“继成为本市首批完成备案上市的大模型之后,百川智能向全行业开源新一代大模型,冲击大模型开源领域的世界领先地位,将有助于建立起我国自主可控的开源大模型生态,推动大模型在各行各业的应用与落地。”北京市科委、中关村管委会二级巡视员刘航说。
据悉,百川智能创立于今年4月,已相继发布了Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型,以及一款搜索增强大模型Baichuan-53B。截至目前,百川开源大模型总下载量已超过500万次。
相关人物