8 月 7 日,元象 XVERSE 公司宣布开源其百亿参数的高性能通用大模型 XVERSE-13B,可免费商用。
开源信息:
Hugging Face:https://huggingface.co/xverse/XVERSE-13B
Github:https://github.com/xverse-ai/XVERSE-13B
据称,XVERSE-13B 大模型基于标准 Transformer 结构,在 1.4 万亿高质量、多样化 tokens 的训练数据上,从零训练(train from scatch)了 130 亿参数大模型,支持 40 多种语言,上下文窗口大小为 8192 。元象近期还将发布大模型 Chat 版,开箱即用,持续优化开发者体验。
在多项权威的标准中文和英文测评中,XVERSE-13B 性能超越了 Llama-2-13B、Baichuan-13B 等国内外开源大模型代表。它具备了高性能、全开源、可商用等诸多优势,能大大降低高校和企业部署使用大模型的成本,不仅实现了国产可替代,也是中文应用更好的选择。
秉持开源精神,XVERSE-13B 代码采用 Apache-2.0 协议,向学术研究完全开源,企业只需简单登记,即可免费商用。
哈尔滨工业大学(下称“哈工大”)作为我国最早从事自然语言处理研究的顶级科研团队,已经率先使用 XVERSE-13B 大模型推进相关研究工作。哈工大计算机科学与技术学院张伟男教授表示,“开源是互联网时代主流模式,不仅能贡献社区,推动技术持续创新,还能利用协同解决算法透明性、稳定性、公众信任度等共性问题。”
元象 XVERSE 创始人姚星表示:“真实世界的感知智能(3D),与真实世界的认知智能(AI),是探索通用人工智能(AGI)的必由之路,也是元象持续探索 3D 与 AI 前沿技术的动力。XVERSE-13B 是我们在国产技术自立自强上迈出的一小步,而开源开放将激发大模型生态活力,让 AI 的未来发展迈出一大步,为实体经济、数字经济的发展注入强劲动力。我们期待与众多企业与开发者携手,开创大模型商用新纪元!”
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
版权申明:本文经原作者授权发布,不代表VR陀螺立场,如需转载请直接联系原作者
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息