致力打造国内好用的AI产品导航平台
一群瑞士机构发布了一个新的开源人工智能模型,旨在为未来的研究和应用奠定基础。该模型由洛桑联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)和瑞士国家超级计算中心(CSCS)联合开发,名为Apertus,在拉丁语中意为“开放”。
这个名称体现了其核心原则:该模型设计和训练过程的每一个环节都向公众开放。 开发者和组织可以利用Apertus创型有建聊天机器人、翻译工具或专注于教育的应用程序。可以直接从Hugging Face下载该模型,也可以通过该项目的战略合作伙伴瑞士电信(Swisscom)访问。该模两个版本可供选择,一个是80亿参数的版本,另一个更大,有700亿参数。两个版本均在宽松的开源许可协议下发布,可用于研究、教育和商业项目。
与其他仅披露部分细节的人工智能系统不同,Apertus是一个完全开源的人工智能模型,其架构、训练数据和文档均可供查看。 “通过此次发布,我们旨在提供一个蓝图,展示如何开发一个值得信赖、拥有主权且具有包容性的人工智能模型。”洛桑联邦理工学院(EPFL)机器学习教授、瑞士人工智能倡议指导委员会成员马丁·贾吉(Martin Jaggi)表示。
他提到,Apertus将由来自瑞士国家超级计算中心(CSCS)、苏黎世联邦理工学院和洛桑联邦理工学院(EPFL)的工程师和研究人员团队定期更新。 瑞士国家超级计算中心(CSCS)主任兼苏黎世联邦理工学院教授托马斯·舒尔特斯(Thomas Schulthess)将Apertus描述为“创新的驱动力,也是增强研究、社会和行业中人工智能专业知识的一种方式”。
他表示,该项目并非典型的从研究到产品的技术转化,而是为长期使用打造基础设施的一次尝试。 训练过程涉及超过1000种语言的15万亿个词元,其中约40%的数据使用的是非英语语言。Apertus涵盖了一些大语言模型(LLM)通常不包含的语言,如瑞士德语和罗曼什语。 “Apertus是为公共利益而打造的。它是少数达到这一规模的完全开源大语言模型(LLM)之一,并且是首个将多语言性、透明度和合规性作为基础设计原则的模型。”
该项目技术负责人、苏黎世联邦理工学院研究科学家伊马诺尔·施拉格(Imanol Schlag)表示。 瑞士电信(Swisscom)已在其自主人工智能平台上部署了Apertus。“这突显了我们致力于打造一个安全、可靠的人工智能生态系统,以服务公共利益并增强瑞士的数字主权。”瑞士电信(Swisscom)研究总监丹尼尔·多博斯(Daniel Dobos)表示。 测试开源人工智能模型:访问与实际应用 虽然对于有经验的用户而言,下载Apertus并不困难,但实际使用该模型需要服务器、云资源或专用接口。
开发者可以在持续至2025年10月5日的瑞士人工智能周期间对Apertus进行测试。黑客松活动的参与者可以通过瑞士电信(Swisscom)托管的接口获得访问权限。瑞士电信(Swisscom)的商业客户也可以通过该公司的人工智能平台即刻开始使用该模型。国际用户可以通过公共人工智能推理工具使用Apertus。
“目前,Apertus是领先的公共人工智能模型,它由公共机构打造,服务于公共利益。这是我们目前为止最有力的证据,证明人工智能可以像高速公路、水或电一样,成为一种公共基础设施。”公共人工智能推理工具的首席维护者约书亚·谭(Joshua Tan)表示。
根据开源许可协议,训练数据、模型权重和中间检查点都可以获取。该模型的训练过程遵循了瑞士的数据保护规定、瑞士版权法以及欧盟人工智能法案的透明度要求。 数据集仅限于公开信息,并经过筛选以去除个人数据,同时尊重网站的退出请求。在训练开始前,还采用了伦理准则来排除不良内容。