西藏人工智能发展迈入系统研发新阶段：千亿级藏语大模型“阳光清言”V1.0正式发布

中国西藏自治区的人工智能（AI）发展实现了里程碑式跨越，正式从以场景应用为主导的模式转向系统性研发阶段。这一重大进展的核心标志是千亿级参数藏语基座大模型“阳光清言”V1.0的问世。

据中国新闻社报道，中国工程院院士、西藏大学教授尼玛扎西于11月30日接受采访时确认了这一成果。 “阳光清言”V1.0模型由尼玛扎西院士团队与北京智谱华章科技有限公司联合研发，其发布活动已于11月19日在拉萨举行。

该模型作为西藏自主研发的成果，训练基于约288亿个高质量藏语Token，数据内容广泛覆盖新闻、法律、医学、教育、科技等领域。这些训练数据包括大规模的藏语单语数据、汉藏及藏英平行语料，以及藏汉双语辞典条目。 “阳光清言”V1.0具备深度的藏语语义理解和生成能力，能够流畅自然地进行问答并准确生成文本，在智能问答、文本生成和机器翻译等应用中表现卓越，同时兼具强大的汉语处理能力。目前，该模型正依据国家相关规定进行备案，完成后将正式面向社会提供服务。

当前，AI技术在西藏社会各领域已得到广泛应用，包括政务服务、社区管理、公共服务以及生态科考等。例如，拉萨市的社区服务中心和贡嘎机场航站楼已引入AI技术，提供智能客服和实时翻译服务。在第二次青藏科考中，“e科考”App借助卫星网络实现了考察对象的快速全息解读和数据实时上传，大幅缩短了野外数据整理时间。

今年8月，国务院发布的《关于深入实施“人工智能+”行动的意见》为西藏人工智能的进一步发展提供了清晰的指导方向。此外，西藏青年创业者旦增罗布及其团队自2018年起便致力于藏语语料数字化工作。他们已构建起近7000万条藏汉平行语料，并建立了覆盖140多个国家的多语种语音数据库。该团队研发的藏语大模型DeepZang，已接入DeepSeek技术生态，实现了多语种高质量的语义理解、生成与交互，并计划于今年底面向公众上线。

通过核心基座模型的研发，西藏正积极抢占人工智能技术制高点，为推动区域经济和文化数字化转型注入强劲动力，并为其他低资源语言的智能化发展提供了可借鉴的“高原样本”。

西藏人工智能发展迈入系统研发新阶段：千亿级藏语大模型“阳光清言”V1.0正式发布

发表回复