中国西藏自治区的人工智能(AI)发展实现了里程碑式跨越,正式从以场景应用为主导的模式转向系统性研发阶段。这一重大进展的核心标志是千亿级参数藏语基座大模型“阳光清言”V1.0的问世。
据中国新闻社报道,中国工程院院士、西藏大学教授尼玛扎西于11月30日接受采访时确认了这一成果。 “阳光清言”V1.0模型由尼玛扎西院士团队与北京智谱华章科技有限公司联合研发,其发布活动已于11月19日在拉萨举行。
该模型作为西藏自主研发的成果,训练基于约288亿个高质量藏语Token,数据内容广泛覆盖新闻、法律、医学、教育、科技等领域。 这些训练数据包括大规模的藏语单语数据、汉藏及藏英平行语料,以及藏汉双语辞典条目。 “阳光清言”V1.0具备深度的藏语语义理解和生成能力,能够流畅自然地进行问答并准确生成文本,在智能问答、文本生成和机器翻译等应用中表现卓越,同时兼具强大的汉语处理能力。 目前,该模型正依据国家相关规定进行备案,完成后将正式面向社会提供服务。
当前,AI技术在西藏社会各领域已得到广泛应用,包括政务服务、社区管理、公共服务以及生态科考等。 例如,拉萨市的社区服务中心和贡嘎机场航站楼已引入AI技术,提供智能客服和实时翻译服务。 在第二次青藏科考中,“e科考”App借助卫星网络实现了考察对象的快速全息解读和数据实时上传,大幅缩短了野外数据整理时间。
今年8月,国务院发布的《关于深入实施“人工智能+”行动的意见》为西藏人工智能的进一步发展提供了清晰的指导方向。 此外,西藏青年创业者旦增罗布及其团队自2018年起便致力于藏语语料数字化工作。他们已构建起近7000万条藏汉平行语料,并建立了覆盖140多个国家的多语种语音数据库。 该团队研发的藏语大模型DeepZang,已接入DeepSeek技术生态,实现了多语种高质量的语义理解、生成与交互,并计划于今年底面向公众上线。
通过核心基座模型的研发,西藏正积极抢占人工智能技术制高点,为推动区域经济和文化数字化转型注入强劲动力,并为其他低资源语言的智能化发展提供了可借鉴的“高原样本”。