团队师生成果被NeurIPS 2025录用

近日,第 39 届神经信息处理系统大会NeurIPS 2025论文录用结果揭晓,西南财经大学人工智能与数字金融四川省重点实验室通用人工智能与数字经济创新团队关于大模型轻量化的最新研究成果被录用,第一作者为 2023 级计算机科学与技术专业硕士生陈俊宇,通用人工智能团队施龙副教授为通讯作者,西南财经大学为第一单位。

Conference on Neural Information Processing Systems(NeurIPS)是人工智能和机器学习领域最具影响力的国际顶级会议之一,自 1987 年创办以来一直引领前沿研究方向。在中国计算机学会(CCF)的会议推荐列表中,NeurIPS 被评为 A类会议。近年来,NeurIPS 论文提交量屡创新高,录用率常年维持在 20%~26% 左右。NeurIPS 2025 将于 2025 年 12月 2 日至 7 日在美国圣地亚哥举办,本次会议共收到 21575 份有效投稿,共接收 5290 篇,录取率为 24.52%。

  • 研究成果:LoTA-QAF: Lossless Ternary Adaptation for Quantization-Aware Fine-Tuning
  • 学生作者:陈俊宇(硕士生,一作)、王文杰(硕士生)
  • 通讯作者:施龙副教授

论文简介

LoTA-QAF,一个旨在实现极致推理效率的量化模型微调框架。通过新颖的三值适配技术,在微调后可将适配器无损地并入量化模型权重,实现与原始量化模型完全一致的低比特推理路径。相比于QLoRA等需要混合精度计算的方法,LoTA-QAF 在推理时无任何额外计算开销,速度提升可达 1.7-2.0 倍 。同时,通过直接调整全部量化权重 ,它在性能恢复任务上超越了 16 位LoRA,真正做到了不牺牲效率,更能提升量化后的微调性能。