首页 / 新闻概览 / 详情
校友风采 | 一位青年学者的求索之路:从计算机视觉到大模型前沿
时间:27/04/2026 记者:王楚希 摄影:受访者提供

 

本科就读土木工程专业的柴文浩,怀揣着对计算机技术的热爱,主动跨越学科边界,进入计算机视觉研究领域,聚焦行人姿态估计等课题开展研究。本科期间,在微软亚洲研究院实习的经历,让柴文浩第一次真正接触到工业界前沿项目,也让他更加清晰地认识到,前沿技术研究不仅需要扎实的技术能力,更依赖开阔的学术视野和对问题本质的深入理解。也正是在这一过程中,他进一步坚定了赴海外深造的决心,本科毕业后前往华盛顿大学攻读硕士学位,潜心深耕多模态与视频理解方向。凭借深厚扎实的知识积淀与勇于创新的开拓精神,他在学术道路上稳步积累、持续求索,不断突破研究边界,2025年秋季奔赴普林斯顿大学开启博士阶段学术征程。

 

一路走来,他从一名初入科研的学习者,逐渐成长为能够独立思考问题、推动项目落地的研究者与项目组织者。这条道路并非一帆风顺,其间有跨学科转向的挑战,也有一次次在探索与创新中重新确认方向的时刻。而始终支撑他不断向前的,是那份希望以前沿技术回应现实世界、真正创造价值的初心。

 

01 ZJUI四载,叩开学术之门

 

对柴文浩而言,ZJUI的四年是他学术人生的关键转折点——他从一名计算机前沿技术的爱好者,蜕变为立志深耕科研的准研究者。他坦言,这里不仅是他学术道路的起点,更是他最终坚定投身学术研究志向的地方。

 

而这份转变的核心契机,是ZJUI研究员、助理教授王高昂主讲的“计算机视觉”课程。“这门课几乎重塑了我对计算机视觉的认知。”此前他虽接触过机器学习,却始终觉得它像一个难以捉摸的 “黑箱”,看不清背后的运行逻辑。王高昂老师以前沿论文为核心展开教学,讲解深入浅出,让他第一次系统理解了视觉技术的复杂内核,也深刻意识到:机器学习研究绝不能停留在表层应用,必须不断追问底层机制与问题本质。

 

ZJUI鼓励本科生尽早进入实验室、参与科研的培养理念,让他得以将这份对底层逻辑的探索热情落地。大二下学期,他主动加入王高昂老师课题组,成为当时组里少数专注视觉方向的本科生。那段几乎每天泡在实验室跑实验、读论文、改代码的日子,虽辛苦却格外充实。他在行人重识别、姿态估计等基础项目中打磨出扎实的工程能力,也养成了严谨求实、注重结果可复现性的科研习惯。在柴文浩看来,这段经历最珍贵的收获,是帮他完成了从 “完成项目任务” 到 “开展独立研究”的思维转变,为后续赴美深造、深耕多模态领域筑牢了根基。

 

“可以说,如果没有 ZJUI提供的优质工程实践平台和科研机会,我不会这么早明确自己的学术方向,更不会在本科毕业后选择赴海外深造。” 柴文浩感慨道,“ZJUI的四年,不只是知识积累的四年,更是我真正建立研究者身份认同的四年。直到今天,我依然对那段不断探索、不断成长的时光心怀感激。”

 

 

02 放眼世界,逐梦更广阔的未来

 

谈及赴海外深造的选择,柴文浩坦言,这并非早就明晰的规划,而是在一步步探索中逐渐清晰的方向。刚入学时,他也认真考虑过毕业后直接进入行业工作,但随着在实验室持续深耕多模态研究,他越来越被这一计算机领域的技术魅力与广阔前景所吸引,萌生了去往更顶尖的平台、在全球学术最前沿锤炼自己的想法。

 

而大三那年进入微软亚洲研究院视频生成与理解组的宝贵实习经历,让他坚定了继续深耕学术、求学深造的信念。在与顶尖工业研究团队并肩合作的过程中,他不仅清晰看到了自己在问题判断、实验设计和研究视野上的不足,更彻底重塑了对 “高质量研究” 的认知。在他看来,真正有价值的科研,从来不是追逐局部指标的小幅提升,而是要能判断什么问题值得长期深耕,什么工作能真正回应现实需求、创造持久价值。

 

带着这样的思考,他没有选择本科直博,而是制定了更稳妥的成长路径。先进入华盛顿大学就读电子与计算机工程硕士项目,系统夯实视频理解与多模态方向的研究根基,等到积累足够后再规划博士阶段的发展。

 

硕士期间,柴文浩的学术能力迎来了全面爆发期。他主导完成了 MovieChat、AuroraCap等一系列标志性研究,相关成果接连发表于 CVPR、TPAMI、ICLR 等计算机领域顶级会议与期刊,在长视频理解领域迅速崭露头角。同时,他还牵头组织了CVPR长视频理解挑战赛,在国际学术舞台中展现出突出的领导力与影响力。2025 年,凭借清晰连贯的研究脉络和扎实亮眼的学术成果,他成功斩获普林斯顿大学计算机科学系博士录取通知书,再次踏入全球顶尖学术殿堂,完成了从入门研究者到具备独立研究能力的青年学者的关键跨越。

 

“”

▲相关研究中长视频理解中的分层记忆与推理框架

 

回望这段从本科到研究生的成长之路,“最大的蜕变,是从一名擅长完成既定任务的执行者,成长为能够主动发现问题、定义方向、追求长期学术价值的独立研究者”。

 

 

03深耕前沿,拓界赋能

 

2025年秋季,柴文浩凭借优异的学术成果与综合能力,前往普林斯顿大学攻读博士学位,核心研究方向聚焦于长上下文多模态建模与推理。

 

进入普林斯顿后,柴文浩将研究重心聚焦于长上下文多模态建模与推理这一核心方向。他敏锐地意识到,当前多模态技术正从“能不能处理多模态”转向“如何可靠地处理超长、多模态、需要深度推理的真实场景”,而编码感知与解码生成是制约该领域发展的两大根本性挑战。为此,他带领团队开展了一系列开创性研究,其中主导的VideoNSA项目被ICLR 2026接收。该工作首次将原生稀疏注意力系统性引入“视频-语言”模型,仅用3.6%的注意力预算就将上下文长度可靠扩展到 128K tokens,相当于能处理10小时以上的超长视频,在多个长视频理解基准上取得了领先表现,为解决长上下文计算爆炸问题提供了全新思路。

 

“”

▲VideoNSA 的整体框架示意图

 

除了模型架构创新,柴文浩还在大模型评估领域做出了重要贡献。作为核心成员,他参与打造了LiveCodeBench Pro系列评估基准,该系列由多所顶尖高校研究者联合开发,通过持续实时更新高质量题目、专家逐行诊断等方式,有效解决了传统基准数据污染、难度失衡的问题,成为目前评估大模型深度算法推理能力最具权威性的平台之一,相关成果相继发表在 NeurIPS 2025、ICLR 2026等国际顶级会议和期刊。

 

“”

▲柴文浩在 NeurIPS 2025 圣地亚哥会议现场发表演讲

 

对柴文浩而言,普林斯顿大学最打动他的,并不是顶尖的硬件资源,而是其独有的纯粹学术底色。“普林斯顿最珍贵的地方,是把对fundamental understanding(根本性理解)的极致追求,与小而精、重质量的学术传统完美融合在了一起。” 柴文浩说,这里聚集着一群真正沉下心来钻研长期、深层科学问题的学者。“无论是教授还是学生,大家都更愿意花时间深耕真正有价值的核心问题,而不是追逐短期热点、堆砌论文数量。这与我的研究理念完全契合:先洞察问题本质,再通过严谨实验验证完善,永远优先做正确且有长期影响力的研究。”

 

回望从ZJUI到普林斯顿的六年多跨文化学术之路,柴文浩对 “国际化学术人才” 的内涵有了更深刻的认知。它绝非仅仅是英语流利或发表顶会论文,而是扎实的科研与工程功底、独立批判性思考能力、清晰有力的学术表达,以及对前沿核心问题的敏锐洞察力与长期专注。这段融合中西的成长经历也让他愈发坚信,真正的学术成长从来不是照搬他人的路径,而是在博采不同教育体系之长的过程中,逐步建立自己的研究判断力与独特学术风格,走出一条属于自己的深耕之路。

 

离开 ZJUI 近三年,柴文浩始终牵挂着母校的发展。每当在检索文献时看到ZJUI 学子的名字,他心里总会涌起一股强烈的亲切感与自豪感。最让他惊喜的,是学院人才培养的加速度,如今越来越多的本科生在大二、大三就能发表顶会论文、斩获海外顶尖高校的录取信。看着学弟学妹们沿着自己曾经走过的成长之路快速成长,他由衷为学院的发展感到骄傲。而这些成长与突破,也正是学院始终坚持培养具有国际视野、创新精神与社会责任感的国际化交叉创新人才的生动体现。未来,愿柴文浩能继续秉持求是创新的精神,在学术探索与人生征程中笃行致远、不断突破,在更广阔的舞台上展现ZJUIer的风采。

 

 

回到顶部