近日,海外东谈主工智能会议2023年神经信息处理系统大会(Neural Information Processing Systems, NeurIPS)在好意思国新奥尔良召开国产色无码精品视频国产,上海科技大学智能感知与东谈主机协同涵养部重心施行室共有10篇论文入选,内容涵盖无监督医学成像、文本视频生成、绽开天下视觉认知、视觉-讲话基础模子、鲁棒深度学习、有照看强化学习等所在,展示了重心施行室在多模态场景感知与生成、多模态学习推理和负包袱的东谈主工智能表面方进取的高水平学术服从。
一、场景感知与生成
Free-Bloom: Zero-Shot Text-to-Video Generator with LLM Director and LDM Animator大讲话模子执导、扩散模子作画的零样本的文本到视频生成样貌
针对文本到视频生成(T2V)需求,商议忽视了一个无需视频数据和任何磨练的文本到视频生成框架Free-Bloom,利器具有强大图片生成才智的潜在空间扩散模子(LDMs)行为“原画师”(Animator),大讲话模子(LLMs)丰富的天下学问行为“导演”(Director),生成各样的视频。Free-Bloom不仅能生成高质料的视频,还粗莽呈现丰富的时候语义,且无需依赖振作的视频数据和大畛域磨练,有望在视频裁剪、视频告白、视频涵养和游戏等领域产生要害影响。
信息学院2022级硕士商议生黄涵卓、2022届本科毕业生冯宇凡为论文的共同第一作家,杨念念蓓涵养为通信作家。
更多信息见样式主页:GitHub - SooLab/Free-Bloom: [NeurIPS 2023] Free-Bloom: Zero-Shot Text-to-Video Generator with LLM Director and LDM Animator (https://github.com/SooLab/Free-Bloom)
Towards Label-free Scene Understanding by Vision Foundation Models基于视觉大模子的无标签场景认知
商议探索了视觉基础模子在无标签的情况下认知2D和3D场景的后劲,忽视了一种新的跨模态噪声监督 (CNS) 样貌,不错诳骗CLIP和SAM的上风同期监督2D和3D汇集。独特引入了一种臆测一致性正则化来共同磨练2D和3D汇集,并进一步使用SAM的端庄特征暗示来强制照看特征空间的一致性。施行散伙展示,该样貌在2D和3D绽开环境下无标签场景认知的才智达到了最优。
香港大学博士、上海科技大学探询学者陈润楠为论文第一作家,上海科技大学信息学院马月昕涵养和好意思国德州农工大学王文平涵养为共同通信作家。
论文说合:https://arxiv.org/pdf/2306.03899.pdf
Unsupervised Polychromatic Neural Representation for CT Metal Artifact Reduction基于无监督多色阶神经暗示的CT金属伪影去除算法商议
计较机断层扫描(CT)是一项蹙迫的临床医学成像时候。但当患者体内含有金属植入物时,传统样貌重建的CT图像会出现严重的金属伪影。本商议初度忽视一个名为Polyner的物理模子驱动的无监督神经暗示汇集,通过会通神经汇集和成像物理模子,告成重建了秘籍悉数这个词相聚能量范围的多色阶CT图像,加权计较后即可重建不受金属伪影影响的高质料CT影像。散伙暴露,该无监督Polyner模子获取了与最新监督式神经汇集模子一致的性能;且阐扬出极强的鲁棒性,远优于现存样貌。
上海科技大学信息学院2022级博士生吴晴我为论文第一作家,信息学院张玉瑶涵养为通信作家。商议由上海科技大学信息学院2021级硕士生陈利瑄、上海科技大学虞晶怡涵养、上海交通大学魏红江副涵养、中国科学时候大学周少华涵养、中国科学院计较所王册等共同协作完成。
代码请见:https://github.com/iwuqing/Polyner
论文说合:https://arxiv.org/abs/2306.15203
二、多模态学习推理
DDCoT: Duty-Distinct Chain-of-Thought Prompting for Multimodal Reasoning in Language Models让讲话模子进行多模态推理的“各司其职”念念维链辅导
近来,念念维链(Chain-of-Thought)已被应用于辅导大讲话模子效法东谈主类进行念念考,在当然讲话处理领域获取了显耀见效。但将大讲话模子和念念维链应用于多模态的场景,尤其需要视觉信息的推理,还鲜有探索。商议聚焦零样本多模态旨趣生成和诳骗,忽视“保抓批判性念念维”和“各司其职”的贪图原则,并忽视DDCoT辅导样貌和对应的视觉组件。商议在较为贫困的ScienceQA数据集上获取了零样本和微调栽培的最优散伙,并进一步量化展示了服从更多发现和模子贪图的有用性。
上海科技大学信息学院2022届本科生郑舸、2022届本科生学生杨斌和2022级硕士商议生唐嘉晋为论文共同第一作家,信息学院杨念念蓓涵养为通信作家。
笃定见样式主页:DDCoT: Duty-Distinct Chain-of-Thought Prompting for Multimodal Reasoning in Language Models (https://toneyaya.github.io/ddcot/)
Contextually Affinitive Neighborhood Refinery for Deep Clustering基于亲和邻域优化的深度聚类
频年来自监督学习为深度聚类商议提供了一种新的视角,通过促进邻域一致性来进步特征的辨认性,但是样本的土产货邻域很难提供鲁棒且各样化的监督信号。为贬责这一问题,本使命忽视了一种高效的在线重排序历程,并在基于重排序的亲和邻域里挖掘更多有信息的邻居。本使命还忽视了一种渐进的畛域过滤政策,以幸免噪声邻居带来的问题。该样貌粗莽容易地集成到通用的自监督框架中,并在多个聚类基准测试中高出了现时的开端进样貌。
上海科技大学信息学院2022级商议生余春林为论文第一作家,国产色无码精品视频国产信息学院汪婧雅涵养为通信作家,信息学院石野涵养也参与了商议使命。
样式说合:https://github.com/cly234/ConNR
三、负包袱的东谈主工智能表面
ATTA: Anomaly-aware Test-Time Adaptation for Out-of-Distribution Detection in Segmentation用于分割中散布外检测的颠倒认知测试阶段自顺应样貌
密集散布外检测所在近期主要暖和磨练和测试阶段的数据集有疏导域的情况,即假定二者之间莫得域偏移。但是在着实天下中,域偏移往往存在,并会极大影响已有的散布外检测模子性能。本商议忽视一种双层的散布外检测的框架,以共同处理域偏移和语义偏移。通过这种方式,商议东谈主员不错采取性地将模子顺应到未见过的领域,同期增强模子在检测新类别方面的才智。通过几个密集散布外检测的基准数据集考证了所提样貌的有用性。
上海科技大学信息科学与时候学院2021级硕士生郜之桐为论文第一作家,何旭明涵养为通信作家,2017级博士生颜世鹏也参与了商议使命。
代码请见: https://github.com/gaozhitong/ATTA
论文说合: https://arxiv.org/abs/2309.05994
Two Sides of The Same Coin: Bridging Deep Equilibrium Models and Neural ODEs via Homotopy Continuation一枚硬币的两面:通过同伦延拓开拓深度平衡模子和神经微分方程的长入范式
隐式模子主要有深度平衡模子DEQ和神经微分方程Neural ODE两个分支,本商议鉴戒同伦延拓的念念想,初度开拓了这两种模子之间的内在相干,揭示它们内容上是团结个问题的两个方面。在此基础上忽视了一种新的隐式模子HomoODE,禁受了深度平衡模子的超卓性能和神常常微分方程的富厚性。施行考证了HomoODE在准确率和模子大小两方面均高出了现存隐式模子。该模子还更好地解释了增广神常常微分方程Augmented Neural ODE相干于Neural ODE的阐扬会有所进步的原因。
上海科技大学是该服从的第一完成单元,信息学院2021级商议生丁枢桐与2022级商议生崔天誉为共同第一作家,信息学院石野涵养为论文的通信作家,论文协作家还包括信息学院汪婧雅涵养。
论文说合:https://openreview.net/forum?id=R2rJq5OHdr
Reduced Policy Optimization for Continuous Control with Hard Constraints从简政策优化:带硬照看安全强化学习的通用优化算法
在具有复杂硬照看的一语气搁置任务中,使用现存的照看强化学习算法濒临极大的挑战。受广义从简梯度算法GRG的启发,商议东谈主员忽视了一种被称为从简政策优化算法RPO的新样貌,其矍铄化学习与GRG相集聚以有用地处理这些复杂的硬照看。此外还开发了三个新的基准测试环境:两个机器东谈主操作任务和一个智能电网开动搁置任务。通过在这些基准测试环境上的施行,考证了RPO在蕴蓄奖励和照看违背方面比先前的照看强化学习算法更为出色的性能。
上海科技大学是该服从的第一完成单元,信息学院2021级商议生丁枢桐为第一作家,信息学院石野涵养为论文的通信作家,论文协作家还包括信息学院汪婧雅涵养和伦敦大学国王学院杜雅丽涵养。
论文说合:https://openreview.net/forum?id=fKVEMNmWqU
Fed-CO2: Cooperation of Online and Offline Models for Severe Data Heterogeneity in Federated Learning顶点数据异构下联邦学习——离线模子与在线模子的协作学习
数据异质性问题是联邦学习中的枢纽问题,现在尚无一个通用的算法框架不错贬责多种异质性问题。针对这一挑战,本商议忽视了基于模子协作的算法框架,并贪图了用户内和用户间的学问移动机制,从而更好地诳骗土产货和全局学问。神经正切核表面发挥这一算法比已有的算法FedBN具有更好的照看阐扬,并在多种数据异质秉性境下显耀优于现存的开端进样貌。
上海科技大学是该服从的第一完成单元,信息学院2021级商议生蔡中一为第一作家,信息学院石野涵养为论文的通信作家,论文协作家还包括信息学院汪婧雅涵养和日本RIKEN AIP黄伟博士。
样式说合:https://github.com/zhyczy/Fed-CO2
CSOT: Curriculum and Structure-Aware Optimal Transport for Learning with Noisy Labels带结构感知的非凸最优传输快速算法相称在带噪标签学习中的应用
现存的带噪标签学习样貌往往过度依赖模子的臆测,莫得酌量样本散布的全局或局部结构。商议忽视了一种新颖的基于课程学习和结构感知会通的最优传输问题(CSOT),同期酌量样本的散布间和散布内结构,构建一个强大的去噪和重标签赋值器。在磨练历程中,标签赋值器逐渐为具有最高置信度的样天职派可靠的标签,并具有全局可分辨性和局部一致性。
该论文第一作家是上海科技大学信息学院2021级商议生常琬星,信息学院汪婧雅涵养为论文的通信作家,信息学院石野涵养也参与了商议使命。
样式说合:https://github.com/changwxx/CSOT-for-LNL国产色无码精品视频国产