世界模型的N种用法
从具身智能与自动驾驶出发,梳理世界模型理解物理世界、预测未来状态和辅助决策的多种路径。
阅读全文2020 年毕业于中国科学院大学深圳先进技术研究院计算机专业,目前在长线科技(重庆)工作。 过往经历覆盖大语言模型微调与偏好对齐、人脸人体时空聚类、超高客流统计,以及显著性检测与语义分割方向的研究。
围绕世界模型、具身智能、大语言模型与视觉算法的长期思考。
从具身智能与自动驾驶出发,梳理世界模型理解物理世界、预测未来状态和辅助决策的多种路径。
阅读全文解读 AutoResearch 如何把大语言模型、公开知识与自动实验结合成持续迭代的自主研究工作流。
阅读全文讨论预训练先验如何改变强化学习的探索空间、奖励利用效率与优化曲面。
阅读全文从任务专用模型走向通用基础模型,分析算法研发、数据组织和工程协作方式的重构。
阅读全文回顾自动驾驶世界模型的架构演进,以及因果推理和物理规律在端到端系统中的工程价值。
阅读全文围绕采集、标注、训练、评估与回流,构建可持续演进的数据闭环产线。
阅读全文梳理视觉-语言-动作模型从模块化控制走向统一具身大脑的路线、争议与实现方式。
阅读全文从动作生成和环境交互能力出发,讨论大模型向人形机器人通用控制系统演进的可能形态。
阅读全文记录生成式人工智能破圈之初,对大语言模型能力、局限与行业影响的观察。
阅读全文以 MNIST 实验探索二进制类别编码在分类任务中的可行性与实现方法。
阅读全文从边界、尺度、语义歧义和标注成本等角度,总结图像分割问题的核心挑战与可能解法。
阅读全文聚焦产业化算法研发,覆盖大模型训练、时空建模和高并发统计场景。
研究方向集中在显著性检测、视频理解、共显著性建模与医学影像分割。
性能位于行业领先水平,分割边缘准确,不需要预训练。
查看 PDF
减少 70% 标注数据,3K 标注图像训练即可逼近 10K 全监督方法水平。* 共同一作。
查看 PDF
一种简单有效的运动信息建模方式。
查看 PDF
通过自编码器对多张图像中的相似内容进行联合建模。
查看 PDF
面向超声心电图序列的精准、鲁棒自动分割方案。
从不同语义层级出发构建分布式显著性检测框架。
Pytorch、Transformers、Python、C、C++、SQL
云从科技入职培训第一名,中国科学院大学三好学生与所长奖学金,重庆邮电大学优秀学生奖学金、优秀班干部、操作系统单科第一名。
英语六级。
显著性检测、语义分割、半监督学习、时空聚类、大模型对齐。