董师周

01 / SELECTED WORK

项目经历

从研究探索、工程实现到现场交付，把复杂算法转化为可验证的业务结果。

CASE 01 · LARGE LANGUAGE MODEL

大语言模型微调与人类偏好对齐

面向通用大模型能力提升，建立从偏好数据构造到训练评测的完整工作流。

Top 6SuperCLUE 国内排名

+5内部测试集提升

70B+分布式训练规模

SFT DPO / ORPO / SimPO NeMo Slurm

挑战

提升模型真实偏好表现，同时控制偏好数据噪声与训练稳定性。

职责

负责训练算法探索、数据流程、工具调用设计、错误样例分析与标注工具开发。

方法

实践 SFT、DPO、ORPO、SimPO，并用 Streamlit、NeMo 和 Slurm 建立训练反馈闭环。

结果

模型进入 SuperCLUE 国内第六，偏好模型较指令微调基线提升 5 点以上。

CASE 02 · SPATIOTEMPORAL MODELING

大规模场景下的人脸人体时空聚类

从城市级相机网络到商场、4S 店等封闭空间，建立可落地的身份与轨迹建模方案。

+2聚类指标提升

-90%大乱档问题

多项目实际落地

时空模型轨迹建模 KNN Tkinter

挑战

跨相机身份易混淆，大规模聚类会产生严重大乱档与轨迹断裂。

职责

负责市级与封闭场景的时空模型设计、实现及标注辅助工具。

方法

结合相机 GPS、场景拓扑与轨迹约束，并开发 KNN 人脸人体身份标注工具。

结果

聚类指标提升 2 点，同时减少 90% 以上的大乱档并完成多个项目部署。

CASE 03 · COMPUTER VISION SDK

超高客流统计

独立设计基于行人轨迹的客流统计 SDK，覆盖店铺、街道与楼梯等复杂场景。

95%+普通场景准确率

92%超高客流准确率

4000+人次 / 小时

轨迹算法 SDK 现场优化交付闭环

挑战

高密度客流、徘徊行为和复杂通道会显著干扰进出人数判断。

职责

独立完成算法与 SDK 设计开发，并承担现场效果分析、优化和交付。

方法

围绕轨迹状态与区域关系规避徘徊干扰，针对不同空间定制统计策略。

结果

多次项目 PK 超过友商，4000+ 人次每小时场景准确率仍达到 92%。

个人经历

中国科学院大学深圳先进技术研究院计算机专业硕士，研究方向聚焦显著性检测、语义分割、半监督学习与视频理解。
研究生期间在深圳先进技术研究院数字所多媒体中心（Siat-MMLab）参与乔宇老师、王亚立老师团队的视频分类相关工作。
第一份工作在云从科技，主要负责大语言模型微调与人类偏好对齐、大规模场景下的人脸人体时空聚类、超高客流统计等方向。
本科毕业于重庆邮电大学计算机科学与技术专业，从大二开始在陈乔松老师实验室学习图像处理相关知识。
2024 年 7 月加入长线科技（重庆），延续产业级算法研发与落地工作。

论文

研究方向集中在显著性检测、视频理解、共显著性建模与医学影像分割。

Holistic and Deep Feature Pyramids for Saliency Detection

Shizhou Dong, Shanhui Sun, Xin Wang, Ming Li, Heye Zhang, Guang Yang, Huafeng Liu, Shuo Li

BMVC 2018

性能位于行业领先水平，分割边缘准确，不需要预训练。

查看 PDF

SaliencyGAN: Deep Learning Semi-supervised Salient Object Detection

Chengjia Wang*, Shizhou Dong*, Heye Zhang

IEEE Transactions on Industrial Informatics

减少 70% 标注数据，3K 标注图像训练即可逼近 10K 全监督方法水平。* 共同一作。

查看 PDF

3D Convolution for Video Salient Object Detection

Shizhou Dong, Zhifan Gao, Sandeep Pirbhulal, Gui-Bin Bian, Heye Zhang, Wanqing Wu, Shuo Li

Neural Computing and Applications

一种简单有效的运动信息建模方式。

查看 PDF

Deep Learning Intra-image and Inter-images Features for Co-saliency Detection

Min Li, Shizhou Dong, Kun Zhang, Zhifan Gao, Xi Wu, Heye Zhang, Guang Yang, Shuo Li

BMVC 2018

通过自编码器对多张图像中的相似内容进行联合建模。

查看 PDF

Unified Model Based on Deep Feature Pyramid and Deep Supervision for Multi-view Echocardiographic Sequences Interpretation

Ming Li, Shizhou Dong, Zhifan Gao, Alex Pui-wai Lee, Cheng Feng, Huahua Xiong, Wei Zheng, Dhanjoo Ghista, Heye Zhang, Victor Hug C. de Albuquerque

Applied Soft Computing

面向超声心电图序列的精准、鲁棒自动分割方案。

Salient Object Detection in the Distributed Cloud-Edge Intelligent Network

Zhifan Gao, Heye Zhang, Shizhou Dong, Shanhui Sun, Xin Wang, Guang Yang, Wanqing Wu, Shuo Li, Victor Hugo C. de Albuquerque

从边界、尺度、语义歧义和标注成本等角度，总结图像分割问题的核心挑战与可能解法。

阅读全文

专利

2023101033783：行人轨迹的跟踪方法、计算机设备及计算机可读存储介质，第一发明人，实审。
2022102734790：客流统计方法、系统、装置和介质，第一发明人，实审。
2019106957052：一种基于多实例学习的城市排水管道视频异常检测方法，学生第一发明人，已下证。
2019106253393：深度学习模型训练方法、装置、电子设备及存储介质，第一发明人，实审。
201911150175X：数据分类方法、装置、终端设备及可读存储介质，第一发明人，已下证。

竞赛与学习项目

SALICON Saliency Prediction Challenge (LSUN 2017)
Leaderboard 最高排名第二（用户名：Jack0521），并通过图像梯度约束提升 Saliency Probability Map 空间平滑性。结果
城市排水管道视频异常检测
公司合作项目，设计图像分类与实例分割协同学习框架，并提出 Large Margin Focal Loss 处理多标签数据不平衡问题。算法详述
复杂环境下的车牌定位
实习项目，通过亮暗区域划分解决逆光情况下车牌难定位问题。算法详述 / Code

其他信息

技能

Pytorch、Transformers、Python、C、C++、SQL

荣誉

云从科技入职培训第一名，中国科学院大学三好学生与所长奖学金，重庆邮电大学优秀学生奖学金、优秀班干部、操作系统单科第一名。

英语

英语六级。

方向关键词

显著性检测、语义分割、半监督学习、时空聚类、大模型对齐。

基本信息

项目经历

大语言模型微调与人类偏好对齐

大规模场景下的人脸人体时空聚类

超高客流统计

个人经历

最近消息

论文

Holistic and Deep Feature Pyramids for Saliency Detection

SaliencyGAN: Deep Learning Semi-supervised Salient Object Detection

3D Convolution for Video Salient Object Detection

Deep Learning Intra-image and Inter-images Features for Co-saliency Detection

Unified Model Based on Deep Feature Pyramid and Deep Supervision for Multi-view Echocardiographic Sequences Interpretation

Salient Object Detection in the Distributed Cloud-Edge Intelligent Network

知乎随笔

世界模型的N种用法

AutoResearch自主研究范式

大模型时代强化学习的收敛优势：从先验知识到优化曲面的深度解析

大模型驱动的算法工程范式转移

自动驾驶世界模型的深度演进：架构、因果推理与物理人工智能的工程范式

数据闭环产线架构设计：支撑人工智能2.0的工业化范式

具身智能的范式演进：VLA路线的有用性争鸣与技术实现

从动作奇点到具身智能：2026年大模型演进逻辑与人形机器人终极形态

LLM之我见

用二进制编码代替one-hot编码训练分类器

图像分割的难点在哪里？

专利

竞赛与学习项目

其他信息

技能

荣誉

英语

方向关键词