董师周 / Shizhou Dong
算法工程师 · 研究者 · 产业实践

董师周

聚焦大语言模型训练与偏好对齐、视觉时空建模和产业级算法系统, 从研究探索、工程实现到现场交付,把复杂算法做成可验证的业务结果。

6+ 论文与学术成果
5 专利申请与授权
3 核心工业项目方向
董师周照片

基本信息

手机:18883841206
邮箱:shizhoudong@126.com
城市:重庆
方向:LLM 微调、偏好对齐、视觉算法、时空建模

01 / SELECTED WORK

项目经历

从研究探索、工程实现到现场交付,把复杂算法转化为可验证的业务结果。

三个项目覆盖大语言模型训练、时空建模与高密度视觉统计,均按挑战、职责、方法和结果完整展开。

CASE 01 · LARGE LANGUAGE MODEL

大语言模型微调与人类偏好对齐

面向通用大模型能力提升,建立从偏好数据构造到训练评测的完整工作流。

Top 6SuperCLUE 国内排名
+5内部测试集提升
70B+分布式训练规模
SFT DPO / ORPO / SimPO NeMo Slurm
挑战

提升模型真实偏好表现,同时控制偏好数据噪声与训练稳定性。

职责

负责训练算法探索、数据流程、工具调用设计、错误样例分析与标注工具开发。

方法

实践 SFT、DPO、ORPO、SimPO,并用 Streamlit、NeMo 和 Slurm 建立训练反馈闭环。

结果

模型进入 SuperCLUE 国内第六,偏好模型较指令微调基线提升 5 点以上。

CASE 02 · SPATIOTEMPORAL MODELING

大规模场景下的人脸人体时空聚类

从城市级相机网络到商场、4S 店等封闭空间,建立可落地的身份与轨迹建模方案。

+2聚类指标提升
-90%大乱档问题
多项目实际落地
时空模型 轨迹建模 KNN Tkinter
挑战

跨相机身份易混淆,大规模聚类会产生严重大乱档与轨迹断裂。

职责

负责市级与封闭场景的时空模型设计、实现及标注辅助工具。

方法

结合相机 GPS、场景拓扑与轨迹约束,并开发 KNN 人脸人体身份标注工具。

结果

聚类指标提升 2 点,同时减少 90% 以上的大乱档并完成多个项目部署。

CASE 03 · COMPUTER VISION SDK

超高客流统计

独立设计基于行人轨迹的客流统计 SDK,覆盖店铺、街道与楼梯等复杂场景。

95%+普通场景准确率
92%超高客流准确率
4000+人次 / 小时
轨迹算法 SDK 现场优化 交付闭环
挑战

高密度客流、徘徊行为和复杂通道会显著干扰进出人数判断。

职责

独立完成算法与 SDK 设计开发,并承担现场效果分析、优化和交付。

方法

围绕轨迹状态与区域关系规避徘徊干扰,针对不同空间定制统计策略。

结果

多次项目 PK 超过友商,4000+ 人次每小时场景准确率仍达到 92%。

个人经历

  • 中国科学院大学深圳先进技术研究院计算机专业硕士,研究方向聚焦显著性检测、语义分割、半监督学习与视频理解。
  • 研究生期间在深圳先进技术研究院数字所多媒体中心(Siat-MMLab)参与乔宇老师、王亚立老师团队的视频分类相关工作。
  • 第一份工作在云从科技,主要负责大语言模型微调与人类偏好对齐、大规模场景下的人脸人体时空聚类、超高客流统计等方向。
  • 本科毕业于重庆邮电大学计算机科学与技术专业,从大二开始在陈乔松老师实验室学习图像处理相关知识。
  • 2024 年 7 月加入长线科技(重庆),延续产业级算法研发与落地工作。

最近消息

2024-07-12
已从云从科技离职,并加入长线科技(重庆)。
2020-09-07
已入职云从科技(重庆),并在入职培训中笔试成绩第一名。
02 / RESEARCH

论文

研究方向集中在显著性检测、视频理解、共显著性建模与医学影像分割。

Holistic and deep feature pyramids for saliency detection

Holistic and Deep Feature Pyramids for Saliency Detection

Shizhou Dong, Shanhui Sun, Xin Wang, Ming Li, Heye Zhang, Guang Yang, Huafeng Liu, Shuo Li
BMVC 2018

性能位于行业领先水平,分割边缘准确,不需要预训练。

查看 PDF
SaliencyGAN

SaliencyGAN: Deep Learning Semi-supervised Salient Object Detection

Chengjia Wang*, Shizhou Dong*, Heye Zhang
IEEE Transactions on Industrial Informatics

减少 70% 标注数据,3K 标注图像训练即可逼近 10K 全监督方法水平。* 共同一作。

查看 PDF
3D convolution for video salient object detection

3D Convolution for Video Salient Object Detection

Shizhou Dong, Zhifan Gao, Sandeep Pirbhulal, Gui-Bin Bian, Heye Zhang, Wanqing Wu, Shuo Li
Neural Computing and Applications

一种简单有效的运动信息建模方式。

查看 PDF
Co-saliency detection

Deep Learning Intra-image and Inter-images Features for Co-saliency Detection

Min Li, Shizhou Dong, Kun Zhang, Zhifan Gao, Xi Wu, Heye Zhang, Guang Yang, Shuo Li
BMVC 2018

通过自编码器对多张图像中的相似内容进行联合建模。

查看 PDF
multi-view echocardiographic sequences interpretation

Unified Model Based on Deep Feature Pyramid and Deep Supervision for Multi-view Echocardiographic Sequences Interpretation

Ming Li, Shizhou Dong, Zhifan Gao, Alex Pui-wai Lee, Cheng Feng, Huahua Xiong, Wei Zheng, Dhanjoo Ghista, Heye Zhang, Victor Hug C. de Albuquerque
Applied Soft Computing

面向超声心电图序列的精准、鲁棒自动分割方案。

Distributed Cloud-Edge Intelligent Network

Salient Object Detection in the Distributed Cloud-Edge Intelligent Network

Zhifan Gao, Heye Zhang, Shizhou Dong, Shanhui Sun, Xin Wang, Guang Yang, Wanqing Wu, Shuo Li, Victor Hugo C. de Albuquerque
IEEE Network

从不同语义层级出发构建分布式显著性检测框架。

03 / WRITING

知乎随笔

围绕世界模型、具身智能、大语言模型与视觉算法的长期思考。

查看全部文章
知乎文章

大模型驱动的算法工程范式转移

从任务专用模型走向通用基础模型,分析算法研发、数据组织和工程协作方式的重构。

阅读全文
知乎文章

自动驾驶世界模型的深度演进:架构、因果推理与物理人工智能的工程范式

回顾自动驾驶世界模型的架构演进,以及因果推理和物理规律在端到端系统中的工程价值。

阅读全文
知乎文章

数据闭环产线架构设计:支撑人工智能2.0的工业化范式

围绕采集、标注、训练、评估与回流,构建可持续演进的数据闭环产线。

阅读全文
知乎文章

具身智能的范式演进:VLA路线的有用性争鸣与技术实现

梳理视觉-语言-动作模型从模块化控制走向统一具身大脑的路线、争议与实现方式。

阅读全文
知乎文章

从动作奇点到具身智能:2026年大模型演进逻辑与人形机器人终极形态

从动作生成和环境交互能力出发,讨论大模型向人形机器人通用控制系统演进的可能形态。

阅读全文
知乎文章

LLM之我见

记录生成式人工智能破圈之初,对大语言模型能力、局限与行业影响的观察。

阅读全文
知乎文章

用二进制编码代替one-hot编码训练分类器

以 MNIST 实验探索二进制类别编码在分类任务中的可行性与实现方法。

阅读全文
知乎文章

图像分割的难点在哪里?

从边界、尺度、语义歧义和标注成本等角度,总结图像分割问题的核心挑战与可能解法。

阅读全文

专利

  • 2023101033783:行人轨迹的跟踪方法、计算机设备及计算机可读存储介质,第一发明人,实审。
  • 2022102734790:客流统计方法、系统、装置和介质,第一发明人,实审。
  • 2019106957052:一种基于多实例学习的城市排水管道视频异常检测方法,学生第一发明人,已下证。
  • 2019106253393:深度学习模型训练方法、装置、电子设备及存储介质,第一发明人,实审。
  • 201911150175X:数据分类方法、装置、终端设备及可读存储介质,第一发明人,已下证。

竞赛与学习项目

  • SALICON Saliency Prediction Challenge (LSUN 2017)
    Leaderboard 最高排名第二(用户名:Jack0521),并通过图像梯度约束提升 Saliency Probability Map 空间平滑性。 结果
  • 城市排水管道视频异常检测
    公司合作项目,设计图像分类与实例分割协同学习框架,并提出 Large Margin Focal Loss 处理多标签数据不平衡问题。 算法详述
  • 复杂环境下的车牌定位
    实习项目,通过亮暗区域划分解决逆光情况下车牌难定位问题。 算法详述 / Code

其他信息

技能

Pytorch、Transformers、Python、C、C++、SQL

荣誉

云从科技入职培训第一名,中国科学院大学三好学生与所长奖学金,重庆邮电大学优秀学生奖学金、优秀班干部、操作系统单科第一名。

英语

英语六级。

方向关键词

显著性检测、语义分割、半监督学习、时空聚类、大模型对齐。