董师周 / Shizhou Dong
LLM · 视觉算法 · 工业落地

董师周

2020 年毕业于中国科学院大学深圳先进技术研究院计算机专业,目前在长线科技(重庆)工作。 过往经历覆盖大语言模型微调与偏好对齐、人脸人体时空聚类、超高客流统计,以及显著性检测与语义分割方向的研究。

6+ 论文与学术成果
5 专利申请与授权
3 核心工业项目方向
董师周照片

基本信息

手机:18883841206
邮箱:shizhoudong@126.com
城市:重庆
方向:LLM 微调、偏好对齐、视觉算法、时空建模

个人经历

  • 中国科学院大学深圳先进技术研究院计算机专业硕士,研究方向聚焦显著性检测、语义分割、半监督学习与视频理解。
  • 研究生期间在深圳先进技术研究院数字所多媒体中心(Siat-MMLab)参与乔宇老师、王亚立老师团队的视频分类相关工作。
  • 第一份工作在云从科技,主要负责大语言模型微调与人类偏好对齐、大规模场景下的人脸人体时空聚类、超高客流统计等方向。
  • 本科毕业于重庆邮电大学计算机科学与技术专业,从大二开始在陈乔松老师实验室学习图像处理相关知识。
  • 2024 年 7 月加入长线科技(重庆),延续产业级算法研发与落地工作。

最近消息

2024-07-12
已从云从科技离职,并加入长线科技(重庆)。
2020-09-07
已入职云从科技(重庆),并在入职培训中笔试成绩第一名。
01 / WRITING

知乎随笔

围绕世界模型、具身智能、大语言模型与视觉算法的长期思考。

查看全部文章
知乎文章

大模型驱动的算法工程范式转移

从任务专用模型走向通用基础模型,分析算法研发、数据组织和工程协作方式的重构。

阅读全文
知乎文章

自动驾驶世界模型的深度演进:架构、因果推理与物理人工智能的工程范式

回顾自动驾驶世界模型的架构演进,以及因果推理和物理规律在端到端系统中的工程价值。

阅读全文
知乎文章

数据闭环产线架构设计:支撑人工智能2.0的工业化范式

围绕采集、标注、训练、评估与回流,构建可持续演进的数据闭环产线。

阅读全文
知乎文章

具身智能的范式演进:VLA路线的有用性争鸣与技术实现

梳理视觉-语言-动作模型从模块化控制走向统一具身大脑的路线、争议与实现方式。

阅读全文
知乎文章

从动作奇点到具身智能:2026年大模型演进逻辑与人形机器人终极形态

从动作生成和环境交互能力出发,讨论大模型向人形机器人通用控制系统演进的可能形态。

阅读全文
知乎文章

LLM之我见

记录生成式人工智能破圈之初,对大语言模型能力、局限与行业影响的观察。

阅读全文
知乎文章

用二进制编码代替one-hot编码训练分类器

以 MNIST 实验探索二进制类别编码在分类任务中的可行性与实现方法。

阅读全文
知乎文章

图像分割的难点在哪里?

从边界、尺度、语义歧义和标注成本等角度,总结图像分割问题的核心挑战与可能解法。

阅读全文

项目经历

聚焦产业化算法研发,覆盖大模型训练、时空建模和高并发统计场景。

大语言模型微调与人类偏好对齐

SFT DPO / ORPO / SimPO NeMo / Slurm
  • 负责指令微调、偏好对齐算法探索与训练实现。
  • 完成数据构造、筛选、工具调用流程设计以及错误样例分析。
  • 基于 Streamlit 开发偏好数据标注工具。
  • 参与训练的从容大语言模型在 SuperCLUE 2024 年 2 月排名国内第九,4 月升至第六。
  • 偏好对齐模型相对指令微调模型在内部测试集提升 5 个点以上。
  • 熟悉使用 Slurm 集群和 NeMo 分布式训练 70B+ 大语言模型。

大规模场景下的人脸人体时空聚类

时空模型 轨迹建模 标注工具
  • 负责市级人脸聚类和封闭场景下人脸人体轨迹时空模型设计与实现。
  • 完成基于相机 GPS 的市级时空模型设计,以及商场、4S 店等封闭场景轨迹建模。
  • 基于 Tkinter 开发 KNN 人脸人体身份标注工具。
  • 在聚类指标提升 2 个点的同时,减少 90% 以上的大乱档问题。
  • 方案成功落地于公司的多个实际项目。

超高客流统计

轨迹算法 SDK 落地交付
  • 独立设计并开发基于行人轨迹的客流统计算法 SDK。
  • 针对徘徊人员干扰进行规避,完成店铺、街道、楼梯等场景优化。
  • 出差现场分析算法运行情况并保障效果闭环。
  • 方案在多次项目 PK 中超过友商并成功落地。
  • 普通场景准确率 95% 以上,超高客流场景(4000+ 人次/小时)仍达 92%。

论文

研究方向集中在显著性检测、视频理解、共显著性建模与医学影像分割。

Holistic and deep feature pyramids for saliency detection

Holistic and Deep Feature Pyramids for Saliency Detection

Shizhou Dong, Shanhui Sun, Xin Wang, Ming Li, Heye Zhang, Guang Yang, Huafeng Liu, Shuo Li
BMVC 2018

性能位于行业领先水平,分割边缘准确,不需要预训练。

查看 PDF
SaliencyGAN

SaliencyGAN: Deep Learning Semi-supervised Salient Object Detection

Chengjia Wang*, Shizhou Dong*, Heye Zhang
IEEE Transactions on Industrial Informatics

减少 70% 标注数据,3K 标注图像训练即可逼近 10K 全监督方法水平。* 共同一作。

查看 PDF
3D convolution for video salient object detection

3D Convolution for Video Salient Object Detection

Shizhou Dong, Zhifan Gao, Sandeep Pirbhulal, Gui-Bin Bian, Heye Zhang, Wanqing Wu, Shuo Li
Neural Computing and Applications

一种简单有效的运动信息建模方式。

查看 PDF
Co-saliency detection

Deep Learning Intra-image and Inter-images Features for Co-saliency Detection

Min Li, Shizhou Dong, Kun Zhang, Zhifan Gao, Xi Wu, Heye Zhang, Guang Yang, Shuo Li
BMVC 2018

通过自编码器对多张图像中的相似内容进行联合建模。

查看 PDF
multi-view echocardiographic sequences interpretation

Unified Model Based on Deep Feature Pyramid and Deep Supervision for Multi-view Echocardiographic Sequences Interpretation

Ming Li, Shizhou Dong, Zhifan Gao, Alex Pui-wai Lee, Cheng Feng, Huahua Xiong, Wei Zheng, Dhanjoo Ghista, Heye Zhang, Victor Hug C. de Albuquerque
Applied Soft Computing

面向超声心电图序列的精准、鲁棒自动分割方案。

Distributed Cloud-Edge Intelligent Network

Salient Object Detection in the Distributed Cloud-Edge Intelligent Network

Zhifan Gao, Heye Zhang, Shizhou Dong, Shanhui Sun, Xin Wang, Guang Yang, Wanqing Wu, Shuo Li, Victor Hugo C. de Albuquerque
IEEE Network

从不同语义层级出发构建分布式显著性检测框架。

专利

  • 2023101033783:行人轨迹的跟踪方法、计算机设备及计算机可读存储介质,第一发明人,实审。
  • 2022102734790:客流统计方法、系统、装置和介质,第一发明人,实审。
  • 2019106957052:一种基于多实例学习的城市排水管道视频异常检测方法,学生第一发明人,已下证。
  • 2019106253393:深度学习模型训练方法、装置、电子设备及存储介质,第一发明人,实审。
  • 201911150175X:数据分类方法、装置、终端设备及可读存储介质,第一发明人,已下证。

竞赛与学习项目

  • SALICON Saliency Prediction Challenge (LSUN 2017)
    Leaderboard 最高排名第二(用户名:Jack0521),并通过图像梯度约束提升 Saliency Probability Map 空间平滑性。 结果
  • 城市排水管道视频异常检测
    公司合作项目,设计图像分类与实例分割协同学习框架,并提出 Large Margin Focal Loss 处理多标签数据不平衡问题。 算法详述
  • 复杂环境下的车牌定位
    实习项目,通过亮暗区域划分解决逆光情况下车牌难定位问题。 算法详述 / Code

其他信息

技能

Pytorch、Transformers、Python、C、C++、SQL

荣誉

云从科技入职培训第一名,中国科学院大学三好学生与所长奖学金,重庆邮电大学优秀学生奖学金、优秀班干部、操作系统单科第一名。

英语

英语六级。

方向关键词

显著性检测、语义分割、半监督学习、时空聚类、大模型对齐。