董师周 / Shizhou Dong
LLM · 视觉算法 · 工业落地

董师周

2020 年毕业于中国科学院大学深圳先进技术研究院计算机专业,目前在长线科技(重庆)工作。 过往经历覆盖大语言模型微调与偏好对齐、人脸人体时空聚类、超高客流统计,以及显著性检测与语义分割方向的研究。

6+ 论文与学术成果
5 专利申请与授权
3 核心工业项目方向
董师周照片

基本信息

手机:18883841206
邮箱:shizhoudong@126.com
城市:重庆
方向:LLM 微调、偏好对齐、视觉算法、时空建模

个人经历

  • 中国科学院大学深圳先进技术研究院计算机专业硕士,研究方向聚焦显著性检测、语义分割、半监督学习与视频理解。
  • 研究生期间在深圳先进技术研究院数字所多媒体中心(Siat-MMLab)参与乔宇老师、王亚立老师团队的视频分类相关工作。
  • 第一份工作在云从科技,主要负责大语言模型微调与人类偏好对齐、大规模场景下的人脸人体时空聚类、超高客流统计等方向。
  • 本科毕业于重庆邮电大学计算机科学与技术专业,从大二开始在陈乔松老师实验室学习图像处理相关知识。
  • 2024 年 7 月加入长线科技(重庆),延续产业级算法研发与落地工作。

最近消息

2024-07-12
已从云从科技离职,并加入长线科技(重庆)。
2020-09-07
已入职云从科技(重庆),并在入职培训中笔试成绩第一名。

随笔

项目经历

聚焦产业化算法研发,覆盖大模型训练、时空建模和高并发统计场景。

大语言模型微调与人类偏好对齐

SFT DPO / ORPO / SimPO NeMo / Slurm
  • 负责指令微调、偏好对齐算法探索与训练实现。
  • 完成数据构造、筛选、工具调用流程设计以及错误样例分析。
  • 基于 Streamlit 开发偏好数据标注工具。
  • 参与训练的从容大语言模型在 SuperCLUE 2024 年 2 月排名国内第九,4 月升至第六。
  • 偏好对齐模型相对指令微调模型在内部测试集提升 5 个点以上。
  • 熟悉使用 Slurm 集群和 NeMo 分布式训练 70B+ 大语言模型。

大规模场景下的人脸人体时空聚类

时空模型 轨迹建模 标注工具
  • 负责市级人脸聚类和封闭场景下人脸人体轨迹时空模型设计与实现。
  • 完成基于相机 GPS 的市级时空模型设计,以及商场、4S 店等封闭场景轨迹建模。
  • 基于 Tkinter 开发 KNN 人脸人体身份标注工具。
  • 在聚类指标提升 2 个点的同时,减少 90% 以上的大乱档问题。
  • 方案成功落地于公司的多个实际项目。

超高客流统计

轨迹算法 SDK 落地交付
  • 独立设计并开发基于行人轨迹的客流统计算法 SDK。
  • 针对徘徊人员干扰进行规避,完成店铺、街道、楼梯等场景优化。
  • 出差现场分析算法运行情况并保障效果闭环。
  • 方案在多次项目 PK 中超过友商并成功落地。
  • 普通场景准确率 95% 以上,超高客流场景(4000+ 人次/小时)仍达 92%。

论文

研究方向集中在显著性检测、视频理解、共显著性建模与医学影像分割。

Holistic and deep feature pyramids for saliency detection

Holistic and Deep Feature Pyramids for Saliency Detection

Shizhou Dong, Shanhui Sun, Xin Wang, Ming Li, Heye Zhang, Guang Yang, Huafeng Liu, Shuo Li
BMVC 2018

性能位于行业领先水平,分割边缘准确,不需要预训练。

查看 PDF
SaliencyGAN

SaliencyGAN: Deep Learning Semi-supervised Salient Object Detection

Chengjia Wang*, Shizhou Dong*, Heye Zhang
IEEE Transactions on Industrial Informatics

减少 70% 标注数据,3K 标注图像训练即可逼近 10K 全监督方法水平。* 共同一作。

查看 PDF
3D convolution for video salient object detection

3D Convolution for Video Salient Object Detection

Shizhou Dong, Zhifan Gao, Sandeep Pirbhulal, Gui-Bin Bian, Heye Zhang, Wanqing Wu, Shuo Li
Neural Computing and Applications

一种简单有效的运动信息建模方式。

查看 PDF
Co-saliency detection

Deep Learning Intra-image and Inter-images Features for Co-saliency Detection

Min Li, Shizhou Dong, Kun Zhang, Zhifan Gao, Xi Wu, Heye Zhang, Guang Yang, Shuo Li
BMVC 2018

通过自编码器对多张图像中的相似内容进行联合建模。

查看 PDF
multi-view echocardiographic sequences interpretation

Unified Model Based on Deep Feature Pyramid and Deep Supervision for Multi-view Echocardiographic Sequences Interpretation

Ming Li, Shizhou Dong, Zhifan Gao, Alex Pui-wai Lee, Cheng Feng, Huahua Xiong, Wei Zheng, Dhanjoo Ghista, Heye Zhang, Victor Hug C. de Albuquerque
Applied Soft Computing

面向超声心电图序列的精准、鲁棒自动分割方案。

Distributed Cloud-Edge Intelligent Network

Salient Object Detection in the Distributed Cloud-Edge Intelligent Network

Zhifan Gao, Heye Zhang, Shizhou Dong, Shanhui Sun, Xin Wang, Guang Yang, Wanqing Wu, Shuo Li, Victor Hugo C. de Albuquerque
IEEE Network

从不同语义层级出发构建分布式显著性检测框架。

专利

  • 2023101033783:行人轨迹的跟踪方法、计算机设备及计算机可读存储介质,第一发明人,实审。
  • 2022102734790:客流统计方法、系统、装置和介质,第一发明人,实审。
  • 2019106957052:一种基于多实例学习的城市排水管道视频异常检测方法,学生第一发明人,已下证。
  • 2019106253393:深度学习模型训练方法、装置、电子设备及存储介质,第一发明人,实审。
  • 201911150175X:数据分类方法、装置、终端设备及可读存储介质,第一发明人,已下证。

竞赛与学习项目

  • SALICON Saliency Prediction Challenge (LSUN 2017)
    Leaderboard 最高排名第二(用户名:Jack0521),并通过图像梯度约束提升 Saliency Probability Map 空间平滑性。 结果
  • 城市排水管道视频异常检测
    公司合作项目,设计图像分类与实例分割协同学习框架,并提出 Large Margin Focal Loss 处理多标签数据不平衡问题。 算法详述
  • 复杂环境下的车牌定位
    实习项目,通过亮暗区域划分解决逆光情况下车牌难定位问题。 算法详述 / Code

其他信息

技能

Pytorch、Transformers、Python、C、C++、SQL

荣誉

云从科技入职培训第一名,中国科学院大学三好学生与所长奖学金,重庆邮电大学优秀学生奖学金、优秀班干部、操作系统单科第一名。

英语

英语六级。

方向关键词

显著性检测、语义分割、半监督学习、时空聚类、大模型对齐。