HyperAI

由英国利兹大学交通研究院的研究员 Mahdi Rezaei 开源的 DeepSOCIAL 人群距离监测项目，成了最近的网红应用。线上源码教程访问

DeepSOCIAL 是通过 YOLOv4 实现行人检测，再用 SORT 实现目标跟踪，并通过单目视觉 IPM 逆透视映射实现距离估计，最终评估人群距离监测和风险评估。

之所以 DeepSOCIAL 能成为网红教程，不仅仅因为该项目在当前疫情中的实用性强，也因为该项目效果极佳，平均精度达到 99.8 %，实时速度为 24.1 fps，可用于自主车辆、人体行为识别、异常检测、体育运动、人群分析等领域。

行人检测：YOLO v4

在 DeepSOCIAL 项目中选用了 YOLOv4 来实现行人目标检测，在论文中作者对比了几种目标检测方法：RCNN 、 fast RCNN 、 faster RCNN 、 SSD 、 YOLO 在数据集 PASCAL Visual Object Classes（VOC）和 MS COCO 中进行了测试。

用目标检测中用于衡量识别精度与速度的：mAP 全类平均正确率（mean Average Precision）和 FPS 帧率（Frame Per Second）进行评估。

最终选定了 YOLOv4 作为目标检测方法。

行人跟踪：SORT

在 DeepSOCIAL 的行人目标跟踪方面，选用了 Simple Online and Real-time（SORT）算法。

其中主要使用了卡尔曼滤波（Kalman Filter）结合匈牙利算法 (Hungarian algorithm) 解决动作预测和数据关联的问题。

行人距离估计：IPM 逆透视映射

DeepSOCIAL 项目中使用单目视觉，但是使用单个摄像机，将三维世界场景投影到二维透视图像平面，容易导致物体之间的像素距离失真。

**通过应用 IPM 二维像素点（u，v）将被映射到相应的三维世界场景坐标点（Xw，Yw，Zw）**

在三维空间中，每个框的中心或参考点与三个参数 (x,y,z) 相关联，而在从相机接收到的图像中，原来的三维空间被缩减为二维 (x,y)，深度参数 (z) 不可用。

为了应用校准的 IPM（逆透视映射）过渡，首先需要通过设置深度参数 z = 0 来消除透视效果，进行摄像机校准，同时还需要知道相机的位置，高度，视野等。

项目运行

1. 引入依赖

from IPython.display import display, Javascript, Image
from base64 import b64decode, b64encode
import os
import cv2
import numpy as np
import PIL
import io
import html
import time
import matplotlib.pyplot as plt
%matplotlib inline

2. 编译 YOLOv4

%cd darknet !sed -i 's/OPENCV=0/OPENCV=1/' Makefile!sed -i 's/GPU=0/GPU=1/' Makefile!sed -i 's/CUDNN=0/CUDNN=1/' Makefile!sed -i 's/CUDNN_HALF=0/CUDNN_HALF=1/' Makefile!sed -i 's/LIBSO=0/LIBSO=1/' Makefile

3. 使用 Darknet 的 Python 接口

# 导入 Darknet 函数来执行对象检测
from darknet2 import *

# 载入 YOLOv4 架构
network, class_names, class_colors = load_network("cfg/yolov4.cfg", "cfg/coco.data", "/openbayes/input/input0/DeepSocial.weights")
width = network_width(network)
height = network_height(network)

# 在图像上运行 Darknet helper 函数
def darknet_helper(img, width, height):
  darknet_image = make_image(width, height, 3)
  img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  img_resized = cv2.resize(img_rgb, (width, height),
                              interpolation=cv2.INTER_LINEAR)

  # 获取图像比例，将边界框转换为适当的尺寸
  img_height, img_width, _ = img.shape
  width_ratio = img_width/width
  height_ratio = img_height/height

  # 运行 Darknet 模型
  copy_image_from_bytes(darknet_image, img_resized.tobytes())
  detections = detect_image(network, class_names, darknet_image)
  free_image(darknet_image)
  return detections, width_ratio, height_ratio

4. 使用 SORT 实现实时跟踪目标

!pip install filterpyfrom sort import *mot_tracker    = Sort(max_age=25, min_hits=4, iou_threshold=0.3)

5. 输入设置

Input            = "/openbayes/input/input1/OxfordTownCentreDataset.avi"
ReductionFactor  = 2
calibration      = [[180,162],[618,0],[552,540],[682,464]]

6.DeepSocial 参数设置和函数引入

7. 推理过程

8. 展示结果

行人目标检测&ID 分配
行人目标跟踪&距离测定
人群聚集热力图
6&7 部分代码较长，请访问原教程

由英国利兹大学交通研究院的研究员 Mahdi Rezaei 开源的 DeepSOCIAL 人群距离监测项目，成了最近的网红应用。线上源码教程访问

DeepSOCIAL 是通过 YOLOv4 实现行人检测，再用 SORT 实现目标跟踪，并通过单目视觉 IPM 逆透视映射实现距离估计，最终评估人群距离监测和风险评估。

行人检测：YOLO v4

用目标检测中用于衡量识别精度与速度的：mAP 全类平均正确率（mean Average Precision）和 FPS 帧率（Frame Per Second）进行评估。

最终选定了 YOLOv4 作为目标检测方法。

行人跟踪：SORT

在 DeepSOCIAL 的行人目标跟踪方面，选用了 Simple Online and Real-time（SORT）算法。

其中主要使用了卡尔曼滤波（Kalman Filter）结合匈牙利算法 (Hungarian algorithm) 解决动作预测和数据关联的问题。

行人距离估计：IPM 逆透视映射

DeepSOCIAL 项目中使用单目视觉，但是使用单个摄像机，将三维世界场景投影到二维透视图像平面，容易导致物体之间的像素距离失真。

项目运行

1. 引入依赖

from IPython.display import display, Javascript, Image
from base64 import b64decode, b64encode
import os
import cv2
import numpy as np
import PIL
import io
import html
import time
import matplotlib.pyplot as plt
%matplotlib inline

2. 编译 YOLOv4

%cd darknet !sed -i 's/OPENCV=0/OPENCV=1/' Makefile!sed -i 's/GPU=0/GPU=1/' Makefile!sed -i 's/CUDNN=0/CUDNN=1/' Makefile!sed -i 's/CUDNN_HALF=0/CUDNN_HALF=1/' Makefile!sed -i 's/LIBSO=0/LIBSO=1/' Makefile

3. 使用 Darknet 的 Python 接口

# 导入 Darknet 函数来执行对象检测
from darknet2 import *

# 载入 YOLOv4 架构
network, class_names, class_colors = load_network("cfg/yolov4.cfg", "cfg/coco.data", "/openbayes/input/input0/DeepSocial.weights")
width = network_width(network)
height = network_height(network)

# 在图像上运行 Darknet helper 函数
def darknet_helper(img, width, height):
  darknet_image = make_image(width, height, 3)
  img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  img_resized = cv2.resize(img_rgb, (width, height),
                              interpolation=cv2.INTER_LINEAR)

  # 获取图像比例，将边界框转换为适当的尺寸
  img_height, img_width, _ = img.shape
  width_ratio = img_width/width
  height_ratio = img_height/height

  # 运行 Darknet 模型
  copy_image_from_bytes(darknet_image, img_resized.tobytes())
  detections = detect_image(network, class_names, darknet_image)
  free_image(darknet_image)
  return detections, width_ratio, height_ratio

4. 使用 SORT 实现实时跟踪目标

!pip install filterpyfrom sort import *mot_tracker    = Sort(max_age=25, min_hits=4, iou_threshold=0.3)

5. 输入设置

Input            = "/openbayes/input/input1/OxfordTownCentreDataset.avi"
ReductionFactor  = 2
calibration      = [[180,162],[618,0],[552,540],[682,464]]

6.DeepSocial 参数设置和函数引入

7. 推理过程

8. 展示结果

行人目标检测&ID 分配
行人目标跟踪&距离测定
人群聚集热力图
6&7 部分代码较长，请访问原教程

由英国利兹大学交通研究院的研究员 Mahdi Rezaei 开源的 DeepSOCIAL 人群距离监测项目，成了最近的网红应用。线上源码教程访问

DeepSOCIAL 是通过 YOLOv4 实现行人检测，再用 SORT 实现目标跟踪，并通过单目视觉 IPM 逆透视映射实现距离估计，最终评估人群距离监测和风险评估。

行人检测：YOLO v4

用目标检测中用于衡量识别精度与速度的：mAP 全类平均正确率（mean Average Precision）和 FPS 帧率（Frame Per Second）进行评估。

最终选定了 YOLOv4 作为目标检测方法。

行人跟踪：SORT

在 DeepSOCIAL 的行人目标跟踪方面，选用了 Simple Online and Real-time（SORT）算法。

其中主要使用了卡尔曼滤波（Kalman Filter）结合匈牙利算法 (Hungarian algorithm) 解决动作预测和数据关联的问题。

行人距离估计：IPM 逆透视映射

DeepSOCIAL 项目中使用单目视觉，但是使用单个摄像机，将三维世界场景投影到二维透视图像平面，容易导致物体之间的像素距离失真。

项目运行

1. 引入依赖

from IPython.display import display, Javascript, Image
from base64 import b64decode, b64encode
import os
import cv2
import numpy as np
import PIL
import io
import html
import time
import matplotlib.pyplot as plt
%matplotlib inline

2. 编译 YOLOv4

%cd darknet !sed -i 's/OPENCV=0/OPENCV=1/' Makefile!sed -i 's/GPU=0/GPU=1/' Makefile!sed -i 's/CUDNN=0/CUDNN=1/' Makefile!sed -i 's/CUDNN_HALF=0/CUDNN_HALF=1/' Makefile!sed -i 's/LIBSO=0/LIBSO=1/' Makefile

3. 使用 Darknet 的 Python 接口

# 导入 Darknet 函数来执行对象检测
from darknet2 import *

# 载入 YOLOv4 架构
network, class_names, class_colors = load_network("cfg/yolov4.cfg", "cfg/coco.data", "/openbayes/input/input0/DeepSocial.weights")
width = network_width(network)
height = network_height(network)

# 在图像上运行 Darknet helper 函数
def darknet_helper(img, width, height):
  darknet_image = make_image(width, height, 3)
  img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  img_resized = cv2.resize(img_rgb, (width, height),
                              interpolation=cv2.INTER_LINEAR)

  # 获取图像比例，将边界框转换为适当的尺寸
  img_height, img_width, _ = img.shape
  width_ratio = img_width/width
  height_ratio = img_height/height

  # 运行 Darknet 模型
  copy_image_from_bytes(darknet_image, img_resized.tobytes())
  detections = detect_image(network, class_names, darknet_image)
  free_image(darknet_image)
  return detections, width_ratio, height_ratio

4. 使用 SORT 实现实时跟踪目标

!pip install filterpyfrom sort import *mot_tracker    = Sort(max_age=25, min_hits=4, iou_threshold=0.3)

5. 输入设置

Input            = "/openbayes/input/input1/OxfordTownCentreDataset.avi"
ReductionFactor  = 2
calibration      = [[180,162],[618,0],[552,540],[682,464]]

6.DeepSocial 参数设置和函数引入

7. 推理过程

8. 展示结果

行人目标检测&ID 分配
行人目标跟踪&距离测定
人群聚集热力图
6&7 部分代码较长，请访问原教程

Command Palette

人群距离监测 DeepSOCIAL 最全汉化论文+源码导读

行人检测：YOLO v4

行人跟踪：SORT

行人距离估计：IPM 逆透视映射

项目运行

Command Palette

人群距离监测 DeepSOCIAL 最全汉化论文+源码导读

行人检测：YOLO v4

行人跟踪：SORT

行人距离估计：IPM 逆透视映射

项目运行

相关报道

实现 1.4—3.7 倍推理加速，MIT 提出 DRiffusion 破解扩散模型采样延迟瓶颈

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答

既快又准！Cohere 发布开源转录模型；复杂场景精准解析：Chandra-ocr-2 视觉语言模型实现精准 OCR

全新生图模型 Anima V1 发布：专注动漫风格的图像生成；MemLens 多模态长程记忆评估数据集：涵盖跨会话图文推理与知识更新机制

Free CPU 教程丨狂揽 8.8k Stars，tts 模型 Supertonic-3 参数规模仅约 99M，支持 31 种语言

极致轻量，画质不减！ERNIE-Image-Turbo：告别漫长等待，速度快到飞起；引入感知与认知双维指标：阿里多模态统一解析评估数据集 OmniParsingBench 上线

Free CPU 在线教程 | Hermes Agent 学会长期记忆？记忆增强插件 TencentDB Agent Memory 可将事实/偏好/任务状态等分开存储

零抽样 TTS 新突破！几秒参考音频，OmniVoice 助你轻松克隆数百种语言；17 种语言一网打尽：MDPBench 解决低资源文字系统解析难的「心头大患」

Free CPU 教程丨西湖大学张岳团队开源科研插图神器 AutoFigure，可精准理解长篇科学文本

Command Palette

人群距离监测 DeepSOCIAL 最全汉化论文+源码导读

行人检测：YOLO v4

行人跟踪：SORT

行人距离估计：IPM 逆透视映射

项目运行

相关报道

实现 1.4—3.7 倍推理加速，MIT 提出 DRiffusion 破解扩散模型采样延迟瓶颈

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答

既快又准！Cohere 发布开源转录模型；复杂场景精准解析：Chandra-ocr-2 视觉语言模型实现精准 OCR

全新生图模型 Anima V1 发布：专注动漫风格的图像生成；MemLens 多模态长程记忆评估数据集：涵盖跨会话图文推理与知识更新机制

Free CPU 教程丨狂揽 8.8k Stars，tts 模型 Supertonic-3 参数规模仅约 99M，支持 31 种语言

极致轻量，画质不减！ERNIE-Image-Turbo：告别漫长等待，速度快到飞起；引入感知与认知双维指标：阿里多模态统一解析评估数据集 OmniParsingBench 上线

Free CPU 在线教程 | Hermes Agent 学会长期记忆？记忆增强插件 TencentDB Agent Memory 可将事实/偏好/任务状态等分开存储

零抽样 TTS 新突破！几秒参考音频，OmniVoice 助你轻松克隆数百种语言；17 种语言一网打尽：MDPBench 解决低资源文字系统解析难的「心头大患」

Free CPU 教程丨西湖大学张岳团队开源科研插图神器 AutoFigure，可精准理解长篇科学文本

相关报道

实现 1.4—3.7 倍推理加速，MIT 提出 DRiffusion 破解扩散模型采样延迟瓶颈

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答

既快又准！Cohere 发布开源转录模型；复杂场景精准解析：Chandra-ocr-2 视觉语言模型实现精准 OCR

全新生图模型 Anima V1 发布：专注动漫风格的图像生成；MemLens 多模态长程记忆评估数据集：涵盖跨会话图文推理与知识更新机制

Free CPU 教程丨狂揽 8.8k Stars，tts 模型 Supertonic-3 参数规模仅约 99M，支持 31 种语言

极致轻量，画质不减！ERNIE-Image-Turbo：告别漫长等待，速度快到飞起；引入感知与认知双维指标：阿里多模态统一解析评估数据集 OmniParsingBench 上线

Free CPU 在线教程 | Hermes Agent 学会长期记忆？记忆增强插件 TencentDB Agent Memory 可将事实/偏好/任务状态等分开存储

零抽样 TTS 新突破！几秒参考音频，OmniVoice 助你轻松克隆数百种语言；17 种语言一网打尽：MDPBench 解决低资源文字系统解析难的「心头大患」

Free CPU 教程丨西湖大学张岳团队开源科研插图神器 AutoFigure，可精准理解长篇科学文本

相关报道

实现 1.4—3.7 倍推理加速，MIT 提出 DRiffusion 破解扩散模型采样延迟瓶颈

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答

既快又准！Cohere 发布开源转录模型；复杂场景精准解析：Chandra-ocr-2 视觉语言模型实现精准 OCR

全新生图模型 Anima V1 发布：专注动漫风格的图像生成；MemLens 多模态长程记忆评估数据集：涵盖跨会话图文推理与知识更新机制

Free CPU 教程丨狂揽 8.8k Stars，tts 模型 Supertonic-3 参数规模仅约 99M，支持 31 种语言

极致轻量，画质不减！ERNIE-Image-Turbo：告别漫长等待，速度快到飞起；引入感知与认知双维指标：阿里多模态统一解析评估数据集 OmniParsingBench 上线

Free CPU 在线教程 | Hermes Agent 学会长期记忆？记忆增强插件 TencentDB Agent Memory 可将事实/偏好/任务状态等分开存储

零抽样 TTS 新突破！几秒参考音频，OmniVoice 助你轻松克隆数百种语言；17 种语言一网打尽：MDPBench 解决低资源文字系统解析难的「心头大患」

Free CPU 教程丨西湖大学张岳团队开源科研插图神器 AutoFigure，可精准理解长篇科学文本