심층 강화 학습을 통해 도시 화재 예방 최적화가 가능합니다. 중국과학원 연구팀은 시설 구성 문제를 해결하기 위해 새로운 DRL 기법을 제안했습니다.

도시 건설 및 개발에 있어 지리공간 최적화는 매우 중요합니다. 산업단지 부지 선정부터 공공 서비스 시설 배치까지 모든 측면에서 핵심적인 역할을 합니다. 그러나 기존 솔루션에는 많은 한계가 있었습니다. 이제 딥러닝 기술이 새로운 기회를 가져왔습니다.
최근 중국지리학회 지리모형 및 지리정보분석위원회 2025년 연례 학술대회에서중국과학원 우주정보혁신연구소의 량하오젠 박사는 "계층적 심층 강화 학습 기반 도시 비상소방시설 구성 최적화 방법 연구"라는 제목으로 "지리공간 최적화"라는 주제로 프레젠테이션을 진행했습니다.또한 지리공간 최적화 문제에 대한 개요, 지리공간 최적화 문제를 위한 딥러닝 방법에 대한 연구, 계층적 딥 강화 학습을 기반으로 한 새로운 탐색, 미래 전망 등 4가지 측면에서 자세한 소개를 제공합니다.
HyperAI는 량하오젠 씨의 심도 있는 발표 내용을 원문의 의도를 훼손하지 않고 정리하고 요약했습니다. 아래는 발표 내용 전문입니다.
지리공간 최적화: 수학과 지리학의 긴밀한 통합
지리공간 최적화는 수학적 조합 최적화와 지리정보과학의 결합으로, 공간 배치 및 자원 배분과 같은 실질적인 문제 해결에 중점을 두고 있습니다. 도시 건설, 산업단지 입지 선정, 공공 서비스 시설 입지 선정 등 여러 분야에서 중요한 연구 의의를 지닙니다.이는 결정 변수, 제약 조건 및 목적 함수를 포함하는 최적화 문제로 표현될 수 있습니다.결정 변수는 일반적으로 아래 그림에서 볼 수 있듯이 정수이거나 0~1 변수입니다.

제약조건(1)은 일반적으로 정수 또는 0-1 변수인 결정 변수 𝒙의 범위를 나타냅니다.
고전적인 p-median 문제를 예로 들면,이 기법은 후보 시설 중에서 p개의 배치 시설을 선택하여 모든 수요 지점에서 가장 가까운 시설 지점까지의 총 거리를 최소화하는 것을 목표로 하며, 공공시설 부지 선정에 자주 사용됩니다. 공간 최적화 문제를 해결하는 전통적인 방법에는 정확 알고리즘, 근사 알고리즘, 휴리스틱 알고리즘 등 세 가지 유형이 있지만, 각 방법마다 고유한 단점이 있습니다.
* 정확한 알고리즘은 전역 최적 솔루션을 얻을 수 있습니다.그러나 계산 복잡도는 일반적으로 높고, 해결 시간은 문제의 크기에 따라 기하급수적으로 증가합니다.예를 들어, 분기 및 한정법, 동적 프로그래밍 등이 있습니다.
* 대략적인 알고리즘은 특정한 이론적 성능을 보장하는 동시에 솔루션 효율성을 향상시킵니다.하지만 알고리즘 설계는 비교적 복잡합니다.예를 들어, 탐욕적 전략, 선형 계획법 반올림 및 기타 방법이 있습니다.
* 휴리스틱 알고리즘은 더 짧은 시간 안에 더 나은 솔루션을 얻을 수 있으며 대규모 복잡한 문제에 적합합니다.그러나 이론적인 최적성이 보장되는 것은 아니다.일반적인 방법으로는 시뮬레이트 어닐링, 금기 검색 등이 있습니다.
딥러닝, 지리공간 최적화에 진출
컴퓨터 비전 및 자연어 처리와 같은 분야에서 딥러닝 모델은 수동 알고리즘 설계를 대체하여 놀라운 성과를 달성했습니다. 그렇다면 공간 최적화 문제를 해결하는 데 딥러닝을 활용할 수 있을까요? 이러한 아이디어를 바탕으로 연구자들은 세 가지 동기를 가지고 신경망 공간 최적화를 탐구해 왔습니다. 첫째, 더 빠르고 더 나은 휴리스틱 기법 학습, 둘째, 데이터 기반 고속 근사법을 사용하여 복잡한 계산을 대체, 셋째, 새로운 휴리스틱 알고리즘을 위한 일반 프레임워크 자동 설계, 넷째, 과거 정보를 활용하여 DRL 모델을 학습하여 미래 계획을 수립하는 것입니다.
따라서 저는 NeurSPO에 대해 두 가지 주요 아이디어를 가지고 있습니다.
하나는 심층적 구조입니다.간단히 말해서, 해결책은 처음에는 비어 있고, 목표 p점이 선택될 때까지 매번 점을 선택하여 해결책의 단계별 구성을 완료합니다.
두 번째는 깊이 개선입니다.이 알고리즘의 본질은 지역 탐색과 같은 알고리즘과 유사하며, 지역 탐색은 해결책을 개선하는 방법입니다. 딥러닝은 해결책을 대체하는 데 사용될 수 있습니다. 예를 들어, 지역 탐색에서는 교환이나 최적화를 위해 적절한 지점을 선택할 수 있습니다.
SpoNet 모델: 동적 오버레이 주의가 사이트 선택 문제를 해결합니다
DRL 방법을 탐색할 때 p-Median, p-Center, 그리고 MCLP의 목표 문제를 어떻게 해결할 수 있을까요? 먼저 동적 커버리지 정보 + 어텐션 모델을 시도해 보았습니다.부지 선정 문제를 해결하기 위한 통합 프레임워크인 SpoNet이 제안되었습니다.그 구조는 주로 3가지 부분으로 구성됩니다.
* 딥 러닝 모델에서는 에이전트가 환경과 지속적으로 상호 작용하고 레이블 정보를 생성할 필요 없이 많은 시행착오와 학습 전략을 통해 보상을 극대화합니다.
* 주의 모델을 사용하면 모델이 디코딩할 때 디코더 입력에만 의존하지 않고 입력 시퀀스의 특정 부분에 집중하는 법을 배울 수 있습니다.
* 노드 커버리지 과정에서 노드가 이미 커버된 경우, 이 시점에 시설을 배치하기로 선택하면 커버리지 효율성이 저하될 수 있습니다. 동적 커버리지 주의 모델에서는 도시의 정적 위치 좌표와 도시 간 동적 커버리지 상태가 인코딩되고, 지식 기반 방식으로 문제별 커버리지 정보를 인코딩에 도입함으로써 모델의 공간 커버리지 관계 이해 능력이 향상되어 해결 과정이 가속화됩니다. 다음 그림과 같습니다.


본 연구는 베이징 차오양구의 응급 시설 배치 최적화를 탐색하기 위해 이 모델을 적용하였으며, 132개의 응급 시설 데이터셋을 선정했습니다. 각 시설 지점의 최대 서비스 거리는 2km로 가정했습니다.마지막으로, 가장 많은 노드를 포함하는 132개 후보 비상시설 중에서 20개 지점이 중앙 허브로 선정되었습니다.
AIAM: p-median 문제를 해결하기 위한 적응형 상호작용 주의 모델
현재 해의 근방을 탐색하여 더 나은 해를 찾는 지역 탐색 알고리즘 방식은 비교적 성숙된 상태입니다. 이를 바탕으로 심층 강화 보조 탐색(deep enhance assistive search)을 탐구했습니다.즉, 이웃 탐색의 아이디어를 기반으로 DRL 탐색 전략을 사용하여 복잡한 계산을 대체하는 빠른 근사 탐색 프로세스를 구현합니다.
경로 계획 문제에서는 서로 다른 노드 간에 서로 다른 순서 관계가 존재하지만, 𝒑-중위수 문제에서는 해가 시설 집합의 부분집합이므로 사용자 노드와 시설 지점 간에 서로 다른 분포 관계가 발생합니다. 이러한 분포 관계를 측정하기 위해 "사용자"와 "시설" 간의 상호작용을 설정하고 적응적 상호작용 주의 모델을 제안했습니다.
이 모델은 대화형 주의 인코더, 노드 제거 디코더, 노드 삽입 디코더의 세 부분으로 구성됩니다.다음 그림과 같이:

입증됨,이 모델은 2,162개 정착지(수요 부지) 중 15개 병원과 80개 병원(후보 시설 부지)을 유지하는 데 성공했습니다.주거 지역에서 병원까지의 총 거리가 최소화되었으며, 이를 통해 AIAM 모델이 실제 시나리오에서 실행 가능함이 입증되었습니다.
다층형 DRL은 도시 비상 소방 시설 구성 문제를 해결합니다.
현재 도시는 급속도로 발전하고 있으며, 비상 상황의 빈도와 복잡성이 지속적으로 증가하고 있습니다. 도시 비상 소방 시설의 효율성과 기능성 간의 균형 문제가 심화되고 있습니다. 기존의 화재 예측 방식은 대규모의 고정밀 데이터 처리에 어려움이 있어 위험 평가 정확도가 낮고 대응이 지연되며, 소방 시설 배치가 도시 변화와 비상 상황의 요구를 실시간으로 반영하지 못하는 문제가 있습니다. 이러한 상황에서 도시 화재 예방 및 관리, 그리고 비상 대응의 과학성과 효율성을 종합적으로 향상시키기 위해 지능적이고 역동적인 화재 위험 예측 및 비상 소방 시설 도입이 시급합니다.
이를 바탕으로,우리는 딥러닝 프레임워크의 이론적 연구를 실제 생활에 적용하는 방향으로 전환합니다.도시 화재 예방 및 통제, 그리고 비상 대응 역량을 향상시키기 위해 본 연구는 화재 위험 예측의 정확성 향상, 비상 자원 배분 최적화, 그리고 비상 대응의 적시성과 유연성 강화에 중점을 두고 있습니다. 이는 다음 세 가지 측면을 통해 달성됩니다.
첫 번째는 도시 화재 위험 예측을 위한 다차원 시공간적 특징 마이닝 및 융합입니다.
도시 화재 위험 예측을 위한 시공간 신경망은 크게 시공간 특징 추출 모듈과 융합 출력 모듈로 구성됩니다. * 시공간 특징 추출 모듈은 도시 공간 구조, 소방 시설 분포, 화재 통계 및 기상 데이터의 동적 변화를 순방향 전파(forward propagation) 방식으로 자동으로 포착합니다. * 융합 출력 모듈은 주의 메커니즘을 통해 시공간 특징들을 통합하여 최종적으로 화재 위험 예측값을 출력합니다. 아래 그림과 같습니다.

두 번째는 불확실성과 재난 손실을 고려하여 비상소방시설 구성을 위한 최적화 모델을 구축하는 것이다.
다중 커버리지 부지 선정에서는 화재 발생 빈도, 교통 상황, 수요 분포 등 불확실한 요소를 도입하고, 재난 손실을 목적 함수에 반영하여 배치 계획의 견고성을 향상시킵니다. 화재 발생, 교통 흐름, 수요 변동의 변화는 확률 분포 또는 구간 추정을 통해 설명됩니다. 모델링에서는 화재 위험에 과거 데이터와 지리적 조건을 결합하여 확률 모델을 구축하고, 교통량 대응은 교통 용량의 시간 분포와 시뮬레이션 분석을 기반으로 하며, 수요 변화는 변동 범위 또는 시나리오 집합을 설정하여 도시의 역동적인 발전에 대응합니다.
세 번째는 비상소방시설의 배치를 최적화하기 위한 계층적 DRL 방법입니다.
이 알고리즘은 계층적 전략을 채택하여 소방 시설의 전체 배치와 지역적 조정을 조정합니다. 모델 상태는 시설 분포, 화재 위험 및 교통 상황을 포함하며, 동작은 각 순간의 소방서 설치 또는 일정 조정입니다.
미래 전망: 경계 확장 및 지속적인 혁신
과학 연구의 길은 끊임없이 발전하고 있습니다. 앞으로 저희 팀은 지리정보시스템, 수학적 최적화 방법, 그리고 딥러닝 기술을 결합한 학제 간 협업을 통해 더욱 복잡하고 실용적인 지공간 최적화 문제를 탐구할 계획입니다.
이와 관련하여 저는 다음 세 가지 측면에서 몇 가지 생각과 전망을 제시했습니다.
* 공간 지각 능력을 강화하기 위해 지리적 컴퓨팅 메커니즘을 도입합니다.
AI가 지리적 공간을 최적화하는 능력은 아직 연구 중이며, 현재 연구만으로는 충분하지 않습니다. 앞으로 지형, 네트워크 접근성, 연결성과 같은 공간 메커니즘을 모델링하면 모델의 지리적 구조 설명 능력과 실질적인 적응력을 향상시키는 데 도움이 될 것입니다.
* 대규모 및 지역 간 비상 대응 문제로 확대되었습니다.
현재 우리의 연구는 소규모 문제의 탐색에 국한되어 있으므로, 앞으로는 점차 대규모 비상 대응 문제의 탐색으로 확장하고, 도시 밀집 지역과 성급 수준에서 다중 센터 연계 최적화를 지원하도록 지속적으로 개선하여 방법의 확장성, 안정성 및 계산 효율성을 개선할 것입니다.
* 더욱 효율적인 DRL 알고리즘 프레임워크를 설계합니다.
앞으로는 고/저수준 전략 조율 메커니즘과 훈련 과정을 지속적으로 탐색하고 최적화하고, 다중 에이전트 협업, 비동기 훈련, 인과 메커니즘 등의 기술을 도입하여 실제 문제를 더욱 효과적으로 해결할 수 있을 것입니다.
요약하자면, 중국과학원 우주정보혁신연구소의 량하오젠 박사팀이 제안한 계층적 DRL 방식은 공간 최적화 분야의 AI 혁신 솔루션입니다.동적 커버리지 주의 모델, 적응형 상호작용 주의 모델, 다차원 시공간적 특징 융합 기술을 통합함으로써 기존 소방 시설의 배치에서 발생하는 지연된 위험 평가와 비효율적인 자원 배분 문제를 해결할 뿐만 아니라, 계층적 전략을 통해 비상 시설 배치의 글로벌 조정과 로컬 최적화를 실현합니다.
앞으로 지리적 컴퓨팅 메커니즘의 도입과 지역 간 비상 대응 모델의 확대를 통해, 이 방법은 대규모 도시 거버넌스 및 다센터 연계 최적화 분야에서 더 큰 잠재력을 발휘하고, 지리적 공간 최적화와 비상 관리의 심층적인 통합과 혁신을 촉진할 것으로 기대됩니다. 지속적인 탐구와 혁신을 통해 지리적 공간 최적화 분야는 더 큰 돌파구를 마련하고 도시 개발 및 비상 관리에 더욱 강력한 지원을 제공할 것으로 기대됩니다.
중국과학원 우주정보혁신연구소 소개
량하오젠 박사는 중국과학원 우주정보혁신연구소의 특별 연구원입니다.주요 연구 방향으로는 공간 최적화, 심층 강화 학습, 원격 감지 빅데이터 분석, 디지털 지구의 종합적 응용 등이 있습니다.

왕 샤오화 연구원이 이끄는 그의 팀은 "스마트 시티와 지속가능한 개발 목표 달성을 위한 혁신적인 솔루션을 제공하기 위해 지공간 과학과 인공지능의 교차 적용을 촉진한다"는 비전을 가지고 있습니다. 연구팀은 첨단 컴퓨팅 기법과 인공지능 기술을 활용하여 시공간 빅데이터를 분석하고 처리함으로써 지능적인 의사 결정과 공간 환경 최적화를 실현하고자 합니다.연구팀은 시공간적 빅데이터 분석, 딥러닝, 머신러닝과 같은 기술을 활용해 공간 최적화, 원격 감지 AI 등 다양한 연구를 수행했습니다.
