‘DualAnoDiff’, 복단대-텐센트가 공동 개발한 공업 분야 이상 탐지 기술 CVPR 2025에 채택

2025년 06월 09일

DualAnoDiff

인공지능 기술을 활용한 공업 분야 이상 탐지 기술이 새로운 전환점을 맞았다. 복단대학교와 텐센트 우투(優圖) 연구소가 공동 개발한 새로운 알고리즘 ‘DualAnoDiff’가 컴퓨터 비전 분야 최고 권위 학회인 CVPR 2025에 채택되며 학계의 주목을 받고 있다.

DualAnoDiff

DualAnoDiff, 공업 이상 탐지의 새로운 돌파구

공업 제조 현장에서 제품의 결함이나 이상을 탐지하는 것은 품질 관리의 핵심 과제다. 기존에는 AI 모델이 제품의 이상을 정확히 감지하기 위해 대량의 불량품 데이터가 필요했지만, 실제 제조 현장에서는 이러한 데이터를 충분히 확보하기 어려운 것이 현실이었다.

이를 해결하기 위해 연구진들은 AI 모델이 다양한 종류의 가상 불량품 이미지를 생성하고, 어느 부분에 문제가 있는지 표시하는 방법을 사용해왔다. 하지만 기존 방법들은 생성되는 이상 이미지의 다양성이 제한적이고, 원본 이미지와 자연스럽게 융합하기 어려운 한계가 있었다.

복단대학교와 텐센트 우투 연구소 공동 연구팀이 개발한 DualAnoDiff는 이러한 기존 방법들의 한계를 극복하고 새로운 SOTA(State of the Art) 성능을 달성했다. 이 모델은 단순히 가짜 불량품 이미지를 생성하는 것을 넘어서, MVTec 데이터셋의 실제 상황과 가장 유사한 이상 이미지를 생성해낼 수 있다.

혁신적인 이중 분기 병렬 생성 메커니즘

DualAnoDiff의 핵심 혁신은 이중 분기 병렬 생성 메커니즘(Dual-Branch Parallel Generation Mechanism)에 있다. 기존의 단일 경로 생성 방식과 달리, 이 시스템은 두 개의 분기를 동시에 활용하여 전체 이상 이미지와 해당하는 이상 영역을 동기적으로 생성한다.

구체적으로 주 분기(Main Branch)는 이상이 포함된 완전한 이미지 생성에 집중하며, 전체적인 시각적 일관성을 담당한다. 반면 부 분기(Sub Branch)는 국소적인 이상 영역 생성에 특화되어 세부적인 사실성을 강조한다. 두 분기는 서로 다르지만 중첩된 프롬프트 워드를 사용하여 생성되는 콘텐츠가 의미적으로나 구조적으로 긴밀하게 연관되도록 설계되었다.

이러한 이중 분기 시스템의 특징과 융합을 담당하는 것이 SAIM(Semantic Alignment and Integration Module) 모듈이다. 이 모듈은 두 분기 간의 특징 융합과 공유를 완성하여, 생성된 이상 이미지와 마스크가 높은 정렬성을 갖도록 보장한다.

배경 보상 모듈의 역할

DualAnoDiff의 또 다른 중요한 구성 요소는 배경 보상 모듈(Background Compensation Module, BCM)이다. 이 모듈은 입력된 정상 이미지나 생성된 배경 부분에서 배경의 핵심 특징(Key)과 값 특징(Value)을 분리하여 주 분기에 주입한다.

이 과정을 통해 생성 결과의 형태를 강제로 제한함으로써 모델의 생성 효과를 안정화시킨다. 특히 소수 샘플 이미지 생성에서 흔히 발생하는 왜곡이나 흐림 현상을 완화하는 데 효과적이다. 복잡한 배경을 가진 환경에서도 모델이 안정적으로 작동할 수 있도록 하는 핵심 기술이라 할 수 있다.

실험 결과와 성능 평가

연구팀이 공개한 실험 결과에 따르면, DualAnoDiff는 생성 결과의 현실성과 다양성 측면에서 기존 방법들을 크게 앞선다. 정량적 지표 비교에서 이 방법은 최고 품질과 최대 다양성을 가진 이미지 데이터를 생성해냈다.

시각화 결과 역시 이를 뒷받침한다. DualAnoDiff가 생성한 데이터는 뛰어난 품질과 다양성을 보여주며, 실제 산업 현장에서 발생할 수 있는 다양한 유형의 이상 상황을 포괄적으로 모사할 수 있다는 것이 확인되었다.

픽셀 레벨과 이미지 레벨의 이상 탐지 결과 분석에서는 더욱 인상적인 성과가 나타났다. 서로 다른 방법으로 생성된 데이터를 동일한 모델 구조로 훈련시켰을 때, DualAnoDiff로 생성된 데이터가 전체적으로 최적의 효과를 얻었다. 이는 탐지, 위치 파악, 분류 등 모든 하위 작업에서 일관되게 우수한 성능을 보였다는 의미다.

기술적 의미와 산업적 파급효과

DualAnoDiff의 개발은 여러 측면에서 중요한 의미를 갖는다. 먼저 기술적 관점에서 보면, 확산 모델(Diffusion Model) 기반의 이상 이미지 생성 분야에서 새로운 패러다임을 제시했다. 기존의 단일 경로 생성 방식의 한계를 극복하고, 병렬 처리를 통해 더욱 정확하고 다양한 이상 패턴을 생성할 수 있게 되었다.

산업적으로는 제조업계의 품질 관리 시스템에 혁신적인 변화를 가져올 것으로 예상된다. 실제 불량품 데이터가 부족한 상황에서도 충분한 훈련 데이터를 확보할 수 있게 되어, AI 기반 품질 검사 시스템의 도입 장벽이 크게 낮아질 전망이다.

특히 반도체, 자동차, 전자제품 등 정밀 제조가 요구되는 산업 분야에서는 이 기술의 활용도가 매우 높을 것으로 분석된다. 기존에는 수개월간의 데이터 수집 기간이 필요했던 AI 모델 훈련이 훨씬 짧은 시간 내에 가능해져, 새로운 제품 라인 도입이나 품질 기준 변경에 대한 대응 속도가 크게 향상될 수 있다.

미래 연구 방향과 발전 전망

연구팀은 이번 연구가 이상 이미지 생성 분야의 발전을 추진할 것이라고 밝혔다. DualAnoDiff를 통해 생성된 이상 데이터는 하위 이상 탐지 작업의 성능을 현저히 향상시킬 수 있다는 것이 실험을 통해 입증되었다.

향후 연구 방향으로는 더욱 복잡한 산업 환경에서의 적용성 확대, 실시간 처리 성능 개선, 그리고 다양한 제조 분야별 특화 모델 개발 등이 예상된다. 또한 생성된 이상 데이터의 품질을 더욱 정교하게 평가할 수 있는 새로운 지표 개발도 중요한 과제로 남아있다.

CVPR 2025에 채택된 이번 연구는 학계뿐만 아니라 산업계에서도 큰 관심을 받고 있으며, 실제 제조 현장에서의 적용 사례가 늘어날 것으로 전망된다. 복단대학교와 텐센트 우투 연구소의 이번 성과는 중국 AI 기술의 선진성을 다시 한번 입증하는 사례로 평가받고 있다.

[참고 기사]
https://www.qbitai.com/2025/06/291359.html

[논문 링크]
https://arxiv.org/pdf/2408.13509