KT 모델이 KT ‘AI 보이스피싱 탐지 서비스 2.0’을 소개하고 있다. /사진=KT


KT는 오는 30일부터 국내 최초로 '화자인식'과 '딥보이스(AI 변조 음성) 탐지' 기능을 통합한 실시간 'AI 보이스피싱 탐지서비스 2.0'을 상용화한다고 밝혔다. 이번 고도화된 서비스는 기존 문맥 기반 탐지 기술에 더해 범죄자의 실제 음성을 인식하고 인공지능으로 변조된 음성까지 식별할 수 있도록 AI 보안 역량을 강화한 것이 핵심이다.


개인정보보호위원회, 과학기술정보통신부, 국립과학수사연구원은 KT의 AI 보이스피싱 탐지 기술 고도화 과정에 각각 핵심적인 역할을 수행하며 민관 협력 모델을 구현했다.

KT는 지난해 10월 과학기술정보통신부로부터 ICT규제샌드박스 실증특례 사업자로 선정돼 AI 기반 보이스피싱 탐지 기술 발전에 박차를 가해왔다.


특히 화자인식 기능은 개인정보보호위원회의 엄격한 규제점검 및 승인을 거쳐 국내 최초로 상용화에 성공한 기술이다. 화자인식은 국립과학수사연구원이 제공한 보이스피싱 범죄자의 실제 신고 음성, 일명 '그놈목소리' 데이터를 기반으로 성문정보를 정밀 분석해 범죄 여부를 탐지한다. 이는 기존의 금융 키워드나 문장 구조 기반 탐지에서 한 단계 진일보한 방식이며 탐지 정확도를 제고했다. 국립과학수사연구원은 KT에 신뢰도 높은 데이터를 제공하기 위해 10개월간 그놈목소리 데이터를 전수조사하고 정제하는 등 많은 노력과 자원을 투입함으로써 보이스피싱 예방 효과에도 기여했다.

이처럼 화자인식 기능의 도입은 개인정보 보호 기준이 엄격한 국내 통신 환경에서 쉽지 않은 과제였지만 제도적 검토와 기술적 신뢰성 확보를 통해 가능해졌다는 점에서 의미가 크다.


KT는 AI 음성합성(TTS) 기술로 생성된 변조 음성을 판별하는 '딥보이스 탐지' 기능도 함께 제공한다. 이 기술은 작년 5월 건강보험공단 고객센터에 국내 공공기관 최초로 적용된 'AI 목소리 인증' 서비스에서 이미 검증된 바 있으며 최근 지능화되고 있는 AI기반 보이스피싱 범죄 수법에 선제적으로 대응할 수 있는 핵심 수단이다. KT는 이번 기술 고도화를 통해 의심스러운 음성을 실시간으로 분석하고 판별함으로써고객이 보다 안전한 통신 환경을 이용할 수 있도록 지원한다.

2025년 상반기 동안 KT의 AI 보이스피싱 탐지서비스는 약 1460만건의 통화 트래픽을 분석해 91.6%의 탐지 정확도를 기록했으며 약 710억원의 피해를 예방한 것으로 추산된다. 이는 서비스 초기(90.3%) 대비 1.3%포인트 향상된 수치로 AI 탐지기술의 실효성을 입증한 결과다. KT는 이번 2.0 버전 출시를 통해 연간 2000억원 이상의 피해 예방과 95% 이상의 탐지 정확도 달성을 목표로 하고 있다.


또한 KT는 보이스피싱 탐지 정보를 금융권의 이상거래탐지시스템(FDS)과 연계해 실질적인 피해 차단으로 이어지도록 협업을 확대하고 있다. 지난 5월에는 은행연합회와 업무협약(MOU)을 체결하고 탐지 데이터를 금융기관에 제공함으로써 탐지 → 계좌 모니터링 → 출금 차단 등 실시간 후속 조치가 가능한 민관 협력 체계를 구축한 바 있다. 이는 AI를 활용한 기술 기반의 고객 보호를 실현하는 선순환 구조로 평가된다.

이현석 KT 커스터머부문장은 "보이스피싱으로부터 국민을 더욱 강력히 보호하기 위한 화자인식 기반 AI 탐지서비스 상용화를 위해 아낌없는 협력을 해주신 개인정보보호위원회, 과학기술정보통신부, 그리고 국립과학수사연구원에 깊이 감사드린다"며 "이번 기술 상용화를 계기로 금융권과의 협업도 한층 강화해 고객 피해를 획기적으로 줄여 나가겠다"고 밝혔다.