Influcoder: 대규모 데이터 귀속을 위한 디코더 영향력 순위 인코더 증류

Influcoder: Distilling Decoders' Gradient Influence Rankings into an Encoder for Data Attribution

💡 LLM 학습 데이터에서 특정 결과에 영향을 미치는 샘플을 빠르게 찾아내는 새로운 방법인 Influcoder를 제안합니다. 기존 영향 함수 기반 방법의 느린 속도와 큰 저장 공간 문제를 해결하여 대규모 데이터셋에서도 효율적인 데이터 귀속이 가능합니다.

핵심 요약

무엇을 · 대규모 언어 모델(LLM)의 학습 데이터에서 특정 출력(예: 유해한 행동)에 영향을 미치는 개별 데이터 샘플을 식별하는 '데이터 귀속(Data Attribution, DA)' 문제를 다룹니다.
어떻게 · 기존의 영향 함수(influence function) 기반 DA 방법은 효과적이지만, 대규모 데이터셋에 적용하기에는 처리 속도가 느리고 저장 공간을 많이 차지하는 단점이 있습니다. 이 논문은 이러한 문제를 해결하기 위해 'Influcoder'라는 새로운 방법을 제안합니다.
결과 · Influcoder는 대규모 데이터셋에서도 빠르고 비용 효율적으로 영향 기반 데이터 귀속을 수행할 수 있도록 설계되었습니다. 이는 디코더의 기울기 영향력 순위를 인코더로 증류하는 방식으로 구현됩니다.

LLM의 성능이 향상됨에 따라, 학습 데이터의 품질 관리가 중요해지고 있습니다. 특히, 모델이 유해한 출력을 생성할 때 그 원인이 되는 학습 데이터를 식별하는 것은 모델의 신뢰성과 안전성을 높이는 데 필수적입니다.

이 기술은 LLM 학습 데이터셋에서 유해하거나 편향된 데이터를 찾아내 제거함으로써, 더 안전하고 공정한 AI 모델을 개발하는 데 기여할 수 있습니다. 또한, 고품질 데이터셋을 구축하여 모델 성능을 최적화하는 데 활용될 수 있습니다.

초록에는 Influcoder의 구체적인 성능 수치나 기존 방법과의 정량적 비교 결과가 명시되어 있지 않습니다. 또한, 이 방법이 모든 유형의 데이터 귀속 문제에 동일하게 적용될 수 있는지에 대한 정보도 부족합니다.

#데이터 귀속#대규모 언어 모델#영향 함수

arXiv 원문 보기 → Dimitri Kachler, Damien Sileo, Pascal Denis · 2026-06-11 · arXiv:2606.13668

이 요약이 유용했나요?

※ 이 요약은 AI 보조로 생성하고 사람이 검수했습니다. 난이도·실생활 영향·톤은 본 사이트의 편집 의견이며, 정확한 내용은 반드시 원문(arXiv)을 확인하세요. 번역은 AI 기반으로 오역 가능성이 있습니다. 출처: arXiv (2606.13668).