ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • (서평) 연합학습 (federated learning)
    bookstory 2023. 10. 21. 17:16
    728x90

    저자 : 치앙 양, 양 리우, 용청, 예 캉, 텐젠 첸, 한유 지음

    이태휘 옮김

    에이콘 

     

     

     

     

    로컬 데이터를 비공개로 유지하면서 데이터만을 공유하며 학습되는 머신러닝에 대한 관심도가 높아지며 이 책을 구매하게 되었다. 전통적인 머신러닝의 경우에는 DB를 하나로 하여 학습에 활용하기 때문에 정보보호에 어려움이 있었다. 

     

    유럽 연합의 일반 데이터 보호규정(GDPR)이 나오는 등의 기업들에게 개인정보 보호법에 따라 취급이 점점 더 어려워지고 있는 추세이다. 

     

    책의 저자는 홍콩 과기대 컴공과 석좌교수로 위뱅크 AI 부서장(최고 책임자)로 역임하고 있으며 화려한 이력을 가지고 있다.  이 외의 공저자들 역시 홍콩, 싱가포르 출신으로 미국 등에서 석학 학위를 받은 해당 분야에서 혁신을 이끈 이들이 많다. 

     

    주로 다루는 내용은 분산된 데이터로 학습을 하는 방식을 다루고 있으며 현실적으로 스몰 데이터 사일로의 시대에서 연합 머신러닝이 실제적으로 해결 방안으로 급부상함에 따라 고성능 모델로써의 활용 가치를 확인할 수 있다. 

     

    연합학습을 적용하여 학습 결과만을 공유할 수 있고 동기화하는 효율을 보일 수 있다. 

    연합학습은 아래와 같이 구분할 수 있다. 

     

    출처 : 위키피디아

     

     

    1. 수평 연합학습 : B2C 응용의 예로는 구글의 지보드가 있고 이를 활용하여 엣지 컴퓨팅을 뒷바침 할 수 있다. 또한, 클라우드 시스템의 엣지에서 컴퓨팅 작업을 처리하여 원시 데이터를 중앙 서버에 보내야 할 필요가 없어진다.

     

    2. 수직 연합학습 : 위뱅크에서 제안하고 발전시킨 유형으로 여러 조직이 얼라이언스를 맺고 함께 공유하는 ML 모델을 만들어 사용하는 B2B 모델을 나타낸다. 로컬 데이터를 사이트 외부로 내보내지 않고 비즈니스 요구사항에 따른 모델 성능유지의 장점이 있다. 

     

    IEEE P3652.1 은 연합학습에 대한 최초의 국제표준이다. 

    구글에서 2016년에 발표한 Federated Learning: Strategies for Improving Communication Efficiency 라는 논문을 통해 하나의 용어로 자리잡았다. 

     

    국내외 대기업들에서도 컴퓨팅 자원의 분산, 프라이버시 보호, 개인 맞춤형 학습 등을 실현할 수 있는 대안으로 주목받고 있다. 

     

    FedAI그룹의 FATE, 텐서플로우 federated, IBM federated learning, Intel OpenFL, NVIDIA clara, OpenMined PySyft 등 여러 오픈소스 학습 프레임워크가 나와있다. 

     

    다음 글에서는 주요 오픈소스의 특징들과 연합학습의 세부 정의에 대해 정리하고자 한다.

     

    반응형
Designed by Tistory.