[Daily IT News] CES2022, 초거대AI, 마이데이터, 제로트러스터, AI 윤리

코로나 확산으로 그동안 세계 최대 가전 박람회인 CES가 그동안 열리지 못했는데요, 내년 2022년 초에 다시 열린다고 합니다. 오랜만에 열리는 대규모 오프라인 박람회인 만큼 어떤 기술들이 소개 될지 기대됩니다. 관련 기술들 눈여겨 보시면 그 흐름을 따라 갈 수 있지 않을까 싶습니다.

금일(2021.12.27. 월) 신문리뷰 입니다.

 전자신문

 
(도메인)토픽 헤드라인 설명
(서비스)
Trends
[미리보는 CES 2022]<1>대한민국 416개 기업 참가, '역대 최대'
>> CES 2022를 달굴 기술로는 △스마트홈 △디지털 헬스케어 △푸드테크 △미래 모빌리티 △대체불가토큰(NFT) 등이 떠올랐다. 식품과 우주기술도 새롭게 강조되는 영역이다. 전통 식품 생산·판매에서 로봇과 빅데이터 분석 등 IT를 접목, 푸드테크 영역으로 진화하는 현주소를 제시한다. '스페이스 테크'에서는 퀄컴, 스카이디오, 두산, 시에라 스페이스 등이 참가해 우주탐사 기술을 소개할 예정이다.
(AI)
초거대AI

[IITP 리뷰 1] GPT-3, 초거대 AI 개발경쟁에 불을 붙이다
>> 최근 정보통신기술(ICT) 분야에서 가장 핫한 키워드를 꼽으라면 '초거대 인공지능(Hyper-scale AI)'이 아닐까 한다. 2020년 6월 미국 OpenAI가 GPT-3라는 자연어처리AI모델(베타버전)을 발표한 후, 획기적 활용사례들이 등장하며 잠재력에 대한 기대를 부풀린 이후 초거대 AI모델이 속속 등장하고 있다.
>> 초거대 AI데이터 분석과 학습을 넘어 인간의 뇌처럼 스스로 추론하고 창작할 수 있도록 방대한 데이터와 파라미터(매개변수)를 활용하는 AI 모델이다. 인공신경망의 파라미터는 인간 뇌에서 뉴런 간 정보전달 통로인 시냅스와 비슷한 역할을 한다. 2020년 이전만 해도 100억개 내외 파라미터를 가진 모델들이 주를 이뤘으나, GPT-3는 1750억개 파라미터와 3000억개로 구성된 데이터셋으로 학습했다. 초거대 AI 모델은 대부분 구글이 개발한 트랜스포머 알고리즘을 활용하고 있는데, 이는 병렬적 언어처리를 가능케 해 계산 효율성을 획기적으로 향상시킴으로써 대규모 데이터셋 학습에 용이하기 때문이다. 2021년에 등장하는 초거대 AI 모델은 그 규모가 더욱 거대해져 수천억에서 1조개 이상의 파라미터를 장착하고 있는 실정이다.
>> AI 업계는 GPT-3가 방대한 규모의 일반 데이터 학습만으로 미세 조정(fine-tuning)없이, 즉 특정 태스크를 위한 새로운 데이터를 만들지 않고도 대부분 태스크를 완성도 높게 수행하는 범용적 언어모델이라는 측면에서 획기적인 것으로 평가했다. 공개 후 AI 커뮤니티의 반응은 폭발적이었으며, 놀라운 활용사례들이 소개됐다. 몇 가지 정보를 제시하면 이력서, 가계부, 이메일 등 원하는 양식의 콘텐츠 생성이 가능하고, 일반 문장을 법률적 문장으로 개조하기, 상당한 수준의 번역, 추론이 필요한 수준의 문제 풀이와 몇 줄의 일반 문장 입력으로 자동 코딩작업까지 수행했다. 인류역사상 가장 뛰어난 AI라는 찬사와 더불어 한계도 지적됐지만 GPT-3 등장은 자연어처리 AI 분야에 한 획을 긋는 사건으로 기록될 전망이다.
>> 가장 앞서가는 기업은 구글MS. 트랜스포머 알고리즘과 'BERT모델'을 보유한 구글은 지난 5월 언어와 문맥을 이해하고 이에 맞춘 대화를 할 수 있는 대화형 AI '람다(LaMDA)'와 75개 이상 언어로 동시 학습되고 다양한 유형의 정보를 동시에 이해하는 멀티모달 모델인 MUM(멈)을 공개했다. 올해 1월에는 1조6000억 파라미터의 '스위치 트랜스포머'에 관한 논문을 발표했는데, 최초의 조 단위 파라미터 모델이지만 아직 연구자들에게 논문과 소스코드 형태로만 공개된 것으로 알려진다. 자회사인 딥마인드도 2800억 파라미터의 고퍼(Gopher)를 발표했다. MS와 엔비디아는 지난 10월 파라미터 5300억개 규모로 문서 요약, 자동 대화 생성, 번역, 의미 검색, 코드 자동완성 등을 높은 정확도로 수행 가능한 'MT-NLG'를 공개했다. 아울러 MS는 최대 1조개 파라미터 모델을 효율적으로 학습시킬 수 있는 딥스피드(DeepSpeed) 새 버전을 개발했고 11월에는 GPT-3를 MS 클라우드서비스인 '애저 OpenAI 서비스'로 제공한다고 발표했다. 한편 중국 베이징AI연구원(BAAI)은 1조7500억 파라미터 '우다오 2.0'을 공개하며 조 단위 파라미터 경쟁에 가세했으며, 화웨이는 2070억 파라미터 규모 '판구 알파'를 내놓았다.
>> 네이버는 지난 5월 2040억 파라미터의 세계 최대 한국어 언어모델 '하이퍼클로바'를, 카카오브레인은 11월 300억 파라미터 규모의 한국어 특화 AI 언어모델 'KoGPT'에 이어 12월에는 명령에 따라 그림을 그리는 '민달리(minDALL-E)'를 공개했다.LG AI연구원은 세계 최대 규모 데이터(6000억개 말뭉치, 2억5000만개 이미지)를 학습시킨 3000억 파라미터의 '엑사원'을 발표했다. SK텔레콤과 KT 등 통신사들도 야심찬 계획들을 진행 중인 것으로 알려진다. 우리 정부도 지난 9월 제1회 AI 최고위 전략대화의 주제를 초거대 AI로 정하고 적극적인 민·관 협력과 지원을 도모하고 있다.

(DB)
마이데이터
마이데이터 전면시행 D-5…빅테크는 뒤늦게 참여, 서비스 담금질 한창
>> 표준API를 전면 적용하는 마이데이터 본시행을 닷새 앞두고 주요 빅테크 기업인 네이버파이낸셜, 카카오페이, 토스가 뒤늦게 시범서비스에 참여한다. 앞서 시범서비스를 제공해온 마이데이터 본허가 사업자와 정보제공자는 원활한 서비스 제공을 위한 막판 서비스 담금질에 총력을 기울이고 있다.
>> 네이버파이낸셜은 오는 28일부터 API를 적용한 마이데이터 서비스를 선보이기로 했다. 지금까지 마이데이터 API를 적용하지 않고 스크래핑 기반 서비스만 해왔다. 은행, 카드, 증권, 보험 등 기존 시범서비스 참여사들은 서비스 완성도를 높이기 위해 막판 담금질에 한창이다. 마이데이터 참여사 모두 사용자 정보 데이터 송·수신 과정에서 발생하는 오류를 발견해 수정·검증하며 전체 데이터 흐름 완성도를 높이는 과정에 동참해왔다. 기관 간 연결을 최대치로 끌어올리고 서비스 오류를 최소화해야만 대고객 서비스가 가능하기 때문에 전체 업권에 걸쳐 협력하고 있다. 특히 마이데이터 본시행에 따라 자산분석·관리, 개인화한 상품 추천 등 마이데이터 서비스간 진검승부가 불가피하다. 12월 시범서비스 기간 동안 부족한 기관 연결과 정보제공으로 서비스가 불완전할 수밖에 없었기 때문에 본 서비스 완성도를 높여 사용자 만족도를 제고해야 한다는 부담도 크다.
 

● 보안뉴스, 인공지능신문

(도메인)토픽 헤드라인 설명
(보안)
제로 트러스트
[2022 보안 핫키워드-5] 분산 네트워크와 제로트러스트의 대두
>> 코로나로 인해 재택근무가 본격적으로, 시급하게 시작됐다. 각자 집으로 흩어져 맡은 일들을 처리하게 되면서 ‘분산 네트워크’가 반강제적으로 유행하기 시작했는데, 처음 기업들은 집으로 보낸 직원들이 생산량을 예전처럼 맞추는 데에 온통 몰두했다. 그러다 보니 보안은 후순위로 밀려났고, 엔드포인트들은 각종 사이버 공격의 집중포화를 맞았다. 코로나에서 파생되는 각종 사회적 이슈들을 피싱 공격자들은 빠르게 활용하곤 했고, 집에 있던 직원들은 이러한 피싱 링크를 무심코 누르거나 악성파일을 의심 없이 열어 회사 크리덴셜을 빼앗기거나, 공격자들이 회사 네트워크나 클라우드 계정으로 접근하도록 했다.
>> 여기에 보안 업계는 크게 두 가지 해결책을 들고 나오는데, 그 중 하나가 ‘제로트러스트’다. 아무 것도 믿지 말고 전부 확인을 해야 한다는 내용의 보안 철학이자 원칙이 바로 이 제로트러스트다. 원래 있어왔던 개념이었지만 크게 힘을 받지 못했었다가 코로나와 랜섬웨어라는 두 가지 팬데믹이 덮치자 논의의 중심으로 자리를 옮기게 됐다.
제로트러스트는 ‘모든 엔드포인트와 모든 트래픽이 감염되었다’는 전제에서 출발한다. 이는 ‘if가 아니라 when의 문제’라는 현대의 보안 개념과 일맥상통한다. ‘if가 아니라 when’이란, 보안을 기획하고 구성할 때 ‘해킹이 될지도, 안 될지도 모른다’는 게 아니라 ‘언제인지를 정확히 모를 뿐 이미 해킹은 됐다’는 생각으로 접근하는 것을 말한다. 다른 말로 표현하자면, 모든 공격을 예방하려고 노력하는 것이 아니라, 공격이 이미 들어왔다고 생각하고 피해를 최소화하는 것에 집중하는 것이기도 하다.
예방이 아니라 피해 최소화를 위해 제로트러스트를 실제로 도입한다는 건 간단히 말해 ‘권한 최소화의 원칙’을 도입하는 것과 같다. 조직 내 각 구성원이 자기의 맡은 업무를 처리할 때 필요로 하는 권한만을 부여하는 것이다. 누구나 회사 클라우드 계정 비밀번호를 알게 된다거나, 여러 사람이 회사 공식 SNS 계정에 접근할 줄 알게 되는 지금의 사무실 분위기와 정반대되는 것으로, 이는 경영진에게도 적용되는 것이 원칙이다.
>> 제로트러스트의 원활한 도입은 조직 내 실존하는 모든 디지털 자원에 대한 ‘재고 파악’을 전제로 깔고 있다. 심지어 각 하위 조직과 조직원들의 업무 프로세스까지도 보안 부서 및 책임자가 파악하고 있어야 한다. 그래야 어느 정도의 권한을 부여할지 결정하고, 어떤 경로로 어떤 데이터에 접근하는 것이 정상적 행위인지 규정할 수 있기 때문이다. 이런 바탕 위에 ‘모든 것을 철저히 검사한다’는 원칙이 세워져야 한다.
(AI)
AI 윤리
 
인공지능 챗봇 ‘이루다’ 시련 이겨냈나?.. '이루다2.0'으로 베타 테스트, 2022년 공식 출시한다
>> 지난해 1월, 각종 논란과 이슈에 휩싸인 가운데 인공지능(AI) 챗봇 '이루다'는 결국 서비스를 중단해야 했다.결국, 이루다는 성희롱 이슈도 아니고, 동성애 혐오 및 차별 이슈도 아닌, 개인 정보에 대한 처리 실수와 미비로부터 발생된 과정의 문제로 판단된다
>> 부족한 점을 집중적으로 보완한 이루다의 새로운 버전인 ‘이루다2.0’ 공식 출시에 앞서 서비스 전반에 걸쳐 AI 윤리를 점검하고 서비스를 고도화하면서 실제 사용자 의견을 받기 위한 클로즈 베타 테스트를 진행하고 있다. 먼저, 스캐터랩은 AI 기술 및 제품 개발 전반에 걸쳐 가이드라인이 될 수 있는 총 5가지 AI 챗봇 윤리 준칙을 수립했다. 스캐터랩 AI 챗봇 윤리준칙은 외부 사례 및 스캐터랩 지난 경험을 바탕으로 정리되었으며, AI 개발에 참여하는 기획자, 리서처, 엔지니어 등 전체 팀의 의견 수렴 및 동의 과정을 거쳤다. 사람은 자신에 대해 깊이 이해하고 성장할 수 있는 사람과의 ‘관계'를 통해 삶의 행복을 느끼기에, 모든 사람에게 소중한 관계를 선물할 수 있도록 ‘사람을 위한 AI 개발'을 하겠다는 것이 대원칙이다. 이 외에도 다양한 삶의 가치 존중, 함께 실현하는 AI 챗봇 윤리, 합리적 설명을 통한 신뢰 관계 유지, 프라이버시 보호와 정보 보안 발전에 기여 등의 준칙을 담았다.

 

금일 주목할 기사는 초거대 AI 관련 기사입니다.

자연어 처리에 대한 경쟁은 점점 더 치열해지고 있는 것 같습니다. 자연어 처리에 대한 초거대AI라는 개념 꼭 가지고 가시고, 기반 기술인 트랜스포머도 같이 가지고 계시기 바라겠습니다.

다음 주목해야 할 기사는 제로트러스터 관련 기사입니다.

분산 네트워크 환경이 확산되는 이유는 코로나 현상과 연관이 되고, 그에 대한 엔드포인트 보안을 위해 제로트러스터 이야기가 계속 나오고 있습니다. 이와 관련하여 개념 다시 되새기면서 잡아 보시기 바라겠습니다.

마지막으로는 AI윤리 관련해서 챗봇 '이루다'와 관련해서 AI윤리가 많이 언급이 되었었는데요, 실제로 이 AI윤리의 개념이 어떻게 적용이 되는지 사례 기반으로 보셨으면 합니다.

 

 

  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유