양자라는 개념은 사실 이미 오래 전부터 나왔던 근간 기본 기술이었고, 미래에 적용될 기술이라고도 이야기 하였습니다. 그렇지만 이제서야 글로벌적으로 기본 기술 시장 확보에 경쟁이 치열한 상황이고, 국내에서는 암호통신과 관련하여 점차적으로 확장하고 있는 상황인 것 같습니다.
금일(2022.04.14. 목) 신문리뷰 입니다
● 전자신문
구분 | 헤드라인 | 설명 |
(DB) 마이데이터
|
[스페셜리포트] 마이데이터 시행 100일.... 단기 안정화 '성공적' 새로운 경험은 '숙제' |
>> 지난 1월 5일 마이데이터(본인신용정보관리업)가 본시행을 시작한지 100일을 맞았다. 시범 서비스 초기 개인정보 유출 문제가 불거졌고 부족한 기관 연결, 정보전송 요구 호출 오류 등으로 서비스 완성도가 기대에 미치지 못한다는 평가를 받기도 했다. 시행 100일을 맞은 4월 현재 마이데이터 서비스 체계는 당초 기대 이상으로 빠르게 안정화됐다는 평가를 받고 있다. 이제 금융 마이데이터에 이어 공공·의료 등 전 분야로 마이데이터 체계를 확산하는 것이 앞으로의 숙제다. >> 국내 마이데이터 서비스는 민감한 개인정보이자 중요도가 높은 데이터로 분류되는 금융권 개인신용정보를 주축으로 도입됐다. 금융·공공·의료 등 다양한 분야에서 금융 마이데이터가 가장 먼저 확산을 시작한 이유다. 마이데이터 도입 이전에는 사용자가 서비스 가입·이용 과정에서 '개인정보제공 및 수집에 동의하시겠습니까?'라는 질문에 '네' 혹은 '아니오'로만 답변할 수 있었다. 만약 동의했다면 이후 해당 기업이 내 데이터를 어떻게 활용하고 있고 그 결과 내가 어떤 서비스나 이익을 누리는지 알 수 없었다. 단순히 마케팅용 혜택을 받느냐 받지 않느냐의 선택 수준에 머물렀던 셈이다. 마이데이터 도입 후 사용자는 기업에 내 정보제공 동의 여부를 좀 더 명확히 표현하고 이후 내 데이터를 어떻게 활용하는지도 확인할 수 있게 됐다. 개인이 원하면 언제든 데이터 제공도 쉽게 중단할 수 있는 환경이 조성됐다. 개인이 자신의 데이터에 대한 권리(주권)를 명확히 행사하고 데이터 제공에 따른 혜택과 이익을 분명하게 돌려받는 체계가 형성된 것이다. >> 정부 주체로부터 공동인증서 등 본인확인수단을 위탁받아 정보를 수집하는 스크린 스크레이핑 방식을 금지하고 정보보안기술을 적용한 표준API 방식으로 전면 전환하는 과정은 쉽지 않았다. 고객 인증정보를 직접 저장하지 않고 암호화한 대체정보를 활용하고 별도 통합인증 체계를 도입해 본인확인 기능을 강화하는 등 다양한 시도를 했다. 정보보호 강화를 위한 방안이었지만 더 간편하고 쉬운 금융서비스에 익숙해진 사용자는 초기에 불편을 호소하기도 했다. 특히 사용자가 마이데이터 체계에서 정보전송 의미를 명확히 이해할 수 있도록 도입한 '알고하는 동의'는 지금도 절차 간소화에 대한 요구가 끊이지 않고 있다. 현재 마이데이터 본허가 사업자는 56개다. 허가 심의를 받고 있는 곳은 예비허가 신청사와 본허가 신청사를 합쳐 총 25곳이다. 올 연말이면 약 100여개 기업이 마이데이터 시장에 진출했거나 진출을 본격 준비할 것으로 예상된다. 금융위원회에 따르면 출범 약 두 달 만에(2월 21일 기준) 39개 마이데이터 서비스가 출시됐고 누적 125억건 이상 데이터 API가 전송됐다. 누적 가입자는 1840만명(중복집계)으로 나타났다. 오픈뱅킹과 비교해 상당히 빠른 속도로 마이데이터가 대국민 서비스로 안착한 것으로 볼 수 있는 지표다. 오픈뱅킹은 출범 2년간 누적 API 전송량이 83억3000만건이었다. 시행 100일 동안 마이데이터 사업자 중 가장 두각을 나타낸 곳은 토스(비바리퍼블리카)다. 기존 서비스를 마이데이터 체계로 전환하면서 가장 많은 사용자와 월간활성사용자수(MAU)를 기록한 것으로 추정된다. 금융권에서는 KB국민은행의 KB마이데이터가 상대적으로 좋은 성적을 보인 것으로 추산됐다. >> 은행·카드·증권·핀테크 등 다양한 업권에 걸친 사업자들은 자사 마이데이터 서비스 사용자 확대 방안을 고심하고 있다. 마이데이터 기반으로 초개인화 서비스를 설계·제공하려면 충분한 사용자 데이터를 우선 확보해야 하기 때문이다. 사용자 입장에서 마이데이터가 어떤 혜택을 주는지 제대로 경험할 수 있으려면 풍부한 데이터 기반과 높은 분석 능력이 반드시 필요하다는 것이 업계 중론이다. 은행권 한 관계자는 “마이데이터 서비스를 유료화해서 수익을 내는 것이 아니라 마이데이터로 확보한 고객 데이터를 잘 분석해 만족스러운 초개인화 서비스를 구현하고 여기서 파생되는 수익을 기대하는 것이 맞다”며 “빅데이터, 머신러닝, 인공지능(AI) 등 신기술 역량을 스스로 갖추고 얼마나 고도화하느냐가 마이데이터 차별화 핵심 포인트”라고 강조했다. |
(보안) 양자 |
진정한 양자 2.0 시대의 선결 조건 | >> 2030년 예상 시장 규모 136조원. 특허청이 전망한 세계 양자정보통신 시장 규모이다. 양자컴퓨팅 이외에 양자암호, 양자 센싱만 추려내도 29조원이다. 10년 전만 해도 미미했던 양자 산업이 4차 산업혁명의 주요 시장으로 떠오르고 있다. 특히 실험실 수준의 양자 기술이 실생활에 쓰이기 시작하면서 양자 르네상스 시대를 맞고 있다. 양자 컴퓨터, 양자 인터넷, 양자 센싱 등 다양한 분야에서 글로벌 경쟁이 가속되고 있다. 그 가운데에서도 양자암호통신은 다른 양자 기술과 달리 기술 성숙도가 높고 초기 상용화가 빠르게 진행되고 있어 다양한 시장 창출과 저변 확대 노력이 절실하다. 진정한 양자 2.0 시대로 진입하기 위해서는 다음과 같은 선결 조건이 해결돼야 한다. >> 첫 번째 실생활에서 다양하게 접근할 수 있는 보안 서비스로의 진화가 필요하다. 양자암호통신 사업은 정부 과제 중심 레퍼런스를 구축하는 방향으로 전개돼 왔다. 앞으로는 공공에서 쌓은 역량을 기반으로 서비스와 상품군을 늘리는 것이 급선무다. 특히 다양한 기업사업(B2B) 영역으로 확장하고, 이를 위한 요금제 개발도 필요하다. 두 번째 양자암호기술이 실제 생활에서 다양하게 사용되기 위해서는 양자암호기술도 지속적으로 고도화해야 하지만 이미 개발된 양자암호기술을 기존 인프라에서 잘 활용할 수 있도록 해야 한다. 세 번째 더 많은 회사가 시장에 뛰어들 수 있도록 해야 한다. 양자기술 사업은 적용 분야와 범위가 넓어서 어느 한 회사가 모두 해낼 수가 없다. 양자 키 분배 및 양자 난수 생성기의 기술 성숙도가 가장 높다고는 하지만 여전히 상용화해서 실제 사업을 추진하는 회사는 많지 않다. 상용화 기술을 보유한 회사가 많이 시장에 진입해서 선의의 경쟁을 통해 시장 크기를 키우는 것이 중요하다 >> 양자 기술은 미래 기술 패권을 좌우할 주요 기술로, 세계 각국이 경쟁적으로 투자하고 있는 상황에서 소모적인 경쟁보다는 더욱 적극적인 투자와 노력을 통해 협력을 확대할 필요가 있다. 양자기술 사업을 대중화하고 본격적으로 개화될 양자 르네상스 시대를 준비해야 한다. |
[참고] 마이데이터 기본 개념도

● 인공지능 신문
구분 | 헤드라인 | 설명 |
(AI)
트랜스포머
|
트랜스포머 모델, 다양한 산업에서 인공지능 혁신, '트랜스포머 AI' 시대로 |
>> '트랜스포머(Transformer)’는 버트(BERT) 및 GPT-3과 같이 오늘날 널리 사용되는 언어 모델의 중추이다. 처음에는 자연어처리(NLP)를 위해 개발되었지만 컴퓨터 비전, 약물 발견 등 전 산업에서 활용돼 혁신을 가속하고 있다. 예를 들어, 은행·금융 서비스 및 보험 등에서는 고객을 유지하고 비용을 절감하며, 수익을 높이고 변화하는 규칙과 규정 등을 준수해야 한다. 이에 솔루션은 기업의 정보 검색, 의도 분석, 고객 서비스 등과 규정 준수 프로세스 자동화 및 응용 프로그램을 효율적으로 수행하고 그에 따르는 위험을 완화하도록 돕는다. 트랜스포머 모델은 문장 속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신경망을 의미한다. 어텐션(attention) 또는 셀프어텐션(self-attention)이라 불리며, 진화를 거듭하는 수학적 기법을 응용해 서로 떨어져 있는 데이터 요소들의 의미가 관계에 따라 미묘하게 달라지는 부분까지 감지한다. 구글(Google)의 2017년 논문(Attention Is All You Need)에 처음 등장한 트랜스포머는 지금까지 개발된 모델 중 가장 새롭고 강력한 성능을 보여주며, ‘트랜스포머 AI’라 불리는 머신러닝 생태계의 혁신을 주도하고 있다. 여기에 구글은 2020년에 대규모 이미지 인식을 위한 트랜스포머(API)를 발표(Transformers for Image Recognition at Scale)하기도 했다. 스탠퍼드대학교 인간중심 인공지능연구소(Stanford Institute for Human-Centered Artificial Intelligence, HAI)연구진은 지난해 8월에 발표한 논문(On the Opportunities and Risks of Foundation Models)에서 트랜스포머를 ‘파운데이션 모델’로 일컬은 바 있다. 해당 모델들이 인공지능의 패러다임 변화를 견인할 것이라 전망했으며, 지난 몇 년 사이 등장한 파운데이션 모델의 놀라운 규모와 범위는 상상을 뛰어넘는 수준으로 그 범주를 넓혀왔다. >> 트랜스포머 모델의 기능 트랜스포머는 텍스트와 음성을 거의 실시간으로 옮겨 청각 장애인 등 다양한 청중의 회의와 강의 참여를 지원한다. DNA의 유전자 사슬과 단백질의 아미노산에 대한 이해를 도와 신약 디자인을 가속하기도 한다. 트랜스포머는 트렌드와 이상 징후를 감지해 부정 방지, 제조 간소화, 온라인 추천, 헬스케어 개선 등에 기여한다. 구글이나 마이크로소프트 빙(Microsoft Bing)에서 검색할 때에도 트랜스포머를 사용한다. >> 트랜스포머 AI의 선순환 순차적 텍스트나 이미지, 비디오 데이터를 사용하는 애플리케이션은 무엇이든 트랜스포머 모델이 될 수 있다. 이는 트랜스포머 AI의 선순환으로 이어진다. 대규모 데이터세트로 구축된 트랜스포머는 정확한 예측을 통해 효과적인 쓰임새를 찾아내고, 이로 인해 더 많이 생성한 데이터로 개선된 모델을 구축할 수 있다. 여기에, 엔비디아가 문장 속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신경망인 ‘트랜스포머(Transformer)’ 모델을 통해 AI 분야를 가속한다고 밝혔다. >> CNN과 RNN을 대체하는 트랜스포머 불과 5년 전까지 가장 인기 있는 딥 러닝 모델로 손꼽혔던 컨볼루션 신경망(Convolutional Neural Network. CNN)과 순환 신경망(Recurrent neural network. RNN)은 현재, 트랜스포머가 대체하고 있다. 실제로 지난 2년간 아카이브(arXiv)에 게재된 AI 관련 논문의 70%에 트랜스포머가 등장한다. 2017년 전기전자학회(IEEE) 논문에 패턴 인식 분야의 최고 인기 모델로 RNN과 CNN이 보고됐다는 사실을 감안하면 이는 아주 전위적인 변화이다. >> 라벨링은 없애고 성능은 높이고 트랜스포머의 등장 전까지는 라벨링된 대규모 데이터 세트로 신경망을 훈련해야 했다. 이런 데이터 세트들은 구축에 많은 시간과 비용이 소요된다. 트랜스포머는 요소들 사이의 패턴을 수학적으로 찾아내기에 이러한 과정을 필요로 하지 않는다. 따라서, 수조 개의 이미지와 페타바이트(petabytes)급 텍스트 데이터를 웹과 기업 데이터베이스에서 사용할 수 있다. 이에 더해 트랜스포머가 사용하는 연산은 병렬 프로세싱에 적합하기에 모델의 실행 속도 또한 빨라진다. 현재 트랜스포머는 2019년 언어 처리 시스템용으로 개발된 벤치마크인 수퍼글루(SuperGLUE) 등의 유명 성능 리더보드들을 압도한다. >> 트랜스포머와 어텐션 트랜스포머는 네트워크에 송수신되는 데이터 요소에 위치 인코더로 태그를 지정한다. 이 태그를 따라 어텐션 유닛이 데이터 요소 간의 관계를 보여주는 일종의 대수 지도(algebraic map)를 계산한다. 어텐션 쿼리는 멀티헤드 어텐션(multi-headed attention)이라 불리는 방정식들의 행렬을 계산해 대개 병렬로 실행된다. 이러한 도구들을 활용해 컴퓨터는 인간의 눈에 비치는 패턴을 똑같이 볼 수 있게 된다. >> 의미를 찾는 셀프어텐션 예를 들어, “그녀는 주전자의 물을 컵에 따랐다. 그것이 가득 찰 때까지” 라는 문장에서 ‘그것’은 컵을 의미한다. 또한 “그녀는 주전자의 물을 컵에 따랐다. 그것이 텅 빌 때까지”라는 문장에서 ‘그것’은 주전자를 의미한다. 구글 브레인(Google Brain)의 수석 연구원으로 앞서 언급된 2017년 논문 연구를 이끈 아시시 바스와니(Ashish Vaswani)에 따르면 “의미는 사물 간 관계의 결과이고, 셀프어텐션은 관계를 배우는 일반적 방법이다. 기계 번역은 단어 사이의 가깝고 먼 관계들을 파악해야 하는 셀프어텐션의 확립에 좋은 수단이다. 이제 셀프어텐션은 강력하고 유연한 학습의 도구로 완전히 자리매김했다”고 말했다. >> 트랜스포머 활용하기 트랜스포머 모델들은 과학과 헬스케어에 도입됐다. 런던 딥마인드(DeepMind)는 최근 <네이처(Nature)> 지에 소개된 트랜스포머인 알파폴드2(AlphaFold2)를 활용해 생명체의 빌딩 블록에 해당하는 단백질 연구를 개선하고 있다. 이 모델은 아미노산 사슬을 문자줄처럼 처리하는 혁신을 통해 단백질이 접히는 방식을 설명하고 신약 발견을 가속한다. 엔비디아와 아스트라제네카(AstraZeneca)는 신약 개발용 트랜스포머인 메가몰바트(MegaMolBART)를 구축했다. 아스트라제네카가 보유한 몰바트 트랜스포머의 다른 버전인 메가몰바트는 라벨링되지 않은 대규모 화합물 데이터 세트에서 대형 트랜스포머 모델 구축용 프레임워크인 엔비디아 메가트론(Megatron)을 사용해 훈련됐다. >> 분자와 의료 기록 읽기 작년에 메가몰바트가 발표되던 당시 아스트라제네카의 올라 잉크비스트(Ola Engkvist) 분자AI와 발견과학, 연구개발 부문 책임자는 “AI 언어 모델이 문장 속 단어들의 관계를 학습하듯, 우리의 목표는 분자 구조 데이터로 훈련된 신경망이 실제 분자 속 원자들의 관계를 학습할 수 있게 되는 것”이라고 말했다. 플로리다대학교 학술의료센터는 엔비디아 연구진과 협업해 게이터트론(GatorTron)을 구축했다. 이 트랜스포머 모델은 방대한 양의 임상 데이터에서 인사이트를 추출해 의료 연구를 가속한다. >>메가 트랜스포머 지난해 11월 엔비디아와 마이크로소프트는 5,300억 개의 파라미터를 가진 MT-NLG(Megatron-Turing Natural Language Generation) 모델을 발표하면서 대형 트랜스포머의 정점을 찍었다. 이 모델은 새로운 프레임워크인 엔비디아 네모(NeMo) 메가트론과 함께 공개됐다. 어떤 기업이든 십억 또는 조 단위의 파라미터를 보유한 자체 트랜스포머를 개발할 수 있도록 지원해 커스텀 챗봇과 개인 어시스턴트 등 언어를 이해하는 AI 애플리케이션을 개선하는 것이 목표이다. |
[참고] 트랜스포머 기본 구조
금일 주목할 기사는 트랜스포머관련 기사입니다.
자연어 처리 알고리즘인 BERT, GPT-3 등을 위해 만들어진 구글의 기반 기술이라고도 할 수 있는데요,
최근에는 자연어 처리 뿐만 아니라 은행, 금융, 그리고 단백질, 유전자 연구에서도 사용되고 있다고 합니다. 이런 측면에서 트랜스포머는 이제는 자연어를 위한 특화된 기술이라고 하기 보다는 AI의 근간이 되는 기술로 진화하고 있는 느낌입니다.
'IT 트렌드 IT Trend > IT 기사 IT news' 카테고리의 다른 글
[Daily IT News] 5G 국가망, 클라우드 보안(DataSecOps, 데이터보안메시, 데이터분석파이프라인보호, 공동책임모델) (0) | 2022.04.19 |
---|---|
[Daily IT News] 마이데이터, 디지털치료제, 원격진료 (0) | 2022.04.18 |
[Daily IT News] 자율주행, 사이버보안, 인공지능 편향 (1) | 2022.04.11 |
[Daily IT News] 헬스케어, 마이데이터, CSAP (0) | 2022.03.23 |
[Daily IT News] 클라우드 전환, 네트워크 군집, 블록체인, 클라우드 게임 (0) | 2022.03.23 |