AI 이미지 특강 - CNN, 의료인공지능 - alpaco

1. convolutional neural network

  • Gradient Descent 경사하강법

  • 학습: 손실함수를 줄이는 방향으로 모델의 weight(파라미터)를 업데이트 하는 것

입력 값을 필터(합성곱)로 대체

MLP로 모든 데이터를 다 학습할 수 있는데, 왜 이미지는 cnn을 통해서 학습해야 할까?

데이터를 어떻게 하면 숫자로 잘 '표현(representation)'할까?

convolution(합성곱)은 무엇인가?
필터를 사용한 연산

필터: 모양(가로선, 세로선, 동그라미, 사선)이 그려진 사각형(ex: 15*15)

  • 필터를 이미지의 각 모든 부분에 합성곱 해보자.
  • 필터를 겹쳐서(합성함수)로 다시 합성곱 해보자. ... 
  • n * 100 번 겹치면서 필터의 크기가 커진다. (n * 100  차)
  • 그러면, 필터 n개로 이미지를 나타낼 수 있다.

필터를 컴퓨터가 스스로 만들면 어떨까?
마치 러신머닝 관계식에서 weight를 찾는 것처럼.


image data를 처리하는 모델 비교

1. CNN: 모델이 가볍고, 빠르고, 데이터가 적어도 적당히 잘하게 학습 가능

2. Vision Transformer (Vit): 모델이 매우 무겁다. 데이터가 정말 많아야 하고, 학습 정말 주의깊게 잘 해야함.

1, 2의 차이는? indctive bias (귀납적 편향)

두 모델의 계산량 비교

1. CNN: 3*3 필터: 10*10*(컬러) = (300, 1) @ (256) = 7만

2. Vision Transformer (Vit): MLP방식: 32*32*(컬러) = (3072, 1) @ (256) = 70만


두 모델은 어떻게 데이터를 인식하게 할까?

  • CNN: 매우 지엽적인 특성을 묶어가면서 전역적인 특성으로 표현

  • ViT: 이미지 내부 뭉텅이들의 연관성 학습하면서 전역적인 특성을 표현

결론: data complexity에 따라서 적절한 모델을 선택, 구성

data complextiy가 높다: 유의미한 데이터가 정말 많고, 데이터 하나하나가 복잡하다. (숫자로 표현하기 어렵다)

숫자로 잘 표현한다 = 비슷한 건 비슷하게, 다른건 다르게


2. 실습

내용: CIFAR10 이미지를 머신러닝하여, 이미지-라벨 정확도 측정

CIFAR10: 32*32 사이즈 이미지, 10카테고리 * 10개 = 100개 이미지.


3. 의료인공지능

강사 이력: 뷰노(의료인공지능 전문 기업)에서 5년 근무

의료서비스 방향

  • 뷰노 서비스 사례:
    x-ray 결과를 인공지능 판별.

  • x-ray판별 서비스의 한계:
    인공지능도 실수는 함. 실수를 하면, 책임질 사람이 없음. 사람과 AI가 모두 판독해야 하기 때문에 도움이 되지 않음.

  • 진단보조의 한계:
    영상 진단은 기존에 존재하던 의료 행위임. 건강보험 등재 대상이 아님. 보험수가 적용X. 진단마다 돈을 받는 구조가 아니라, 구독형 무제한 서비스를 제공할 수 밖에 없음.

  • 한계를 돌파하는 방법
    1. 기존에 존재하는 의료행위지만 성능이 압도적은 AI
    2. 기존에 존재하지 않는 의료행위 AI

뷰노 인기 서비스

  • Bone-age: 뼈 성장 한계 예측

  • Med-DeepCARS: 입원 환자의 24시간 이내 심정지 예측 솔루션


의료 AI 연구원으로 일하면서 느낀 점들

  • 단점: 데이터 관련 의료규제. 프로젝트 호흡이 매우 김. 결과를 확인하기 어려움.

  • 장점: 가치 있는 일을 하고 있다는 자부심


Q&A 1. 신규서비스 과정 (4~5년)

큰병원 가서 KOL(key opinion leader)을 만나야함

  • 잘 섭외. 연구를 같이 합시다.
  • IRB, DRB와 같은 데이터 반출 심사를 병원 내부에서 진행 (1~2년 소요)
  • 데이터를 받고, 모델 개발, 결과를 내서 논문 작성, 출판
  • 식약처 인허가 신청
  • 어떤 기준으로 평가받을지, 어떤 데이터, 어떤 병원에서 할지 IND
  • 식약처 임상시험 시작
  • 정한 평가 기준을 상회하는 AI 모델 개발
  • 임상 시험 통과
  • 모델 인허가 승인. (제품 판매 허가 받음)
  • 심평원, NECA에서 영업방법 허가 받음 (보험코드, 비급여, 급여)
  • 신의료기술, 비급여로 4년간 받고, 재평가 이후 급여로 심사
  • 비급여 확정
  • 병원 영업
  • (빠르면 4~5년 정도가 걸림. 데이터는 큰 병원당 만 명정도. )


Q&A 2. 타기업 사례, 루닛

  • 암 진단 (유방암에 판독률 높음): 판독률이 의사 수준

  • 항암제 반응률 예측: 환자와 항암제 간의 궁합을 확률로 나타냄


Q&A 3. AI 개발자 채용시 주로 보는 것.

  • 문제해결력: 모델의 정확도를 높이기 위한 노력.
    • 기본적으로 논문을 통해 주로 문제해결력을 판단한다.
    • 본인이 논문이 없다고 하면, AI경진대회 결과로 대신할 수도 있다.


댓글 쓰기

다음 이전