내일배움캠프_QAQC 트랙 1기/아티클 스터디

[내일배움캠프] 아티클 스터디 (6)

hyewonnnn 2025. 1. 2. 19:55

바이오 빅데이터 활용 증가…분석 기술 보유한 국내 업체는?

https://www.kpanews.co.kr/article/show.asp?category=D&idx=236420

 

바이오 빅데이터 활용 증가…분석 기술 보유한 국내 업체는? | 약사공론

최근 전 산업계에서 빅데이터의 활용이 화두로 떠오르고 있다. 특히 생명공학 분야에서도 기술 혁신으로 다양한 소스에서 정보를 수집하는 일이 가능해지면서 빅데이터의 활용이 중요한 영역

www.kpanews.co.kr


  • 최근 전 산업계에서 빅데이터의 활용이 화두로 떠오르고 있으며, 생명공학 분야에서도 빅데이터 활용이 중요한 영역으로 자리잡고 있다
  • 바이오 분야의 빅데이터 활용도가 높아지면서 현재 국내 여러 기업들이 빅데이터 기술을 활용한 플랫폼 개발이나 진단·분석 서비스 등을 제공 중이다
  • 여러 바이오 회사에서의 빅데이터 활용 방안 소개

 

[ 주요 포인트 ]

  • 헬스케어 산업은 빅데이터의 도래로 많은 영향을 받았다
  • 다양한 조직에서 분석 도구, 인공 지능(AI) 및 머신러닝(ML) 기술을 사용해 데이터 기반 통찰력을 도출해 의료 비용을 절감하고 수익흐름을 개선하며 개인화된 의학을 개발사전 예방적으로 환자 진료를 관리 중이다.
  • 빅데이터 활용으로 개별환자의 요구에 맞는 맞춤형 의료의 제공이 가능해졌으며 질병의 진단 및 치료를 지원하는 자동화된 분석의 개발로 발전하고 있다
  • 에비드넷 : 의료 빅데이터를 바탕으로 질병현황, 약물 처방 빈도, 수술 빈도, 검사 빈도 등의 메타데이터 분석 및 패턴정보를 제공하는 EVIX-INSIGHTTM 플랫폼 개발을 완료
  • 신테카바이오 : 전 세계 다양한 인종, 수천 명의 유전체시퀀싱 데이터를 마하 슈퍼컴퓨팅 기술로 분석을 수행 중이며 , 자체 기술인 Adiscan 엔진으로 여러 데이터의 수집 및 활용은 병원 정밀의료를 위해 활용돼 질병 연관성 검증의 역할을 수행 중
  • 테라젠바이오 : 첨단 유전체 분석 기술을 바탕으로 맞춤형 진단 및 솔루션과 차세대 염기서열 분석(NGS) 임상 검사, 의료 빅데이터 등의 서비스를 제공. 직접 관련 알고리즘을 개발해 특허를 취득하기도 함
  • 쓰리빌리언 : 인공지능 유전변이 해석 시스템을 활용해 질병과의 상관성을 검정하여 최종 진단하는 서비스를 제공
  • 데이터 형평성을 촉진하고 정크데이터의 중복성과 과부하를 최소화하기 위해 기업, 산업 및 데이터 생성 팀 간의 협업을 촉진해야 한다
  • 컴퓨터 엔지니어, 데이터과학자, 생물의학 과학자 및 임상의사를 초빙해 학제 간 팀, 부서 및 센터를 구축하고 약물 파이프라인에 적용할 수 있도록 규제기관의 AI-ML 모듈 및 방법을 승인해야 한다

 

 

[ 핵심 개념 및 용어 정리 ]

  • 핵심 개념
  • 헬스케어 산업 : 생명과 건강에 관해 새로운 시각에서 장래의 발전 가능성을 모색하는 산업.
  • 질병 연관성 검증 : 유전자 변이와 질병 연구성 연구는 매우 중요한 주제. 유전자 변이는 개인의 유전체에 발생하는 변화일부 변이는 질병의 발생과 진행에 영향을 미칠 수 있다. 이러한 연구는 질병의 예방 진단 및 치료에 있어 매우 유용한 정보를 제공할 수 있음. 따라서 슈퍼 컴퓨팅 기술로 유전체 빅데이터를 활용해 이를 검증하는 것은 이 검증에 효율적 측면에서 매우 도움이 된다고 할 수 있음
  • 차세대 염기서열 분석(NGS) : 유전체의 염기서열의 고속 분석 방법. 기존의 생어 염기서열 분석(Sanger sequencing)과 달리 많은 수(백만 개 이상)의 DNA 조각을 병렬로 처리하는데 특징이 있다. NGS의 등장으로 유전체 분석에 필요한 비용이 급격히 낮아져 많은 분야에서 다양하게 사용되고 있다
  • 용어 정리
  • 머신러닝(ML) : 인공지능의 연구 분야 중 하나로, 인간의 학습 능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술 및 기법
  • 유전체 시퀀싱(DNA Sequencing): 유전체(DNA)의 염기서열을 결정하는 방법 → 생어 시퀀싱 (Sanger Sequencing)과 차세대 시퀀싱 (Next-Generation Sequencing, NGS)로 분류된다
  • AI-ML 모듈 : AI(인공지능)와 ML(머신러닝)을 활용해 약물 파이프라인에 적용하여 기술 효율을 이룰 수 있도록 하는 시스템
  • 정크 데이터 : 더이상 필요하지 않거나 유용하지 않은 데이터

 

 

 

[ 실무 적용 사례 ]

  • 실무 적용
아스트라제네카, 흉부 X레이 AI로 정밀 분석
: 영국의 아스트라제네카는 AI 편입 비율이 3.8%이고, 여러 업체와 제휴, AI를 사용하여 신약 제약을 본격화하고 있다.

인도의 Qure.ai와 제휴하고 있는데, Qure.ai는 의료 영상 데이터를 분석, 이상을 감지하는 AI를 개발하는 회사이다. 흉부 X레이를 분석하는 데 AI를 사용할 경우, 기존 방사선학적 독영(검사 영상을 정밀하게 해독하는 것)에 비해 오히려 정밀하게 판독할 수 있는 것으로 알려지고 있다.
  • 관련 사례
  • 미국의 암젠사 : AI 편입 비율이 9.0%에 달해, 세계에서 가장 많은 인공지능 활용도를 보이고 있다. AI와 ML을 활용하여 제약을 하는 미국의 제너레이트 바이오 메디슨과 협업하여 각종 치료 영역과 여러 가지 치료법에 걸친 5가지 임상 표적에 대한 단백질 치료제를 발견.창출하기 위해 연구 협력하고 있다.
  • 미국의 바이오젠 : 프랑스 제약사 세라파나시아와 협업체를 구축하여 의료용 영상과 임상 관련 데이터 소스를 AI 기계학습으로 분석, 환자 케어 개선이나, 의약품 개발 속도 향상, 신경질환의 근본적인 병태에 대한 이해를 촉진하는 솔루션 창출에 목적을 두고 있음