머신 러닝 모델을 사용하여 의약품 생산량을 증가시킨 바이오제약 회사 Takeda

Various sizes, shapes, and colors of different pill medication

도쿄에 본사가 있는 Takeda Pharmaceutical Company Ltd. (다케다제약) 는 환자 중심적이고 가치를 중시 하고 R&D를 중심으로 삼는 글로벌 바이오제약 회사로, 전 세계 사람들이 “더 나은 건강과 더 밝은 미래”를 누릴 수 있도록 최선을 다합니다. 환자의 삶을 변화시킬 수 있는 치료법에 대한 그들의 열정과 추구는 230년이 넘는 일본의 특별한 역사에 깊은 뿌리를 두고 있습니다.

Philippe Noquéro는 유럽 Six Sigma 리더이자 공인 마스터 블랙 벨트(MBB)이며, 전사에서 시행 중인 AGILE 4.0 프로그램의 일환으로 유럽의 Takeda 네트워크 전체에서 Six Sigma 역량을 책임지고 있습니다.

Minitab과 오랫동안 관계를 유지해 온 Takeda는 분석을 통해 제조 문제를 해결하고, 개선 기회를 확인 및 실행하고, 최소한의 감독으로 공정 개선을 달성하는 데 적절한 실험을 설계해왔습니다. 

과제

스위스에 있는 Takeda Neuchâtel에서는 두 가지 종류의 혈액 응고 장애 또는 결핍을 치료 하는 세 가지 약품을 생산합니다.

  1. 혈액 장애 유형 1: A형 혈우병 - 이 환자는 VIII 단백질이 부족하거나 결핍되어있습니다. A형 혈우병은 가장 일반적이고 잘 알려진 형태의 혈액 응고 장애 및 결핍입니다. Takeda는 이 질환을 치료하는 다음과 같은 두 가지 혈액 응고제를 생산합니다.
    1. Factor VIII: 혈액 응고 사슬에 필요한 단백질입니다.
    2. Long-lasting Factor VIII: 환자 체내에서 오래 작용하는 Factor VIII 버전입니다.
  2. 혈액 장애 유형 2: 폰빌레브란트병(vWD) - 이 혈액 장애가 있으면 혈액이 제대로 응고되지 않습니다. vWD가 있는 사람은 폰빌레브란트 인자 단백질 수치가 낮거나 이 단백질이 체내에서 제 기능을 하지 못합니다. Takeda는 이 질환을 치료하는 한 가지 혈액 응고제를 생산합니다.
    1. Von Willebrand(폰빌레브란트) Factor: 혈액 응고 사슬에 필요한 단백질

위의 세 가지 약품을 ”재조합 치료제(recombinant treatment)”라고도 하는데, 이것은 인간 또는 동물의 파생물을 첨가하지 않고 생산됩니다. 세 가지 약품은 세포 배양을 사용한 생명공학적 생산에서 파생됩니다. 따라서 의약품의 안정성, 순도 및 효능이 매우 우수합니다.

Takeda는 이런 약품을 보다 효율적으로 생산하기를 원했기 때문에 생산 과정 중에 사용되는 세포 배양의 수율을 높일 수 있는 방법을 찾고 싶었습니다. 이를 달성하기 위해 연구원들은 어떤 공정 매개변수가 세포 배양 수율에 영향을 미치는지 이해해야 했습니다.

해결책

Philippe의 팀은 여러 배치를 추적하고 필수 혈액 응고 단백질의 세포 배양 수율에 영향을 미질 수 있는 30개에 가까운 공정 매개변수에 대한 데이터를 수집했습니다. Philippe는 탐색적 분석을 위한 데이터를 준비하기 위한 기능 공학 기법을 포함하여 많은 통계 도구를 사용했습니다. 팀은 부분 최소 제곱으로 수율에 영향을 미치는 중요한 요인을 확인할 수 있음을 알게 되었습니다. 부분 최소 제곱 회귀는 여러 예측 변수와 하나 이상의 연속형 응답 간의 관계를 설명합니다. 이 분석은 예측 변수가 매우 공선형적이거나 예측 변수가 관측치보다 많은 경우에 특히 유용합니다. 

팀은 이 방법을 사용하여 모형의 각 예측 변수가 갖는 중요성을 나타내는 표준화된 계수 시각화에 표시되는 몇 가지 주요 공정 매개변수를 확인했습니다.

Standardized coefficients visualization

Phillipe는 이 결과를 다른 팀원들과 다른 분야의 동료들과 공유하게 될 것임을 알고 있었습니다. 부분 최소 제곱 회귀는 고급 기법에 해당하기 때문에 모든 사람이 스스로 이해하고 사용하기 어려울 수 있습니다. Takeda의 과학자 및 엔지니어들은 Minitab Statistical Software를 사용하여 데이터를 스스로 분석할 수 있도록 교육을 받고, 필요한 권한을 부여받았습니다. Phillipe는 CART 의사 결정 트리가 부분 최소 제곱 회귀(PLS) 분석을 어떻게 보완할 수 있는지 평가하기로 결정했습니다. 이 방법은 두 가지 이점이 있습니다. CART 트리는 PLS 분석 결과를 확인할 수 있고, 일반적으로 사람들이 사용하고 이해하기가 더 쉽습니다.

CART 트리의 유용한 출력 중 하나는 상대 변수 중요도 그림입니다. 개선 점수가 가장 높은 변수가 가장 중요한 변수로 설정되고, 나머지 변수는 같은 방법으로 순위가 지정됩니다. 결과는 부분 최소 제곱 방식과 일치했고, 수율 공정에 대한 흥미로운 토론으로 이어졌습니다. CART는 또 다른 직관적인 시각화인 단일 의사 결정 트리도를 제공합니다(표시되지 않음).

Relative Variable Importance plot

결과

연구원들은 여러 머신러닝 모델을 사용하여 수율 공정에 대해 더 자세히 알아보고 중요한 매개변수를 식별할 수 있었습니다. CART 의사 결정 트리 결과는 부분 최소 제곱 회귀의 결과와 일치했습니다. CART 의사 결정 트리는 일반적으로 사용 및 해석하기가 더 쉬워서 더 많은 과학자와 엔지니어가 사용할 수 있습니다. 따라서 Takeda의 Minitab 사용자들이 결과를 이해하고 해석하는 속도가 빨라질 수 있었습니다. 의사 결정 트리는 기존 모델링 기법에 비해 새롭지만, 직관적이고 엔지니어 및 과학자들이 이미 알고 있는 통계 도구를 보완합니다. 

다음 단계에 Philippe와 그의 팀은 모델의 정확성을 향상시키기 위해 Minitab Statistical Software를 사용하여 랜덤포레스트(Random Forests) 및 Gradient Boosted Trees(TreeNet®)모델링 기법과 같은 고급 의사 결정 트리를 통합할 계획입니다.

Minitab 사례 연구에 액세스

사례 연구를 확인하려면 추가 정보를 제공하세요.

Takeda Logo

고객

Takeda Pharmaceutical Company Limited (다케다 제약)

조직

  • 1781년에 일본 오사카 도쇼마치 설립
  • NYSE에 성장됨(TAK)
  • 아시아 최대 제약회사
  • 매출 기준 세계 20대 제약 회사 중 하나

도전

Takeda는 세가지 혈액 응고 약물을 더 효율적으로 생산하고 싶었기 때문에 생산에 사용되는 세포 배양의 수율을 높일 방법을 찾아야 했습니다.

사용 제품

Minitab® Statistical Software

결과

연구원들은 수율 공정에 대해 더 자세히 알고 중요한 매개변수를 식별할 수 있었습니다.