본문 바로가기

여러가지과학/깊이있는과학

단백질을 이해하면 건강이 보인다, 단백질체 정보학

우리의 건강상태를 파악하기 위해서는 인간의 건강과 직결되어있는 단백질이 체내에 어떻게 분포되고 어떻게 작용하는가를 아는 것이 매우 중요하다.
그러나 현대의 과학기술은 우리 인간의 유전자 전체를 분석하는 기술은 갖고 있지만, 아직 우리 몸의 전체 단백질을 이해할 만큼 발전하지는 못했다.
인간은 약 2만~3만 개 정도의 유전자를 가지고 있는데, 유전자로부터 만들어지는 단백질은 수십 만 종류에 달하기 때문이다. 더욱이 우리 몸 구석구석에서 각각의 단백질은 생성과 변형, 소멸을 반복하고 있으므로, 우리 몸 안의 단백질 상태를 정확히 분석해 낸다는 것은 매우 어려운 일이다.

현재 단백질을 분석하는 방법은 분석목적에 따라 여러 가지가 있다.
분유 멜라민 사건 때의 단백질 함량검사와 같이 시료 안의 단백질 총량을 분석하기도 하고, 혈액 내에 알부민과 같은 특정 단백질의 농도를 조사하여 건강을 체크하기도 한다.

특히 프로테오믹스 (proteomics, 단백질체학) 분야에서는 첨단 질량분석기로 시료 내에 존재하는 다양한 단백질의 종합적인 분석을 실시한다.
단백질간의 양적 차이를 알아내는 정량분석은 특정 단백질로 인한 질병의 원인과 발생 경로를 분석하거나, 개발한 신약이 인체 내에서 효과적으로 작동하는지를 확인하는 등 질병 진단과 치료 목적에 사용된다.
또한 동물이나 식물의 원산지에 따라 단백질 분포가 다른 패턴을 보이는 것을 활용해 각종 동?식물의 원산지 추적에도 활용된다.

이러한 프로테오믹스 연구에서는 대량의 실험 데이터로부터 수많은 종류의 단백질 정보를 도출해내는 계산 작업이 수반된다. 대량의 단백질 데이터를 처리하고 해석하는 정보기술을 단백질 정보학이라 한다.

단백질체 정보학의 연구는 크게 세 가지로 구분할 수 있다.
첫째는 실험 데이터로부터 가능한 많은 단백질 정보를 얻어내는 방법에 관한 연구이다.
첨단 분석장비를 통해 얻은 데이터로부터 지금까지 발굴되지 않았던 새로운 단백질 정보를 찾아내기 위해서는 생물, 화학, 물리학, 수학, 전산학 등 여러 분야의 지식이 동원된다.
둘째로 실험에서 얻은 단백질 정보의 신뢰성을 판별하는 연구이다.
생명과학 분야의 첨단 장비 및 자동화 시스템으로 생산되는 대량의 실험 데이터는 연구자가 데이터를 하나하나 살펴보기에는 역부족이다.
생산되는 데이터에서 신뢰성있는 데이터만을 가려내기 위하여는 통계학, 전산학 등을 활용한 데이터 유의성 및 신뢰도 평가 작업이 필요하다.
셋째는 단백질 정보들을 다른 생물정보와 연결하여 생체 내에서의 단백질의 기능을 밝히는 방법에 대한 연구이다. 생물학 특히 분자생물학, 생화학 분야에서 오랜 기간 축적한 연구 결과물들을 서로 연결하면 새로운 생물학적 사실들이 모습을 드러낸다.

단백질체 정보학은 이처럼 여러 분야의 과학이 융합된 연구 분야이다.
인터넷과 데이터베이스의 발전으로 수많은 정보들이 우리 손 안에 쥐어져 있으며, 이들을 적절하게 활용하는 기술을 구사하면 생명현상의 새로운 세계를 탐험할 수 있다.
앞으로 국민의 건강과 안전한 먹거리를 위하여, 그리고 생명과학의 발전을 위하여, 많은 유능한 젊은이들이 단백질체 정보학에 관심을 갖고 도전해보기를 기대한다.

<권경훈 한국기초과학지원연구원 질량분석연구부장>