3 min to read
Protein homology modeling using UCSF Chimera
UCSF Chimera를 이용한 상동성 모델링

Protein homology modeling using UCSF Chimera
Introduction
단백질의 3차원 구조는 그 기능과 생물학적 역할을 결정짓는 핵심 요소이기 때문에, 단백질 구조 예측은 구조생물학과 신약개발 분야에서 매우 중요한 과제이다.
하지만 모든 단백질에 대한 구조를 알기에는 어려우며, 이러한 한계를 보완하는 접근법이 바로 상동성 모델링(homology modeling) 으로, 서열 유사성을 기반으로 알려진 구조(template)를 활용하여 목표 단백질의 3차원 구조를 추정한다.
여러 소프트웨어 도구들 중 UCSF Chimera는 직관적인 인터페이스를 제공하며, 서열 정렬, 상동성 모델 생성, 그리고 분자 시각화를 통합적으로 지원한다. 특히 BLAST나 PSI-BLAST를 이용한 서열 검색과 단백질 데이터뱅크(PDB)의 구조 템플릿을 결합하여 초기 3차원 모델을 생성하고, 이를 시각적으로 분석 및 수정할 수 있다. 이러한 과정은 단백질–리간드 상호작용 탐색과 같은 과정에서 중요한 정보들을 제공한다.
UCSF Chimera를 이용하여 서열 유사성을 기반으로 한 Protein homology modeling을 실습해보자.
Target Protein
Name : Gag-Pol polyprotein
UniProt : P03366
Amino acids : 1447
Gag-Pol은 HIV에서 구조 단백질과 핵심 효소들을 한꺼번에 담고 있는 Polyprotein이다.
이 단백질은 번역 과정에서 리보솜 프레임시프트를 통해 제한적으로 생성되며, Gag과 Gag-Pol의 합성 비율은 바이러스의 조립과 감염성 유지에 결정적인 역할을 한다.
따라서 Gag-Pol은 HIV 생존과 복제에 필수적일 뿐만 아니라, 항레트로바이러스 약물이 직접적으로 겨냥하는 주요 타깃으로서 임상적으로도 매우 중요한 단백질이다.
UniProt
UniProt 은 단백질 서열과 기능 정보에 관한 가장 포괄적이고 무료로 이용할 수 있는 생물학 데이터베이스로, 연구 문헌에서 얻은 단백질의 생물학적 기능에 대한 많은 정보를 제공하고 있다.
현재 목표하는 단백질인 Gag-Pol polyprotein 또한 UniProt에서 Structure와 Sequence 등 다양한 정보를 확인할 수 있다.
Structure
Sequence 중 일부
USCF Chimera
UCSF Chimera 는 단백질·핵산 등 생체분자의 3차원 구조를 시각화하고 분석할 수 있는 오픈소스 소프트웨어이다.
구조 모델링, 분자 간 상호작용 탐색, docking 결과 확인 등 다양한 기능을 지원하며, 연구자들이 단백질 구조 예측과 시각화에 널리 활용한다.
이제 본격적으로 USCF Chimera를 이용해 Modeling 해보자.
Modeling
download : UCSF Chimera Home Page
fetch
USCF Chimera는 UniProt 코드를 이용해서 불러올 수 있다.
Sequence
UniProt 코드로 불러오면 다음과 같은 서열을 볼 수 있다.
Blast Protein
BLAST protein은 Bioinformatics에서 가장 많이 쓰이는 시퀀스 비교 도구로, 어떤 단백질 서열이 주어지면 이미 알려진 단백질 데이터베이스에서 비슷한 서열 을 찾아주는 검색 도구이다.
위 sequence를 이용해서 비슷한 sequence를 가진 단백질을 조회해보자.
Name, Score, Discription 등 정보와 함께 비슷한 염기서열의 단백질들을 제공해주는데, 이중 Score는 얼마나 비슷한지에 대한 정량적 지표이다,
Modeling
위 유사단백질 중 가장 score가 높은 것을 선택해 모델링하면 다음과 같이 나온다.
그리고 유사 단백질과 우리가 목표하는 단백질과의 서열을 비교할 수 있다.
이를 이용해서 Gag-Pol polyprotein의 형태를 예측해보자.
Homology Modeling
Homology Modeling은 이미 알려진 단백질의 구조를 이용해서 구조가 알려지지 않은 단백질의 구조를 예측하는 방법이다.
다음 메뉴에서 homology modeling을 적용할 수 있다.
Licence Key를 넣어주면 바로 사용이 가능한데, 대학생이면 학교 메일을 통해 무료로 발급받을 수 있다.
이는 웹 서버를 통해 실행하는 것이기 때문에 실행하면 다음과 같이 진행된다.
완료가 되면 5개의 예측 모델 리스트와 함께 모델링을 보여준다
Comparing
모델이 일치하지 않은 부분은 Ctrl+drag를 통해 염기서열을 확인할 수 있다.
이런식으로 차이나는 부분을 염기서열과 모델링으로 직관적으로 확인할 수 있다
Comments