신약설계를 위한 화학정보학
- 작성자 : 이 성 광
- 소속 : (사단법인) 분자설계연구소 분자정보실 실장
- 현재 한남대학교 화학과 교수
- 현재 한남대학교 화학과 교수
도입
인간 게놈분석의 완성을 토대로 점차 유전자의 기능이 규명되면, 지금보다 훨씬 많은 의약타겟이 알려질 것으로 예상된다. 그러므로 많은 의약타겟에 대하여 적합한 선도물질(lead compound)을 확인하고 최적화하는 과정이 체계적으로 필요하므로 화학정보학의 도입이 시급하다고 하겠다. 화학정보학(cheminformatics 또는 chemoinformatics)은 컴퓨터과학과 화학이 주가 되는 학제적인 연구 분야이지만, 그 분야를 정확하게 정의하기에는 다소 어려운 점이 있다. 처음 화학정보학을 정의한 Frank Brown1)에 따르며, 신약의 선도물질(Lead compounds)을 탐색하고 최적화하는 과정을 보다 빠르고 효율적으로 진행시키기 위하여 여러 가지의 자료를 정보(information)화하고 지식(knowledge)으로 변환시키는 과정을 모두 통틀어서 정의하고 있다. 이러한 이유는 고효율 검색(high throughput screening, HTS) 및 화합물군(library) 합성과 같은 신약개발 과정에서 생겨난 혁신적인 기술로 말미암아 기하급수적으로 증가하는 데이터를 효율적으로 처리하기 위해서 화학, 수학, 전산 분야가 융화된 기술이 필요하게 되었기 때문으로 생각된다. 일반적으로 화학정보학은 생물정보학(bioinfomatics)분야와 혼돈이 되기도 하는데, 이것은 데이터를 정보화하고 지식화하는 정보학적 관심과 이를 위해 사용되는 다양한 방법들이 비슷하기 때문이다. 하지만 생물정보학은 다루어 지는 데이터들이 유전코드(ATGC)나 아마노산를 나타내는 20개의 코드들 을 이용한 구조적 정보들이고, 화학정보학의 경우는 이보다 더 다양한 화학구조들을 다루므로 일부 연구자들은 화학정보학이 생물정보학을 포함하고 있다고 말하기도 한다. 최근에 와서 최근 컴퓨터 성능의 급속도로 발전하면서 보다 많은 화학데이터들을 처리할 수 있게 됨으로써 정보화 및 지식화 과정을 체계화하는 연구들이 등장하게 되었다. 화학정보학에서는 실험실에서 얻은 실험데이터를 분석하는 것뿐만 아니라, 분자모델링을 통해서 계산으로 얻어진 화학구조의 물리화학적 특성들을 분석하는 과정들도 모두 포함하고 있다.

화학정보학을 통해 데이터를 기반으로 얻어진 정보와 지식은 특히 신약설계에서는 중요한 역할을 한다. 특히 유기합성과 생물학적 정량(bioassay)과정과 같이 고비용이 소요되는 신약개발 과정은 화학정보학을 통한 화합물의 정보와 지식을 바탕으로 진행되어야 비용절감 뿐만 아니라 보다 넓은 범위의 영역을 효율적으로 탐색할 수 있다. 그림 2는 신약개발과정에서 유기합성과 생물학적 정량과정과 같은 현실세계와 컴퓨터 내(in silico)에서 진행되는 가상 화합물들과 검색과정과의 관계를 나타낸 것이다.

최근 신약개발 분야에서 고효율 검색(HTS) 방법과 화합물 합성을 위한 자동화시스템의 도입으로 광범위한 화합물로부터 신약후보물질을 탐색할 수 있게 되었고, 이에 적용할 화합물 군을 설계하고 결과를 분석하는 다양한 계산방법들이 속속 등장하게 되었다. 현재 이론적으로 만들 수 있는 화합물군은 1040개 이상으로 예상되며2), 이러한 화합물들을 합성 또는 천연물에서 추출하고, 생물학적 검증을 하도록 결정할 수 있는 합리적인 시스템이 필요한 것은 당연하다. 화학정보학은 이러한 면에서 화합물군에서부터 실제 신약후보 대상물질을 여과해 내고 설계하는 방법으로 사용될 수 있다.
일반적으로 새로운 선도물질을 탐색하기 위하여 적용되는 화합물군의 다양성(diversity)은 시스템내의 지식의 양과 반비례하는 관계를 나타낸다. 즉 수용체에 대한 정보가 적을수록 선도물질을 찾기 위하여 다양한 화합물군이 적용되어야 하며, 이러한 면에서 신약개발을 위한 소요 경비(인력, 시간 등)가 증가하게 된다. 이런 점에서도 화학정보학은 신약설계 및 분석과정을 단계별로 데이터베이스화하고 그로부터 관련된 지식을 유도해낼 수 있는 적합한 시스템을 설계함으로써, 선도물질을 확인하고 최적화하는 과정을 수행할 수 있다.

구성요소
다양한 기술들 중에서 화학정보학과 관련된 구성요소들을 나타내면 다음 표1 에 나타낼 수 있다.
표 1. 화학정보학의 중요 구성요소 3) |
1. 화합물의 등록방법 2. 화학구조, 분광학데이터, 순도 3. 생물학적 활성 4. 활성과 구조를 관련지을 수 있는 도구 5. 물리화학적 물성 계산 6. 가상 데이터베이스 구축 7. 데이터 마이닝 8. 가상 스크리닝 9. 구조기반 디자인 10. 통계방법 11. 시각화 |
가상 데이터베이스 구축은 이론적으로 생성이 가능한 가상의 화합물을 구축하므로서, 실제로 화합물을 설계단계에서 검색을 하는 대상으로 사용되고, 이들을 통해 선도물질 도출을 위해 최대한 다양한 구조의 화합물군을 설계하거나, 특별한 target에 집중적으로 작용을 할만한 구조적 특징을 지니고 있는 focused library설계에 사용되어 HTS나 조합화학연구와 연계를 이룬다. 스크리닝의 hit들과 유사한 구조를 찾기 위해 사용되는, 데이터 마이닝 기술은 주로 substructure(기본골격)검색이나 2D-, 3D-유사성 검색, 분자의 모양을 이용한 검색, 공동활성을 지닌 화합물의 기본 framework를 찾거나 좀더 나아가 이들이 약효를 나타내는 공동구조인 pharmacophore를 검색하는 것들이 이에 속한다.
실제 library를 스크리닝하는 비용이 매우 클 경우에는 가상 스크리닝을 적절히 이용하면 매우 효율적이다. 물론 이 방법은 모든 targets에 대해서 적용하지는 않지만, 최근에 많은 연구에서 가상 스크리닝방법을 이용하여 성공적인 결과를 얻은 것을 보고하고 있고, 대형제약회사들의 경우 이들을 기본적으로 수용하고 있다. 실제 이러한 연구의 성공비율은 target에 대한 정확한 정보(활성부위의 crystal구조, 정확하게 정의된 pharmacophore모델)와 docking 프로그램의 정확도, 계산시간 그리고 modeller의 생물학적 지식 등에 좌우된다. 통계방법들은 다양한 dimension을 줄이기 위해 사용되는 principal component analysis(PCA)나 factor analysis등과 최적화를 위해 상용되는 유전자알고리즘(genetic algorithm), nonliner fitting을 위한 인공신경망(neural net)과 support vector machin(SVM)이 있고, 그밖에 decision tree, partial least square(PLS) method 그리고 일반적으로 사용되는 cluster analysis나 multiple linear regression등이 있다. 많은 데이터들을 분류하여 그에 대한 정보를 시각화 하는 과정도 매우 중요한 단계이다. 실제로 이것은 프로그램으로 만들어져 상용화 된 것이 있는데, 예를 들어 Spotfire나 LeadScope등은 활성을 graphic으로 보여주고, 분석을 용이하기 위해서 데이터를 필터하거나, pharmacohore를 찾기 위해서 구조를 직접 연결하는 기능등을 포함하여 사용자가 쉽게 데이터를 분석할 수 있도록 도와준다. 이렇게 다양한 가능성을 지닌 화학정보학 구성요소들을 바탕으로 하는 몇 가지 연구분야를 소개하고자 한다.
주요 연구분야
1) 구조-활성의 정량적 상관관계(QSAR) – 구조활성을 이용한 설계
구조-활성과의 정량적 상관관계(Quantitative Structure-Activity Relation- ships, QSAR)는 화학구조에 대한 특성을 나타내는 표현자(descriptor)와 화합물의 생리 활성값과의 관계를 통계적인 방법으로 모델화하는 방법이다4). 주로 몇 가지 선도물질이 알려진 경우에 적용되며 QSAR방법에 사용되는 표현자들은 3000여가지 정도로 추정된다. 이들은 대개 분자간의 상호작용이나 구조의 입체적 장애, 구조의 구성요소, 구조의 유사성 등을 표현한다. 이러한 표현자 중에서 활성의 유무에 따라 상관성을 지니는 표현자를 선택하여 모델을 세움으로써, 생리활성을 평가하지 않은 다양한 구조에 대하여 활성을 예측해 볼 수 있다. 이러한 연구는 QSAR 데이터를 바탕으로 가상적인 수용체를 만들어서 작용부위의 물리화학적 특성을 표현하기도 하며, 구조 데이터베이스를 검색하여 pharmacophore에 대한 모델을 세울 수도 있지만, 주로 선도물질을 최적화하는 과정에 널리 이용된다. 이러한 연구는 10여년전부터 3D QSAR이라는 분야로 발전하여 실제 3차원 구조등을 이용하여 연구하는 분야로 확산되었다. 대표적인 방법으로 CoMFA5)(Comparative Molecular Field Analysis), CoMSiA(Comparative Molecular Similarity Analysis), RSA6)(Receptor Surface Analysis), MSA7)(Molecular Shape Analysis)등이 있다.

2) 데이터 분석 – 화학구조 유사도를 이용한 설계
수용체와 선도물질에 대한 정보가 없다면, 조합화학과 고효율 검색(HTS)을 통하여 먼저 선도물질을 검색하는 것이 유리하다. 검색에 사용될 화합물군(chemical library)은 정확한 설계단계를 거쳐서 구성이 되어야 하는데, 사용되는 화합물군은 구조적으로 다양하고 유사한 화합물 그룹들을 대표할 수 있어야 한다. 이러한 화합물군의 합리적인 설계는 최종적으로 유기합성과 생물학적 검증을 감소시켜 소요경비를 절감하는 효과를 얻을 수 있을 뿐만 아니라 보다 넓은 범위의 화합물들을 탐색함으로써 신약후보물질을 도출해낼 가능성도 높아지게 된다.
가상적인 화합물군으로부터 화학구조들의 유사도와 다양성을 평가하기 위해서는 화학구조를 표현자로 전환하는 과정이 먼저 필요하다. 각각의 화학구조는 수치 값의 나열이나 벡터 또는 bit형태(0 또는 1)의 줄로 표현되고, QSAR방법에서 사용되는 표현자뿐만 아니라 화학구조를 변별하기 위하여 사용되는 다양한 표현자들이 적용된다. 이들은 크게 분자의 일부분을 수치화 하는 분자인식기술(molecular fingerprint)8)과 분자전체의 특성을 수치화 하는 총괄적 표현기술(holistic description)9)로 구분되어진다.
과거에는 화합물들에 대하여 일부 표현자들의 수치차이로 구조 유사성을 평가하였지만, 수용체와의 3차원적인 상호작용을 인지하여 pharmacophore를 구상한 실질적인 유사도를 고려하였을 때, 상호작용과 입체성을 나타내는 다양한 표현자들로 구성한 공간상에서 유사도를 평가하여야 하는 것이 지배적인 의견이다. 특히 유사한 화학구조는 유사한 활성을 나타낼 것으로 예상되므로 유사성 구조검색과정도 화학정보학의 필수적인 연구분야이다. 유사성과 비유사성을 지닌 화합물을 설계하기 위하여 쉽게 계산되면서 명확하게 구분할 수 있는 새로운 표현자들의 개발이 필요하며 이에 대하여 많은 연구가 진행되고 있다.
표현자들의 공간에 의해 배열된 다양한 화학구조들로부터 대표성을 지닌 화합물들을 선택하여 화합물군을 형성하는 과정도 중요하다. 선택방법으로는 군집기반 선택법(cluster-based selection)10), 분포기반 선택법(partition-based selection)11), 비유사도기반 선택법(dissimilarity-based selection)12), 최적기반 선택법(optimization-based selection)13)등이 있고, 이밖에 유사도와 선택과정을 통시에 고려하는 연구들이 진행되고 있다. 이러한 방법으로 선택된 화합물군은 또한 유기합성이 용이하여야 하고 실제 의약품으로 사용가능한 기본적인 특성을 고려하여 선택되어야 한다. 이 과정은 구조 검색과정 뿐만 아니라 실제 가상화합물군에 적용할 데이터베이스를 구축하는 과정에서도 고려되어야 한다.

화학 DB의 구축과 검색엔진 그리고 이에 관련된 활용기술 개발은 화학정보학에서는 필수적인 분야다. 화학 DB는 목적에 따라 유사한 약효를 검색하기 위한 유사도 검색DB와 유기반응을 모은 합성 DB, 실험이나 계산으로 얻은 특성을 모은 물성 DB, 생물학적 검증 데이터를 모은 활성 DB 등으로 다양하게 구분된다. 이러한 화학DB는 먼저 구조활성에 관한 설계면에서는 높은 활성을 지닐 수 있는 대상화합물 그룹을 선정해주고, 유사도에 의한 설계면에서는 구조의 유사성을 통해 약효가 유사한 화합물을 제안하며, 그리고 구조에 바탕을 설계면에서는 보면 pharmacophore를 제안하며 이에 부합되는 신약후보물질을 검색할 수 있게 해준다. 또한 DB를 최대한으로 활용하기 위해서는 구조검색엔진의 개발이 수반되어야 하며, 일반적으로 구조검색의 경우는 정확한 구조에 대한 화학정보검색과 유사구조 검색, sub- structure검색 등으로 나누어져 개발되고 있다.
몇 가지 공개된 DB를 소개하자면, 미국의 National Cancer Institute에서 구축한 NCI DB14)는 대략 25만건의 화합물을 포함하고 있으며 2차원 3차원 화학구조와 일부 AIDS와 암에 관한 생리 활성값을 포함하고 있다. NIST(National Institute of Standard Technology)에서 구축한 Webbook15)은 열역학적 데이터와 UV/VIS, IR, Mass와 같은 분석실험결과를 DB화하였으며, Cambridge Soft에서 시약 판매회사들의 카탈로그를 모아 만든 ACX16)는 20만건의 화합물과 물리화학적 물성들을 포함하고 있다.


국내에서 구축된 화합물 DB시스템은 본 연구소(분자설계연구소)와 KISTI(한국과학기술정보연구원)이 함께 개발한 “신약설계를 위한 화합물DB 시스템”이 현재로서는 유일하다. 이 화합물 DB의 구축량은 판매되는 시약 카탈로그, 의약화학 관련 저널 및 공개DB로부터 수집한 200만 건의 2차원 화학구조와 분자 역학적 방법으로 안정한 구조를 계산한 150만 건의 3차원 입체화학구조를 포함하고 있어 규모면에서도 세계적이다. 또한 화학구조에 대한 실험데이터들과 약효값 그리고 자체적으로 개발한 물성예측 프로그램의 결과를 수록하고 있으며, 각각의 화학구조와 관련된 참고문헌과 독성, 분광학 데이터 등은 국외DB를 직접 연결하여 결과들을 볼 수 있도록 구현된 시스템이다.


그밖에 X-ray crystal 구조를 모아둔 Cambridge crystallographic Data17), 상용으로 요금을 부과하는 Beilstein Abstracts18),나 Advanced Chemistry Development사의 property DB19), 그리고 MDL사20)의 ACD, MDDR, CMC, CHC, CSM 등등의 DB, ChemWeb21)의 CCD, POC, Daylight사22)의 MedChem, Maybridge, CCR, WDI등이 있다.
3) 물리화학적 물성 예측 및 약의 유사성 분석
신약개발과정을 보면 대체적으로 개발단계의 화합물중 실제로 10%가량이 시장에 나오게 되며, 실패한 화합물들중 60%가량은 약의 흡수,분포,대사,배설,독성(ADME/Tox)성질이 문제가 된것 들이다. 그러므로 개발 초기단계에서 이들의 물성을 예측하여 초기에 실패할 가능성이 있는 화합물들을 제거한다면, 상당한 비용과 시간을 절감할 수 있게 된다. 다양한 방법들을 이용하여 이러한 각각의 물성(ADME/Tox)를 해결하고자 하였다. 특히 생체내의 작용과 관련이 있는 것으로 알려진 logP(물-옥탄올 분배계수), pKa., 물용해도등을 예측하는 다양한 시도들이 이루어졌으며, 실제 경구투여 약들의 흡수가 결정짓는 장투과도와 뇌질환 약들이 통과해야 하는 blood-brain barrier의 투과도, 혈중 단백질에서의 흡착정도 및 주요 대사를 관장하는 cytochrome P450 family들에 대한 실제 대사 예측, 뇨배설도 예측, 유전독성을 나타내는 Ames test 결과 예측과 발암성을 나타내는 다양한 종의 TD50값 예측 등으로 적용되고 있다. 이러한 연구들을 통해서 실제 앞에서 설명한 library설계단계에서 화합물군의 다양성 뿐만아니라 약으로서의 성질을 만족시킬 수 있는 약유사성까지도 고려한 할 수 있고, 뒤에 설명한 가상 스크리닝의 바로 전단계에서 약의 성질을 만족시키지 못하는 화합물들을 걸러내므로서 가상 스크리닝단계의 속도를 크게 개선시킬 수도 있다. 더 자세한 내용은 참고문헌23)에 자세히 수록되어 있다.
4) 가상 스크리닝
HTS방법과 더불어서 가상스크리닝 방법은 현재 선도물질을 찾는데 널리 사용되고 있다. 일반적으로 target구조가 알려져 있지 않고 ligand만 알려진 경우에는 이들 ligand들이 주는 구조적 정보들을 이용하여 similarity24) 또는 substructure방법으로 접근하거나, SAR형태로 통계적인 방법을 통해 접근하는 방법 그리고 ligand들로부터 약효를 나타내는 pharmacophore25)를 찾아내서 이를 통해 검색하거나 이들의 3D shape을 matching하여 분석하는 방법26)으로 접근하기도 한다. 그러나 target 단백질이나 효소의 구조가 알려진 경우에는 molecular docking과 같이 직접 구조와의 상호작용 계산하여 결과를 비교한다. 현재 일반적으로 사용되는 docking tool들은 다음 표에서 볼 수 있다.
표2. 가상스크리닝에 사용되는 일반적인 docking 프로그램 | |||
Method | Ligand flexibility sampling | Scoring function | Suitability for large- scale virtual screening |
Dock 27) | Incremental build | Force field or contact score | High |
FlexX 28) | Incremental build | Empirical score | High |
Slid 29) | Conformational ensembles | Empirical score | High |
Fred 30) | Conformational ensembles | Gaussian score orempirical scores | High |
Gold 31) | Genetic algorithm | Empirical score | Low |
Glide 32) | Exhaustive search | Empirical score | Low |
AutoDock33) | Genetic algorithm | Force field | Low |
LigandFit34) | Monte Carlo | Empirical score | Low |
ICM35) | Pseudo-Brownian sampling and local minimization | Mixed force field andempirical score | Low |
QXP 36) | Monte Carlo | Force field | Low |
비록 이러한 다양한 가상스크리닝방법이 신약개발과정에서 성공적으로 사용되고 있지만, 아직도 false-postivie(가상스크리닝으로 hit는 되었지만 실제로는 약효가 없는 화합물)에 대한 비율은 상당히 높은 편이다. 하지만 실제로 테스트 또는 합성을 하여야 할 화합물의 수를 수십만개에서 단지 수백개로 줄여줄 수 있으므로, 이러한 단점을 감수하면서도 수행할 필요성은 필요성은 충분히 있다. 현재의 연구는 가상 스크리닝에 사용되는 scoring function의 질을 개선하고 다양한 flexibility를 고려하여 실제 hit될 비율을 높이는 것과 가상 스크리닝을 수행한 뒤에 이루어져야 할 다양한 분석방법에 대하여 진행되고 있다.
5) 화학정보학에 적합한 소프트웨어 개발
화학정보학을 위해 개발되는 많은 프로그램들은 그 프로그램을 잘 활용하기 하기 위해서는 화학정보학에 관련된 전문가적 지식을 필요로 한 것이 현실이었다. 그러나 최근에서는 의약화학을 전공한 사람들에게 쉽게 응용될 수 있는 프로그램들의 개발이 진행되어 있다. 인터넷이 널리 보급되어 Web을 통해서 텍스트와 이미지형태의 정보를 모두 취급할 수 있으므로 Web은 화학정보학 개발의 중요한 환경으로 자리 매김을 하고 있다. 아직 기술적으로 원하는 정보를 표현하기에는 어려운 점이 있으나, XML(extensible mark-up language)를 응용한 CML(chemical mark-up language)이 등장하여 다양한 화학정보들을 표준화하려는 노력이 널리 확산되고 있는 실정이다. 또한 개발환경도 다양한 시스템환경에서 구현되는 네트워크상에서의 통합시스템으로 발전하고 있으며 visualization, simulation, application을 네트워크 내에서 동시에 수행하도록 진행되고 있다. 이러한 대표적인 예로 Chemical Computing Group사37)의 MOE(Molecular Operating Environment)과 Accelrys사에서 제공하는 Discovery Studio38) 프로그램등을 들 수가 있겠다. 그밖에도 Afferent system사, Tripos사, CambridgeSoft사 등에서 화학정보학에 관련된 많은 프로그램들을 개발 및 판매를 하고 있다39).

결론
지금까지 화학정보학의 필요성과 주요개발분야에 대하여 간단히 살펴보았다. 대랑 물량의 화학데이터들로부터 신약개발을 뒷받침할 지식과 정보로 전환시키는 화학정보학은 점차 급속도로 발전할 것으로 믿어 의심치 않는다. 국내에서도 점차 이 분야에 대한 중요성을 인식하고, 일부 기관(분자설계연구소, KIST 생체과학연구부, LG생명과학연구소, IDR Tech.)에서는 화학정보학에 대한 연구에 대한 투자를 높이고 있다. 하지만, 국외 대형제약회사에서 신약개발과정에서 필수적인 연구분야로 인식하여 관련부서를 만들어 전체과정을 통합, 연결하여 운영하는 반면에, 국내에서는 아직 그 규모까지 진행하지는 못하고 있다.
국외에서는 화학정보학의 범위가 신약선도물질을 검색하기 위하여 화학구조의 다양한 특성을 표현하는 새로운 표현자(descriptor)개발과 수용체의 구조에 기반을 둔 다양한 신약설계 정보기술, 조합화학(combinatolrial chemistry)을 위한 화합물군 설계, 구조-약효 상관관계를 이용한 신물질 탐색과정, 화학정보처리를 위한 통계적인 방법과 이를 이용한 실제적용, 화학정보를 분류-관리-분석, 그리고 시각적으로 표현하는 기술 및 이에 따른 하드웨어의 개발 등으로 점차 확산되고 있는 추세에 있으며, 다양한 -omics관련 분야와의 연계를 통해 실제 생명연장을 위한 다양한 분야간의 체계적인 종합학문으로 발전시키고 있다. 이러한 연구는 더 나아가 신소재 산업, 식품공학, 대기화학, 고분자 공학 등의 연구에 직접적으로 적용이 가능할 것으로 예상한다.
지속적인 개발에도 불구하고 공동적인 문제점은 그동안 각자 연구배경이 다른 과학자들(화학, 전산학, 생물학 등등)이 서로 다른 용어와 컴퓨터 장비를 이용하여 독자적으로 진행된 부분이 많고, 탐색에 사용되는 화학데이터들의 표준이 명확하게 결정되어 있지 않기 때문에 연구교류를 통하여 발전을 방해하는 것이다. 이러한 면에서 우선적으로 이러한 문제를 해결해 나감으로써 학제간 연구의 기틀을 마련하는 것이 시급하다고 하겠다.
참고문헌
- a) Brown, F. K. “Chemoinformatics: What is it and how does it impact drug discovery” Annu. Rep. Med. Chem. 1998, 33, pp 375-384. b) Hann, M. and Green, R. ” Chemoinformatics – a new name for an old problem?” Curr. Opi. in Chem. Bio. 1999, 3, pp379-383.
- Martin, Y. C. “Challenges and prospects for computational aids to molecular diversity” Perspect. Drug Discov. Des. 1997, 7/8, pp159-172.
- Hrib, N.J.; Peet, N. P. “Chemoinformatics: are we exploiting this new science?” Drug Dicov. Today. 2000, 5, pp 483-485.
- Katiritzky, A. R. ; Lovanov, V. S.; Karelson, M. “QSPR: The Correlation and Quantitative Prediction of Chemical and Physical Properties from Structure” Chem. Soc. Rev. 1995, 24, pp 279-287.
- Cramer, R. D., III; Patterson, D. E.; Bunce, J. D. “Comparative molecular field analysis (CoMFA). 1. Effect of shape on binding of steroids to carrier proteins J. Am. Chem. Soc. 1988, 110, pp 5959-5967.
- Hahn, M., “Receptor surface models: 1. Definition and construction”, J. Med. Chem., 1995, 38, pp 2080-2090.
- Tokarski, J. S. and Hopfinger, A. J. “Three-Dimensional Molecular Shape Analysis- Quantitative Structure-Activity Relationship of a Series of Cholecystokinin-A Receptor Anatagonists”, J. Med. Chem. 1994, 37, pp 3639-3654.
- Bayado, D. M.; Hamersma, H. van Geerestein, V. J. “Molecular diversity and representativity in chemical database”, J. Chem. Inform. Comput. Sci. 1999, 39, pp 1-10.
- Lewis, R. A.; Mason, J. S.; McLay, I. M. “Similarity measures for rational set selection and analysis of combinational libraries: the Diverse Property-Derived(DPD) approach”, J. Chem. Inform. Comput. Sci. 1997, 37, pp 599.
- Willett, P.; Barnard, J. M.; Downs, G. M. “Chemical similarity searching” J. Chem. Inform. Comput. Sci. 1998, 38, pp 983-996.
- Pearlman, R. S.; Smith, K. M. “Novel software tools for chemical diversity”, Perspect. Drug Discov. Des. 1998, 9/10/11, pp 339-359.
- Lajiness, M. S. “Dissimilarity-based compound selection techniques”, Perspect. Drug Discov. Des. 1997, 7/8, pp 65-84.
- Mount, J.; Ruppert, J.; Welch, W.; Jain, A. N. “IcePick: a flexible surface based system for molecular diversity”, J. Med. Chem. 1999, 42, pp 60-66.
- 이성광, 노경태, “in silico ADME and Pharmacokinetics” 생물산업회지, 2002, 15(5), 16-19.
- Mesters, J.; Knegtel, R.M.A. “Similarity versus docking in 3D virtual screening” Perspect. Drug Des. Discovery 2000, 20, pp191-207.
- Mason, J.S; Good, A.C. and Martin, E.J. “3-D pharmacophores in drug disvovery” Curr. Pharm. Des. 2001, 7, 567-597.
- Srinvasan, J.; Castellino, A; Bradley, E.K.; Eksterowicz, J.E.; Grootenhuis, P.D.; Putta, S. and Stanton R.V. “Evaluation of novel shape-based computational filter for lead evolution: application to thrombin inhibitors” J. Med. Chem. 2002, 45, 2494-2500.
- Ewing, T.J.A.; Makino, S.; Skillman, G. and Kuntz, I.D. “DOCK 4.0: Search strategies for automated molecular docking of flexible molecule databases” J.Comput.-Aided Mol. Design, 2001, 15, pp411-428. Dockprogram
- Rarey, M.; Kramer, B.; Lengauer, T. and Klebe, G. “A fast flexible docking method using an incremental construction algorithm” J.Mol.Biol. 1996, 261, pp470-489. FlexX program
- Schneck, V and Kuhn, LA. “Virtual screening with solvation and ligand-induced complementarity” Perspect. Drug Des. Discov. 2000, 20, pp171-190.
- OpenEye Scienctific Software, Fred program
- Jones, G.; Willentt, P.; Glen, R.C.; Leach A.R. and Taylor, R. “Development and validation of a genetic algorithm for flexible docking” J. Mol. Biol., 1995, 245, pp43-53. Gold program
- Schrodinger Inc. Glide program
- Morris. G.M.; Goodsell, D.S.; Halliday, R.S.; Huey, R.; Hart, W.E.; Belew, R.K. and Olson, A.J. “Automated docking using a Lamarckian genetic alrorithm and an empirical binding free energy function” J. Comput. Chem. 1998, 19, pp1639-1662.Autodockprogram
- Accelrys Inc. Ligandfit program
- Abagyan, R.A. and Totrov, M.M. “Biased probability Monte Carlo conformational searches and electrostatic calculations for peptides and proteins” J.Comput.Chem. 1994, 15, pp488-506. ICM program
- McMartin, C. and Bohacek, R.S. “QXP: powerful, rapid computer algorihtm for structure-based drug design” J.Comput.-Aided Mol. Des. 1997, 11, pp333-344.
- Accelrys Inc. Discovery Studio program