-SDS-PAGE를 이용한 단백질 분석-[1] Introduction{1} SDS-역할 : 다양한 전하의 단백질들을 음전하로 균일하게 코팅시키고 선형의 polypeptide chain형태로 변성시켜 전기영동시 모양이나 전하의 영향없이 크기(분자량)로만 분리될 수 있도록 만든다. (전기영동시 분자의 속도 ‘ v=Eqf ’에서 마찰계수 f중 분자량만 변수가 됨)-원리 : SDS는 음전하를 갖는 강한 계면활성제로서 단백질의 소수성 부분에 달라붙는다.2개의 아미노산 당 하나의 SDS분자가 비특이적으로 결합해 아미노산 R기들의 전하를 모두 상쇄시키고 균일하게 음전하로 코팅시킨다.또한 단백질의 다양한 결합(수소결합, 소수성결합. .etc)들을 파괴해 3차원적 단백질 구조를 선형의 1차구조로 변성시킬 수 있다.{2} Gel에 들어가는 시료의 역할-Acrylamide-Bisphosphate: Acrylamide와 Bisacrylamide가 crosslink결합으로 그물구조를 형성해 단백들이 크기(분자량)별로 움직일 수 있게 됨.-Tris-Hcl : 완충제(buffer)역할, Ph를 맞춰줌,-SDS : 만약 sample buffer와 running buffer 속 SDS에 의해서도 변성되지 않은 단백질이 있다면 이를 변성시키기 위함. 또한 running buffer와 sample buffer와의 환경을 비슷하게 만들어주기 위함.-APS(ammonium persulfate) : SO4- 자유라디칼을 생성하여Acrlamide와 Bisacrylamide의 중합을 형성시킴.-TEMED : APS에서 생기는 SO4-자유라디칼 형성을 촉매함-DW : total 용량 맞주기 위함{3} Resolving gel 과 Stacking gel의 차이-Stacking gel의 pH는 6.8로 PI값이 6.2인 Glycine의 net 전하가 0에 가까워지게 된다.따라서 전기장 속에서 전하에 따라 ‘Cl->단백질샘플>Glycine’ 순으로 이동속도 차이가 발생하게 되고 단백질이 Resolving gel에 진입하기 전에 일자로 정렬되도록 해준다.-Resolving gel의 pH는 8.8로 이곳에서는 샘플속 단백질, Cl-, Glycine 이 모두 음전하를 갖기 때문에 전하가 아닌 크기(분자량)순으로 ‘Cl->Glycine>단백질샘플’ 이동속도 차이가 발생한다. 따라서 크기에 따라 단백질을 분리해 낼 수 있다.{4} Coomassie blue-단백질의 아미노기 및 카르복실기에 비특이적으로 결합하여 단백질을 염색시킨다. .감도가 좋아 0.5nl~40nl 정도의 적은양의 단백질도 감지 가능하다.단백질과 결합 시 595nm의 흡광을 갖는 성질을 이용해 단백질을 정량할 수도 있다:6개의 페닐기와 2개의 설폰산을 통해 단백질과 결합[2] Materials-sample(1~6), Acrylamide, Bisacrylamide, DW, Tris-HCl, TEMED, APS, BPB, 2-ME, coomassie blue,Isopropanol, Glacial acetic acid, Methanol, tube, pipet, vortexer, centrifuge, locker, kimtech, gel tank, gel cassette, comb, 3M paper[3] Method{polyacrylamide gel 만들기}(1) kimtech에 70% ethanol을 뿌려 유리판을 닦는다.(2) Gel cassette에 유리판을 끼워 고정시키고 Gel cassette stand에 끼운뒤, 유리판 사이에 DW를 부어 물이 새지 않는지 확인한다.(3) Tube에 DW 2.42ml, 40% Acrylamide-bisphosphate 0.5ml, 1.5M Tris-HCl pH 8.8 4ml, 10% SDS 160nl, 10% APS 160nl을 순서대로 넣고 vortexing 한 뒤, 마지막으로 TEMED 4nl를 넣고 vortexing하여 Resolving Gel을 만든다.(4) Gel이 굳기전에 유리판 사이에 넣고 isopropanol 을 넣은 후 30분정도 굳힌다.(5) Tube에 DW 2.42ml, 40% Acrylamide-bisphosphate 0.5ml, 0.5M Tris-HCl pH 6.8 1ml, 10% SDS 40nl, 10% APS 40nl을 순서대로 넣고 vortexing 한 뒤, 마지막으로 TEMED 2nl를 넣고 vortexing하여 Stacking Gel을 만든다.(6) (3)에서 넣은 isopropanol을 제거하고 DW로 유리판을 헹군 뒤 3M paper로 물기를 없앤다.(7) 굳은 Resolving Gel 위에 Stacking Gel을 올린 뒤 기포가 생기지 않게 comb를 끼운 후 30분정도 굳힌다.(8) 굳은 겔은 DW로 세척 후 마르지 않도록 (랩-DW에 젖은 휴지-gel) 순서로 랩을 감싸 포장 후 날짜, gel %등 필요한 정보를 기입한 뒤 냉장보관한다. (일주일 정도 보관가능){SDS-PAGE & Coomassie blue Staining}(1) SDS, 2-ME, BPB를 넣은 5X Sample buffer 6ml에 정제한 단백질 sample 24ml를 넣은 6개의 ep-tube 만든 후, 95’c에서 5분간 두어 단백질이 충분히 변성되도록 한다.(2) Gel tank setting후, 안쪽과 바깥쪽에 Tris 25mM, Glycine 192mM, SDS 0.1% 조성의 1X SDS running buffer를 부어준다.(3) marker와 6개의 sample을 well에 천천히 loading한다.(4) 전극을 연결하고 기포가 올라오는지 확인한 뒤, 80v로 20분간 stacking gel 전기영동, 100v로 60분간 resolving gel 전기영동 시킨다.(5) sample의 BPB가 거의 다 내려온걸 확인한 후 전기영동을 멈춘다.(6) 유리판을 분리하여 gel을 꺼낸 후, 필요없는 stacking gel, BPB 아랫부분 gel, 양옆의 sample을 걸지않은 gel을 제거한다.(7) gel을 적당한 크기의 용기에 담아 Glacial Acetic Acid(10%), Methanol (40%), coomasie Blue R250(0.1%) 조성의 staining solution을 잠길만큼 넣고 locker에 올려둔 뒤 상온에서 1시간 staining을 진행한다.(8) staining solution을 폐액 통에 버리고 DW로 gel을 헹군 뒤 Glacial Acetic Acid(10%), Methanol (40%) 조성의 destaining solution으로 갈아준 후, 다시 locker에 올려놓고 상온에서 밤새 destaining을 진행한다.(9) DW, destaining solution을 1:1 비율로 1~2회 정도 더 destaining하여 band와 background가 뚜렷히 구분되도록 한다.(10) Destaining이 끝나면 gel의 사진을 찍거나 스캔을 하거나, 셀로판지 사이에서 건조시켜 보관한다.[4] ResultMarker의 70 orange 밴드와 26 orange 밴드의 대략적인 위치를 1~6 sample과 비교하여 Human Naa30 단백질의 사이즈인 40kDa 의 위치를 대략적으로 파악할 수 있다.정제 전의 샘플 PM에서는 Naa30뿐만 아니라 E.coli의 각종 단백질이 모두 존재하지만 imidazole wash buffer를 흘려준 정제된 1~6 sample에는 column속의 (agarose beads+Ni2+)와 결합했던 단백질들이 걸러져 나온 것을 확인할 수 있다. 또한 1번 sample을 제외한 초반 sample에서 (agarose beads+Ni2+)에 결합했던 단백질들이 다량으로 나오고 아직 beads에서 떨어지지 않은 단백질들이 후반 sample에서 나오기 때문에 6번으로 갈수록 Naa30 단백질의 농도가 줄어드는 것을 확인할 수 있다.[5] Discussion{1} 정제 전보다 정제 후의 순도가 더 높아졌다. 특히 5,6번 sample에서는 약 40kDa 밴드 외의 다른 밴드는 거의 나타나지 않을만큼 순도가 가장 높았다. 여러 번 wash buffer를 흘려주어도 잘 떨어지지 않는 가장 강하게 (agarose beads+Ni2+)와 결합되어 있던 단백질만이 떨어져 나왔기 때문으로 추정된다.{2} 정제된 sample속에서 Naa30 밴드 외에도 다양한 사이즈의 밴드들이 발견되었는데 이는 sample속에 Naa30 His-Tag 외에도 column 속 (agarose beads+Ni2+)에 결합할 수 있는 단백질이 있었음으로 추정된다.{3} Flow through에 Naa30 band가 존재한다면 그 이유는?- column속 (agarose beads+Ni2+)양에 비해 sample속 Naa30의 단백질양이 월등히 많아 (agarose beads+Ni2+)에 붙지 못한 Naa30이 그대로 용출되었을 수 있다.-sample내에 (agarose beads+Ni2+)과 붙는 경쟁적인 단백질이 너무 많아 상대적으로 Naa30 단백질이 붙지 못해 용출되었을 수 있다.-돌연변이로 인해 His-Tag직전에 stop-codon이 생성되어 His-Tag가 번역되지 않았다면 Naa30은 column속 (agarose beads+Ni2+)가 결합하지 못하고 용출될것이고 40kDa과 비슷한 분자량의 Naa30 단백질 밴드가 FT에서 보일 수 있다.[6] References-이화여대 2021-1학기 생명과학실험1 ppt-위키백과 ’ coomassie blue’https://ko.wikipedia.org/wiki/%EC%BF%A0%EB%A7%88%EC%8B%9C_%EB%B8%8C%EB%A6%B4%EB%A6%AC%EC%96%B8%ED%8A%B8_%EB%B8%94%EB%A3%A8- 박선우 『 BIOLOGY 이론편 』, 좋은친구들(2020)
REPORT[SOD1 gene 분석과 3D Modeling][1] Introduction{1} NCBI를 통해 사용할 수 있는 데이터베이스:NCBI(National Center for Biotechnology Information)에서는 여기저기 산재되어 있는 다양한 database를 한 곳에서 모아 볼 수 있는데 이번 레포트에서는 NCBI에 존재하는 datebase 중 3가지를 간략히 소개하겠다.-Pubmed :생명과학 관련 다양한 논문 data 제공-SRA: Short Read Archive의 약자로 1,000개 미만의 짧은 가닥의 DNA sequencing 에 대한 data를 제공-dbVar : genomic variant에 대한 정보를 제공.{2} Gene MutationDNA복제의 실수, 이성질화 반응, 탈퓨린 반응, 화학적 돌연변이 유발원 등의 다양한 이유로 유전자의 돌연변이가 일어날 수 있으며 돌연변이는 크게 아래 세종류로 나눌 수 있다.(1) 염기 돌연변이( Coding region mutation)-치환 돌연변이 : 원래 염기가 다른 염기로 바뀌는 현상으로 purine끼리, pyrimidine끼리 바뀌는 경우를 Transition, purine이 pyrimidine으로 혹은 그 반대로 바뀌는 경우를 Transversion이라고 한다. 다음과 같은 4가지 경우로 나누어진다.· Silent mutation : 바뀐 염기를 번역했을 때 똑같은 아미노산이 되는 경우· Neutral mutation : 바뀐 염기를 번역했을 때 아미노산은 달라지지만 단백질 기능에는 큰 영향이 없는경우, 보통 같은 극성의 아미노산으로 바뀔 때 나타난다.· Missense mutation : 바뀐 염기를 번역했을 때, 아미노산이 달라져서 단백질 기능에 문제가 생긴 경우· Nonsense mutation : 바뀐 염기가 새로운 종결코돈을 만들어 단백질 합성이 조기에 종결되는 경우. 정상보다 짧은 폴리펩티드가 생성됨.-첨가/결실 돌연변이 : 암호와 부위 중간에 염기가 첨가 또는 결실되어 리보솜의 번역틀이 바뀌는 돌연변이. 틀이동 돌연변이라 염기가 바뀐 부분 이후에 번역되는 아미노산들은 정상 단백질의 아미노산들과 전부 달라진다.(2) Non-Coding region 돌연변이 : 프로모터나 전사인자 결합서열 등의 조절부위에 염기 돌연변이가 일어나 유전자의 전사 개시가 저해되는 돌연변이이다.(3) 염색체 구조이상 돌연변이-결실(Deletion) : 염색체의 일부 절편이 소실되는 현상-중복(Duplication) : 염색체의 일부 절편이 추가, 반복되는 현상-역위(Inversion) : 염색체의 유전정보 배열이 뒤집어지는 현상-전좌(Translocation) : 한 염색체의 일부가 떨어져 나와 상동이 아닌 다른 염색체에 연결되는 현상.(4) 염색체 수 이상 돌연변이:염색체 비분리에 의해 생기는 돌연변이-이수성 돌연변이 : 특정 염색체가 추가되거나 결손되어 염색체의 수가 2n±x 가 됨-배수성 돌연변이 : 완전한 반수체의 염색체 세트를 더 가져 3n, 4n 등의 형태가 됨.{3} SOD1 geneSOD1 gene은 21번 염색체 q arm 22. 11 에 존재하는 유전자로 5개의 엑손으로 구성되어 있으며 전사와 변역을 거쳐 SOD1 단백질을 생성한다. SOD1 단백질은 Homodimer 형태로 Copper와 Zinc ion과 결합하여 물질대사 중 자연스럽게 발생한 free superoxide radicals을 제거하여 라디칼이 신체에 해로운 영향을 끼치지 못하도록 억제한다. SOD1 gene에 돌연변이가 일어나면 familial amyotrophic lateral sclerosis(FALS. 가족성근위축측삭경화증)라는 질병이 발병하는데 흔히 루게릭병으로도 잘 알려져 있는 병이다. 의지대로 조절될 수 있는 수의근을 제어하는 신경세포가 소멸되어 점차 근육을 사용하기 어려워지는 질병이다. 이 질병은 다양한 원인으로 발병할 수 있는데 특히 SOD1 gene 돌연변이로 발병한 경우에는 상염색체 우성으로 유전될 수 있다.[2] Method1) SOD1 gene의 정보 및 Sequence를 알아보기 위하여 NCBI에서 gene의 Main select 부위를 알아내고, 이를 바탕으로 엑손의 개수, 유전자 위치 등의 정보를 파악한다.2) Sequence Aliggnment를 알아보기 위해서 NCBI에서 Main gene의 protein 서열을 파악하고, protein BLAST를 이용해 Taxonomy탭에서 다른 종들의 Acession ID를 알아낸다.얻어낸 ID들을 다시 NCBI에 검색하면 각 종들의 SOD1 gene 단백질 서열을 알아낼 수 있다. 이를 Culture Omega프로그램을 이용해 Human SOD1와 각 종의 SOD1 protein서열을 비교하고, 유연관계 그래프를 그려낼 수 있다.3) Protein modeling을 위해 gene card 에서 SOD1의 UniprotKB/Swiss-prot ID를 따라가면 관련 질병, 돌연변이 정보를 알아낼 수 있다. 특정 돌연변이를 하나 선택하여 그에 맞게 아미노산을 변경한 뒤, Swiss model에서 3D modeling을 진행하여 정상과 돌연변이 단백질 모양을 비교한다.[3] Result{1} NCBISOD1은 21번 염색체 q arm 22. 11 에 존재하는 유전자로 5개의 엑손으로 구성되어 있다. 위는 첫번째 엑손을 표시한 자료이다. 이 자료에 따르면 첫번째 엑손은 A 26개, T 30개, G 53개, C 40개로 이루어져 있음을 알 수 있다.UCSC Genome Browser를 이용하여 5개의 엑손으로 이루어진 모식도를 확인할 수 있었다.위 자료에서 SOD1 gene이 liver에서 가장 발현이 많이 되는 모습을 볼 수 있다.{2} Sequence Alignment이름 뒤의 숫자가 작을수록 사람의 SOD1 단백질과 서열이 비슷하다는 것을 의미하고 위의 자료를 통해 사람의 SOD1 protein 서열은 Pan_paniscus와 가장 가깝다는 것을 알 수 있다.{3} Protein 3D Modeling위 자료를 참고하여 5번 위치 Alanin이 Valine으로 바뀐 돌연변이를 선택하여 3d 모델링을 진행하였다. 그 결과는 다음과 같다.왼쪽은 SOD1_normal, 오른쪽은 SOD1_A5V mutation 모형을 나타낸다.돌연변이가 일어났음에도 얼핏 보기에는 상당히 유사한 모습으로 보인다.5번 아미노산의 변화로 정상 모델에서는 napthalene-catechol linked compound 가 보이는 반면, 돌연변이 모델에서는 보이지 않는다.위 자료는 아미노산 5번부위를 확대한 모습이다.약간의 구조적 차이가 보인다.[4] Discussion-이번 실험에서는 NCBI를 이용하여 SOD1 gene에 관한 정보를 알아내고 BLAST와 MAS를 통해 표적 유전자가 다른 종에서는 어떻게 발현되는지, 진화적으로 어떤 종과 더 가까운지 파악하였다. 또한 유전자의 특정 부분이 돌연변이가 일어나면 단백질 구조에 어떻 변화가 일어나는지 직접 3D Modeling을 통해 시각화하여 보는 방법을 배웠다.-NCBI에서 liver에서 SOD1 gene이 가장 많이 발현되는 양상을 볼 수 있었는데 liver가 신체내에서 카탈라아제를 이용한 활성산소 제거, 약물 해독 등 가장 많은 해독작용을 하는 장기인 만큼 liver에서 SOD1 발현이 가장 높은 것으로 추정된다.-3D 모형에서 정상 모형에는 napthalene-catechol linked compound 가 결합되어 있으나 돌연변이 모델에서는 볼 수 없다. 이는 5번 위치 아미노산의 변이가 napthalene-catechol linked compound 결합에 영향을 미친다는 것을 의미한다.[5] Reference- 박선우. BIOLOGY 2nd, 좋은 친구들, 377-389- Milani P, Gagliardi S, Cova E, Cereda C, ‘SOD1 Transcriptional and Posttranscriptional Regulation and Its Potential Implications in ALS’, Neurology Research International, 2011-Henry Gee, ‘Inside Lou Gehrig’s disease, Nature, 1999-Brian Owens, ‘Amyotrophic lateral sclerosis’, Nature 550, 2017
REPORT[UCSC genome browser를 활용한 Genome 분석][1] Introduction{1} Next Generation Sequencing (NGS)-정의 : ‘차세대 염기서열 분석법(NGS)’ 는 genome sequencing 방법 중 하나로, 유전체를 무수히 많은 조각으로 나눈 뒤, 각각의 염기서열을 조합하여 유전체를 해독하는 분석 방법이다. 이렇게 얻은 데이터를 bioinformatics기법을 이용하여 조합함으로써 방대한 유전체 정보를 빠르게 해독하고자 하는 목적을 가지고 있다 .기존의 Sanger sequencing에 비해 훨씬 더 대용량의 분석이 가능하고 속도와 비용면에서 효율성이 뛰어난 점이 특징이다.-기본원리 : chromatin을 작은 segments로 자른 뒤, 동시 증폭 및 염기서열반응을 위한 adaptor를 붙인다. 이를 high density microarray의 표면에 고정시켜 droplet 안에서 증폭시킨 뒤 염기서열을 분석한다.{2} Human genome project- 약 30억 개의 염기 쌍으로 구성되어 있는 인간 전체 genome을 분석하여 네 종류의 염기(A,T,G,C)가 어떤 배열로 이루어져 있는가를 밝혀내기 위한 목적으로 1990년부터 2003년 까지 총 13년동안 진행된 장기 프로젝트이다. 이 프로젝트를 통해 발견해낸 인간의 모든 DNA 서열을 통해 유전자 기능분석, 상호 연관성 파악, 환자맞춤 치료, 유전자의 수정과 강화 등 다양한 생물 공학적 응용이 가능해지며 이를 통해 인류의 발전에 획기전인 역할을 할 것으로 전망된다.{3} UCSC genome browser- 배경 : 다양한 genome sequencing 방법을 통해 발견된 유전체의 방대한 염기서열 정보가 증가하면서(특히 Human genome project) 이를 효과적으로 분석하고 활용할 수 있는 도구의 필요성이 대두되었고 이에 Ensemble, UCSC, DECIPHER, Varsome 등의 genome browser들이 탄생하였다.- 이용 : UCSC genome browser에는 다양한 버전의 genome이 존재하는데 GRCh38/hg38가 가장 대표적으로 쓰인다. 유전자 이름이나 Omim number, 특정 염색체의 bp 위치 등을 검색하여 이 부분이 유전체의 몇번째 엑손인지, 어떤 서열, amino acid 로 구성되어있는지 등의 정보를 확인 할 수 있고 zoom in/out, gene highlighting 을 통해 유전자를 파악하고 강조하기도 하며, 다양한 Table 속 track 들을 이용하여 원하는 정보를 빠르게 시각화하여 얻어 낼 수 있다. 또한 Configuration을 통해 보여지는 genome 이미지를 다양하게 조절하고 원하는 옵션만을 표시하여 가독성을 높일 수 있다.{4} OMIM-gene과 그 gene으로 인해 발생하는 phenotype을 매칭시켜놓은 database로 쉽게 검색가능하도록 온라인화 된 정보이다. 이를 통해 유전자의 변이 정보를 얻을 수 있다. 6자리의 MIM number를 통해 나타내는데 각 자리마다 나타내는 의미가 다르고, 각 자리에 들어가는 숫자에 따라 분류체계가 정해진다. 예를들어 첫번째 숫자가 1,2,6 일 경우에는 autosomal entry, 3으로 시작하면 X-linked entry, 4로 시작하면 Y-linked entry, 5로 시작하면 mitochondrial entry이다. Hyperlink "https://omim.org/static/omim/data/mim2gene.txt" https://omim.org/static/omim/data/mim2gene.txt 에서 OMIM이 담고 있는 유전자와 phenotype의 개수를 파악할 수 있다.{5} ENCODE, GTEx-ENCODE project : 인간 genome의 암호화된 염기서열의 역할을 밝혀내어 DNA 백과사전을 구축하고자 하는 프로젝트로, 현재 약 80%에 해당하는 영역의 기능을 밝혀내었다. 인간의 유전자와 genome의 조절에 대한 새로운 비전을 제시하고 인간 유전체 상에 있는 모든 조절인자들을 발견해 그 기능을 설명하는 정보자원이 되는 것을 목표로 한다,-GTEx project : 유전자의 발현이 인체의 각 조직에서 어떻게 달라지는지 확인하는 목적으로 실행된 프로젝트이다. 건강한 사람의 시신에서 심장, 폐, 뇌, 피부, 혈관 등 44개의 조직을 얻어내 각 조직별로 유전자를 분석하여 각 조직별로 어떤 유전자가 발현되었는지, 발현되지 않았는지 조사하여 유전자 변이가 유전자 발현에 영향을 준다는 사실과 사망 후 조직 속 유전자가 계속 변화해 조직에 따라 유전자 발현에 차이를 보인다는 사실 등을 확인하였다. GTEx project의 데이터를 활용해 조직들의 텔로미어 길이차이, 성별에 따른 유전자 발현의 차이 등의 후속연구가 계속 진행되고 있다.{6} UCSC genome browser Track:UCSC genome browser에는 상당히 많은 Track이 존재하기 때문에 이번 보고서에는 몇가지 Track만 소개하도록 하겠다..-encode regulatrion track: Tracscription track : 관찰하고자 하는 유전자가 어떤 cell line에서 많이 발현되는지 알려주는 track.: TF cluster track : 관찰하고자 하는 유전자에 부착되는 전사인자의 부착위치를 알려주는 track.-GTEx track : 각 조직별 유전자 발현을 볼 때 사용하는 track으로 표적 유전자가 어떤 조직에서 얼만큼 발현되는지 비교하여 보여준다. GTEx Transcript track을 통해 한 유전자의 isoform에 따라서 각 isoform이 어느 조직에서 발현되는지도 볼 수 있다.-conservation track : 인간 이외의 100종에서 conservation되는 sequence 비교해주는 track-CADD track : 하나의 염기 돌연변이(삽입, 결실) 정도를 나타내는 track.{7} BRCA1 gene- 17번 염색체에 존재하는 BRCA1 gene (Breast cancer type 1 gene)은 DNA의 안정성에 관여하는 유전자이다. 전사와 번역을 통해 만들어진 BRCA1 단백질은 RAD51과 같은 DNA복구 단백질들이 손상부위에 쉽게 갈 수 있도록 도와주어 DNA의 double-stranded break 수선을 도와준다. 이 gene에 변이가 일어나면 이러한 DNA 수선기작에 문제가 생겨 특히 유방암, 난소암에 걸릴 확률이 매우 높아진다. 상염색체 우성으로 유전되는 특성이 있어 유전자 검사를 통해 유전된 BRCA1 gene 돌연변이를 발견하고 예방적 유방, 난소 절제술을 받기도 한다.[2] MethodBRCA1 유전자에 어떤 염기 돌연변이가 얼마나 많이 일어나는지 알아보기 위해 CADD track을, 어떤 조직에서 얼마나 발현되는지 알아보기 위해 GTEx track을, 다른 동물들에게도 BRAC1 gene이 있는지 알아보기 위해 conservation track을 사용하였다.원하는 정보 외의 불필요한 부분들은 모두 hide 처리하였고 Configuration을 이용해 pont sizs를 10으로 설정, splice variants와 배경의 light blue guideline을 제거하였다.[3] result17번 염색체 43,044,295-43,125,483 부분을 나타낸 자료이다.CADD track, GTEx track, conservation track 순서대로 정렬되어 있다.아래는 확대된 GTEx 결과이다.[4] DiscussionBRCA1 gene의 CADD track 그래프를 보면 A,C,T,G 각 염기변이 그래프의 개형이 크게 다르지 않은 것을 볼 수 있다. 이는 gene의 각 위치에 따라 염기변이가 일어나는 정도가 비슷하고 그 위치에서 어느 한 염기만 특히 변이가 잘 일어나는게 아닌, 모두 다 비슷한 확률로 변이가 일어남을 알려준다. 또한 인트론보다 엑손에서 변이확률이 더 높은 것을 관찰할 수 있다.아래의 그래프는 삽입과 결실 돌연변이 정도를 보여주는데 삽입 돌연변이보다는 결실 돌연변이가 더 많이 일어남을 볼 수 있다. 따라서 결실 돌연변이에 의한 암 발생률이 보다 높을 것이라 예상할 수 있다.GTEx track 결과를 통해 다른 부위보다 Cultured fiboblast, EBV-transformed lymphocytes에서 BRCA1 gene 발현이 유독 높은 것을 볼 수있다.Conservation track 결과를 통해 인간과 유연관계가 가까운 Rhesus Monkey에서 BRCA1 gene 양상이 가장 비슷함을 볼 수 있다. 또한 Elephant와 Mouse보다는 dog와 조금 더 비슷하다. Zebrafish와 같이 유연관계 아주 먼 동물에서는 유사도를 많이 찾아볼 수 없다.[5] Reference- 김상수, 유전자 기능 분석을 위한 바이오인포매틱스 기법 소개, 대한간학회지 제10권 제 1호, 2004- 이수민, 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향, 2014-Schuster, S. C. ,"Next-generation sequencing transforms today's biology." Nature methods, 5: 16-18.-An integrated encyclopedia of DNA elements in the human genome, Nature 489, 57-74, 2012-Genetic effects on gene expression across human tissues, Nature 550, 204-213, 2017-Rohini ROY, Jarin Chun& Simon N. Powell, BRCA1 and BRCA2 : different roles in a common pathwway genome project, Nature, 2012-최두호, 유방암 유전자 BRCA1과 BRCA2, 한국유방암학회지 제 6권 제 2호, 2003