Sunday, September 28, 2008

Original lecture and Lecture 1&2

เนื้อหาใน บทความเรื่อง Lecture 1-3 มาจากการเรียบเรียงจากการฟังการบรรยายในหัวข้อ Protein structure primer


ซึ่งสามารถดูได้จาก link ด้านล่าง





http://www.s-star.org/lectures/Lecture06/Lecture06_files/Default.htm








บทความทั้งหมดนี้เป็นส่วนหนึ่งของการเรียนวิชา Genome information
Lecture 1
Protein Structure Primer
Shoba Ranganathan
Bioinformatics Centre
National University of Singapore

เหตุผลของการศึกษาโครงสร้างของโปรตีน
ปฏิกิริยาเคมีที่เกิดขึ้นภายในเซลล์ของสิ่งมีชีวิตโดยทั่วไป โปรตีนเป็นสารอาหารหลักชนิดหนึ่งที่เซลล์จะใช้เป็นแหล่งพลังงาน โปรตีนมีลักษณะที่พิเศษเกิดจากการเรียงตัวของ กรดอะมิโนวางเรียงต่อกันด้วยพันธะเปปไทด์ แต่ละอะตอมในโครงสร้างของโปรตีนจะมีบทบาทที่ทำให้เกิดการ ม้วนพับ (Folding) ของเส้นโพลีเปปไทด
The (L-) amino acid

กรดอะมิโนประกอบด้วยโครงสร้างหลักที่เหมือนกันทั้ง 20 ชนิด คือ ประกอบด้วย หมู่อะมิโน (NH3+) หมู่คาร์บอกซิล (COO-) แอลฟาคาร์บอนอะตอม และไฮโดรเจนอะตอม ส่วนหมู่ข้าง (R-sidechain) จะแตกต่างกันขึ้นอยู่กับชนิดของกรดอะมิโน กรดอะมิโนจะเป็นโมเลกุลที่อสมมาตร (asymmetry)โดยทั่วไปกรดอะมิโนที่พบภายในเซลล์ของสิ่งมีชีวิตจะเป็นชนิด L ไอโซเมอร์
ยกเว้นไกลซีน ซึ่งจะทำให้มีรูปหรือโครงสร้างของการหมุนที่เป็นกระจกของกันและกันคือ ไอโซเมอร์ชนิดแอล (L) จะมีรูปกระจกเป็นไอโซเมอร์ชนิดดี (D) ซึ่งใช้เป็นจุดสำคัญในการควบคุมวิถีเมแทบอลิซึมในเซลล์ นอกจากนี้กรดอะมิโนมาตรฐาน 20ชนิดยังอาจเป็นตัวตั้งต้นการเพิ่มชนิดของกรดอะมิโน โดยทั่วไปกรดอะมิโนที่อยู่ในรูป D ไอโซเมอร์มักจะพบในสิ่งมีชีวิตพวกโปรคาริโอต เช่น พบ D-อะลานีน และ D-ไอโซกลูตาเมตในผนังเซลล์ของแบคทีเรียแกรมบวกชนิด Stapphylococcus aureus นอกจากนี้ในแบคทีเรียที่พบเปปไทด์สายสั้น ๆ ที่เรียกว่า ไอโอโนฟอร์ (ionophore) ที่ทำหน้าที่เป็นช่องผ่านของสารต่าง ๆ ในเยื่อเซลล์จะมีส่วนประกอบเป็นกรดอะมิโน D-ไอโซเมอร์

Formation of polypeptide chain
พันธะเปปไทด์จะมีลักษณะเป็นพันธะคู่บางส่วน (partial double bond) และเกิดเรโซแนนท์
จากการวิ่งของอิเล็กตรอนในพันธะ ซึ่งจะทำให้ความยาวพันธะระหว่าง C-N สั้นกว่าพันธะเดี่ยว C-N ปกติ

Aliphatic residues
กลุ่มกรดอะมิโนที่มีหมู่ข้างเป็นสายไฮโดรคาร์บอน
ซึ่งโครงสร้างสามมิติของโปรตีนจะมีแรงไฮโดรโฟบิกเป็นส่วนสำคัญที่จะทำให้เกิดความทน (stability) และโครงรูปม้วนพับของโปรตีนที่ถูกต้องได้ ไอโซลิวซีนและลิวซีนเป็นไอโซเมอร์ซึ่งกันและกัน

Aromatic residues
กลุ่มกรดอะมิโนที่หมู่ข้างเป็นอะโรมาติก หมู่ข้างของกรดอะมิโนในกลุ่มนี้จะสามารถดูดกลืนแสงในช่วงคลื่นอัลตราไวโอเลตและให้แสงฟลูออร์เรสเซนต์ได้ในช่วง 250-350 nmฟีนิลอะลานีนเป็นกรดอะมิโนที่มีหมู่ข้างเป็นวงแหวนที่มีลักษณะไม่ว่องไวต่อปฏิกิริยาเคมีแต่มีคุณสมบัติเป็นไฮโดรโฟบิกและชอบที่จะเกิดปฏิกิริยากับพวกไม่มีขั้ว (non-polar) หรือกับพวกอะโรมาติกด้วยกัน
ไทโรซีน (Tyrosine) จะมีความว่องไวในปฏิกิริยาเคมีมากกว่าฟีนิลอะลานีนเพราะมีหมู่ไฮโดรซิลที่หมู่ข้าง ทำให้คุณสมบัติการเป็นกรดเบสของวงแหวนเปลี่ยนไปโดยมีความเป็นกรดมากขึ้น และยังเกิดพันธะไฮโดรเจนได้จากหมู่ไฮดรอกซิล
ทริปโตฟาน (tryptophan) มีหมู่ข้าง เป็นหมู่ข้างที่ใหญ่ที่สุดที่พบในโปรตีน
ส่วนประกอบการที่หมู่ข้างของทริปโตฟานเป็นวงแหวนมีสมบัติไม่ชอบน้ำ เกิดปฏิกิริยาเคมีไม่ว่องไว แต่ก็เกิดปฏิกิริยาการเปลี่ยนแปลงได้โดยไอโอดีนได้ง่าย ไนโตรเจนอะตอมในวงแหวนไพรอลเป็นส่วนที่เกิดปฏิกิริยาได้ดี

Charged residues
กลุ่มกรดอะมิโนที่มีสมบัติเป็นกรด หมู่ข้างของกรดอะมิโนกลุ่มนี้จะเป็นหมู่คาร์บอกซิล มีประจุเป็นลบ มีสมบัติเป็นกรด หมู่ข้างของแอสปาเทต และกลูตาเมตจะต่างกันที่มีหมู่เมททิลลีนต่างกันหนึ่งหมู่ แต่จะมี pK ใกล้เคียงกัน (pH 3.8-4.5) เกิดปฏิกิริยาเคมีได้ง่าย เช่น การเกิดปฏิกิริยาเอสเทอริฟิเคชันด้วยแอลกอฮอล์ หรือปฏิกิริยาการรวมตัวกับเอมีน นอกจากนี้หมู่ข้างของกรดอะมิโนสองตัวนี้ยังสามารถจับได้กับไอออนหลายชนิดเช่น Ca2+ เช่น โปรตีน calmodulin หรือจับกับ Zn2+ ในกลุ่มของเอนไซม์คาร์บอกซีเปปติเดส จะเห็นได้ว่ากรดอะมิโนเป็นสารที่มีประจุทั้งบวกและลบในโครงสร้าง จากสมบัติของหมู่อะมิโน (NH3+) และหมู่คาร์บอกซิล (COO-)สมบัติของกรดอะมิโนที่มีทั้งประจุบวกและประจุลบ(zwitterions)เพราะภายในโครงร่างผลึกจับกันด้วยแรงของประจุ การมีประจุทำให้กรดอะมิโนเป็นตัวนำกระแสไฟฟ้าในสารละลาย นอกจากนี้ยังทำให้กรดอะมิโนมีสมบัติของความเป็นกรดด่างในตัว โดยในสภาวะที่pH 7 หมู่อะมิโนและหมู่คาร์บอกซิลจะแตกตัวให้ประจุ ซึ่งการมีประจุของกรดอะมิโนจะมีการเปลี่ยนแปลงเข้าสู่จุดสมดุลตลอดช่วงของค่าpH (1-14) โดยการมีบทบาทนี้จะทำให้มีผลต่อสมบัติของโปรตีน ซึ่งการจับและหลุดของโปรตอนในหมู่โครงสร้างทั้งสองนี้ทำให้มีผลต่อบทบาทของหมู่อะมิโนและหมู่คาร์บอกซิล ซึ่งมีสมบัติเป็นได้ทั้งกรดอ่อนและด่างอ่อน สมบัตินี้มีความสำคัญอย่างมากต่อโปรตีน ซึ่งสามารถศึกษาได้โดยอาศัยค่า pK พบว่าหมู่อะมิโนจะมี pK ประมาณ 9 ซึ่งเป็นด่างอ่อน การแตกตัวของหมู่อะมิโนและหมู่คาร์บอกซิลในpH ต่างๆจากโครงสร้างของกรดอะมิโน หมู่ข้าง (R-group) จะมีหมู่ฟังก์ชันซึ่งอาจเป็นตัวให้หรือรับโปรตอนโดยหมู่ข้างจะเป็นตัวที่ทำให้กรดอะมิโนมีสมบัติที่แตกต่างกันทั้ง 20

กรดอะมิโนกลุ่มที่เป็นเบส หมู่ข้างของอาร์จีนีนประกอบด้วย 3 หมู่เมททิลีนแล้วตามด้วยหมู่กัวนาดิเนียม
(guanadinium) ซึ่งมักจะเกิดการเติมโปรตอนและจะมีไฮบริไดเซชั่นของโปรตอน หมู่กัวนาดิเนียมเป็นเบสที่แรงมี pK ประมาณ 12 ไม่ว่าจะอยู่ในสารละลายใดๆจะมีประจุสุทธิเป็นบวก ส่วนไลซีนมีหมู่ข้างที่ยาวมี สี่หมู่เมททิลีน มีหมู่ฟังก์ชันเป็นหมู่อะมิโน pK ประมาณ 10.5-11เป็นกลุ่มของกรดอะมิโนที่ทำปฏิกิริยากับโปรตีนที่มีประจุตรงข้ามได้ดี
ฮีสติดีนเป็นกรดอะมิโนที่มีหมู่ข้างเป็นวงแหวนอิมิดาโซล (imidazole ring) มี pK ของหมู่ข้างประมาณ 7 โปรโตเนชัน (protonation) ทำให้หมู่ข้างมีสมบัติเป็นกรดด่างที่ต่างกันและยังอาจทำให้เกิดนิวคลิโอไฟล์และอิเล็คโตรไฟล์ที่ต่างกัน มีคุณสมบัติที่ทำให้เกิดเป็นพันธะไฮโดรเจนได้

Polar residues

กลุ่มของกรดอะมิโนที่มีหมู่ข้างเป็นหมู่เอมีน คือ แอสปาราจีน และกลูตามีน
กรดอะมิโนกลุ่มนี้หมู่ข้าง คือ หมู่เอไมด์เป็นหมู่ฟังก์ชันไม่ไวต่อปฏิกิริยาเคมี โดยทั่วไปจะมี
โพลาร์และทำหน้าที่เป็นตัวให้หรือรับโปรตอนได้ ซึ่งแสดงว่าสามารถสร้างพันธะไฮโดรเจนกับอะตอมอื่น ๆ ในโครงสร้างของโปรตีน หมู่เอไมด์นี้จะถูกสลายได้ง่ายในสภาวะที่เป็นด่าง หรืออุณหภูมิที่สูงจะทำให้เกิดการขจัดหมู่เอไมด์ (deamidate) เกิดเป็นกรด (acid form)

กลุ่มของกรดอะมิโนที่มีหมู่ซัลเฟอร์ในหมู่ข้าง คือ ซีสเทอีนและเมทไธโอนีน
ในซีสเทอีนหมู่ซัลเฟอร์จะเป็นหมู่ไทออล (thio group) ที่ไวต่อการเกิดปฏิกิริยาเคมี ส่วนในเมทไธโอนีน หมู่ซัลเฟอร์จะอยู่ในหมู่ข้างที่เป็นสายยาวทำให้เกิดปฏิกิริยาได้ยาก ซัลเฟอร์อะตอมจะเป็นนิวคลิโอไฟล์ (nucleophile) เกิดปฏิกิริยาเมทธิลเลชันได้ง่าย โดยใช้ methyl iodine เป็นปฏิกิริยาที่ทำให้ติดฉลาก (label) 13C ในเมทไธโอนีน นอกจากนี้ซัลเฟอร์ในเมทไธโอนีนยังเกิดปฏิกิริยาได้กับโลหะหนักที่จะเกี่ยวข้องกับ mercury และ platinum เช่น K2PtCl4 หรือ HgCl2 ซึ่งมีประโยชน์ในการทำให้เกิดisomorphous ของโปรตีนสำหรับการตกผลึกโปรตีน (crystallization) นอกจากนี้ เมทไธโอนีนยังเกี่ยวข้องกับการเกิดปฏิกิริยากับไซยาโนเจนโบรไมด์ (cyanogen bromide) ซึ่งเกิดปฏิกิริยาเคมีที่ตัดพันธะเปปไทด์ของเมทไธโอนีนที่ปลายคาร์บอกซิล โดยการทำปฏิกิริยากับน้ำทำให้ได้ผลิตภัณฑ์เป็นhomoserine lactone ปฏิกิริยานี้ใช้ในการทำให้เส้นโปรตีนเล็กลง

กลุ่มกรดอะมิโนที่มีหมู่ไฮดรอกซิล คือ เซรีน และ ทรีโอนีนเป็นหมู่ข้างหรือกลุ่มมีขั้วแต่ไม่มีประจุ
หมู่ข้างของกรดอะมิโนกลุ่มนี้จะมีหมู่ไฮดรอกซิล (-OH) ซึ่งเป็นหมู่ที่สามารถเกิดปฏิกิริยาเคมีที่สำคัญในโปรตีนได้ เป็นหมู่ข้างขนาดเล็กที่เกิดพันธะไฮโดรเจนได้กับอะตอมอื่น ๆ มีสมบัติเป็นหมู่แอลกอฮอร์ที่เกิดปฏิกิริยาเอสเทอริฟิเคชันได้ดี เช่น ปฏิกิริยาฟอสโฟรีเลชัน (phosphorylation) คือการเติมหมู่ฟอสเฟตให้กับเซรีน และทรีโอนีน โดยมักจะเกิดในขั้นตอนการดัดแปลงหลังการแปลรหัส(posttranslational modification) มีความสำคัญสำหรับปฏิสัมพันธ์ของโปรตีน (protein-proteininteraction) และการส่งสัญญาณภายในเซลล์ (intracellular signaling)

The peptide bond

ลักษณะของพันธะเปปไทด์พันธะที่เชื่อมต่อกรดอะมิโนเข้าด้วยกันต่อเป็นสายยาวให้เป็นเส้นโปรตีน
โดยอาศัยปฏิกิริยาการรวมตัวของหมู่คาร์บอกซิลของกรดอะมิโนตัวที่หนึ่งกับหมู่อะมิโนของกรดอะมิโนตัวที่สอง และเสียน้ำออกไป 1 โมเลกุลซึ่งจากรูปนี้จะทำให้มีกรดอะมิโนตัวอื่นๆ เข้ามาต่อกันได้หลายพันธะขึ้นไปอีกและเกิดเป็นโปรตีน ถ้ามีกรดอะมิโนจำนวนน้อยจะเรียกว่า Peptide bond แต่ถ้าประกอบด้วยกรดอะมิโนจำนวนมากจะเรียกว่า Polypeptide bond โดยภายในเซลล์ของสิ่งมีชีวิตจะมีไรโบโซมและโปรตีนอื่นๆ ร่วมกันสร้างโปรตีนที่มีขนาดแตกต่างกันตั้งแต่เปปไทด์เล็ก ๆ จนเป็นโพลีเปปไทด์ขนาดใหญ่ แต่ในทางเคมีการสังเคราะห์โพลีเปปไทด์ยังมีข้อจำกัดที่อาจจะสังเคราะห์ได้ไม่เกิน 50 ลำดับกรดอะมิโน ส่วนการอ่านลำดับของกรดอะมิโนจะอ่านจากซ้ายไปขวาซึ่งก็คือ จากทางปลายอะมิโนหรือปลาย N (N-terminus) ไปทางปลายคาร์บอกซีหรือปลาย C (C-terminus) ลำดับของกรดอะมิโนในโปรตีนนี้จะแปลมาจากยีน มีโปรตีนบางชนิดที่เกี่ยวข้องสัมพันธ์กันเพราะที่มีลำดับของกรดอะมิโนที่ใกล้เคียงกัน ส่วนโปรตีนหลายชนิดมีองค์ประกอบของกรดอะมิโนและลำดับของกรดอะมิโนที่แตกต่างกัน

Backbone Torsion Angles
กรดอะมิโนที่อยู่ในโครงสร้างหลัก (backbone) ของสายโพลีเปปไทด์ของโปรตีนที่เป็นก้อนกลม จะมีลักษณะของโครงสร้างระดับทุติยภูมิอยู่ 3 แบบ คือ แอลฟา-เฮลิกซ์ สายบีต้า และสาย turnจากจำนวนกรดอะมิโน 20 ชนิดที่พบ ในโปรตีน หากคิดถึงความเป็นไปได้ในการสร้างโครงสร้างอาจได้ถึง 780 ชนิด สำหรับ dipeptide ดังนั้นถ้ามีขนาดของโพลีเปปไทด์ที่มีความยาว 100 กรดอะมิโนอาจจะทำให้ได้โครงรูป (conformation)
แอลฟา-เฮลิกซ์จะมีกรดอะมิโน 3.6 กรดอะมิโนต่อหนึ่งรอบของเกลียวโดยมีความห่างของแต่ละกรดอะมิโนประมาณ 0.15 nm พารามิเตอร์นี้เรียกว่า translation per residue distanceทำให้หนึ่งเกลียวจะมีความยาว 0.54 nm จากการศึกษาแบบจำลองแอลฟา-เฮลิกซ์จะมาจากมุมไพ และมุม ของมุมบิดและมุม dihedral ค่าของมุมไพและมุมไซ ในโครงสร้างแอลฟา-เฮลิกซ์จะทำให้โครงสร้างหลักขยับตัวเข้าใกล้ชิดกัน จนทำให้เกิดพันธะไฮโดรเจนขึ้นในโครงสร้างหลัก (backbone) คือ จะมีพันธะไฮโดรเจนเกิดระหว่างคาร์บอนิลออกซิเจนของโครงสร้างหลักของกรดอะมิโนตัวที่หนึ่งกับเอไมด์ไฮโดรเจนของโครงสร้างหลักของกรดอะมิโนตัวที่ 4 ในสายเปปไทด์ ความยาวของพันธะไฮโดรเจน 0.286 nm และขนานไปกับเกลียวเฮลิกซ์โดยทั่วไปในโปรตีนแต่ละชนิดก็จะมีความยาวของพันธะไฮโดรเจนและมีมุมที่แตกต่างกัน

Lecture 2
Structural information
· Protein Data Bank (PDB) format is a standard for files containing atomic coordinates. It is used for structures in the
Protein Data Bank and is read and written by many programs.
· Protien Data Bank maintained by the Reserch collaboratory for Structural Bioinfomatic from
http://www.rcsb.org/pdb/ consis of >10,000 structures of proteins ,al contain structures of DNA , carbohydrates and protein-DNA complexes.
· The Protein Data Bank (PDB) format provides a standard representation for macromolecular structure data derived from X-ray crystallography.Other methods are electrol microscopy and NMR. Some structures are also theoretically predicted.

The PDB data
PDB format consists of lines of information in a text file. Each line of information in the file is identified by unique 4 –letter code say 1 emg .

PDB Header details
• Identifies the molecule,any modification,date of release of PDB
• Organism,keywords,method
• Authors , Reference,resolution if X-ray structure
• Sequence , x-reference to sequence database

The data itself
Coordinate for each heavy(non - hydrogen) atom from the first residue to the last. Any ligands (startine with HETATM) follow the biomacromolecule. O atom of water molecules at the end

Visualizing PDB information
• RASMOL: most popular,available for all platforms
http://www.bernstein-plus-sons.com/software/rasmol
• Swiss PDB Viewer : from Swiss – Prot
http://expasy.nhri.org.tw/spdbv/
• Chemscape Chime Plug-in : for PC and Mac
http://www.mdli.com/download/chimedown.html

Protein Structure

Levels of protein structure : 0,1
-Zeroth : amino acid composition – no structural informatic
-Primary : This is simply the order of covalent linkages along the polypeptide chain, i.e. the sequence itselt.

Levels of protein structure : 2
Secondary : local organization of protein backbone : α- helix , β-strain (which assemble into β sheets ), turn and interconnecting loop
The α-helix
The alpha helix is a right-handed coiled conformation, resembling a
spring, in which every backbone N-H group donates a hydrogen bond to the backbone C=O group of the amino acid four residues earlier ( hydrogen bonding). Properties of the α helix Side – chains project outwards: praline only fits the start Amphipathicity if solvent exposed: hydrophilic residues in cyan: hydrophobic resides in magenta .This secondary structure is also sometimes called a classic Pauling-Corey-Branson alpha helix .First structure to be predicted Pauling, Corey, Branson:1951 and experimentally sovlved (Kendrew et al.1958)-myoglobin
The amino acids in an α helix are arranged in a right-handed
helical structure, 5.4 Å (= 0.54 nm) wide. Each amino acid corresponds to a 100° turn in the helix (i.e., the helix has 3.6 residues per turn), and a translation of 1.5 Å (= 0.15 nm) along the helical axis. Most importantly, the N-H group of an amino acid forms a hydrogen bond with the C=O group of the amino acid four residues earlier; this repeated hydrogen bonding defines an α-helix. Similar structures include the 310 helix and the π-helix . These alternative helices are relatively rare, although the 310 helix is often found at the ends of α-helices, "closing" them off.
The β- sheet
The β sheet (also β-pleated sheet) is the second form of regular secondary structure in proteins consisting of beta strands connected laterally by three or more hydrogen bonds , side – chains project alternately up or down and amphipathicity if sovent exposed:hydrophilic residues on one face ,hydrophobic ones on the other. A beta strand (also β-strand) is a stretch of amino acids typically 5–10 amino acids long whose peptide backbones are almost fully extended. The association of beta sheets has been implicated in the formation of protein aggregates and fibrils observed in many human diseases, notably the amyloidoses.
Parallel, Antiparallel and Mixed Beta-Sheets.
In parallel beta-sheets the strands all run in one direction, whereas in antiparallel sheets they all run in opposite directions. In mixed sheets some strands are parallel and others are antiparallel.


















No comments: