Yapay Zekadan Yeni Numara: Kimya Nasıl Yapılır?

Sinem Sarıgül

Bu yetenek tıpta yeni olasılıkların kilidini açabilir.

Yapay zeka, araştırmacıların modern bilimsel araçların ürettiği muazzam miktarda veriyi analiz etmelerine izin vererek bilimin yapılma şeklini değiştirdi. Milyonlarca saman yığını arasında bir iğne bulabilir ve derin öğrenmeyi kullanarak verilerin kendisinden öğrenebilir. Yapay zeka; gen avcılığı, tıp, ilaç tasarımı ve organik bileşiklerin yaratılmasındaki ilerlemeleri hızlandırıyor.

Derin öğrenme, yeni verilerden bilgi çıkarmak için genellikle büyük miktarda veri üzerinde eğitilen sinir ağları olan algoritmaları kullanır. Adım adım talimatlarıyla geleneksel bilgi işlemden çok farklıdır. Bilgi işlemin aksine, verilerden öğrenir. Derin öğrenme, geleneksel bilgisayar programlamasından çok daha az şeffaftır ve önemli sorular bırakır: Sistem ne öğrendi, ne biliyor?

Protein katlanması

Proteinler tüm canlı organizmalarda bulunur. Hücrelere yapı sağlar, reaksiyonları katalize eder, küçük molekülleri taşır, yiyecekleri sindirir ve çok daha fazlasını yapar. Bir ipteki boncuklar gibi uzun amino asit zincirlerinden oluşurlar. Ancak bir proteinin hücredeki işini yapabilmesi için bükülmesi ve protein katlanması adı verilen karmaşık bir üç boyutlu yapıya dönüşmesi gerekir. Yanlış katlanmış proteinler hastalığa yol açabilir.

Christiaan Anfinsen, 1972’deki kimya Nobel kabul konuşmasında, bir proteinin üç boyutlu yapısını, yapı taşlarının dizilişinden ve amino asitlerden hesaplamanın mümkün olması gerektiğini öne sürdü.

Bir amino asit zincirinin (solda) ribozomdan çıkışından milisaniyeler içinde, proteinin işlevi için gerekli olan en düşük enerjili 3D şekle (sağda) katlanır.

Amino asit yapı taşlarının doğal esnekliği nedeniyle tipik bir protein tahminen 10 üzeri 300 farklı biçimi benimseyebilir. Bu, evrendeki atom sayısından çok daha büyük bir sayıdır. Yine de bir organizmadaki her protein, bir milisaniye içinde, proteini oluşturan tüm kimyasal bağların en düşük enerjili düzenlemesi olan kendi özel şekline katlanacaktır. Bir proteinde tipik olarak bulunan yüzlerce amino asitte yalnızca bir amino asidi değiştirin ve yanlış katlanıp artık çalışmayabilir.

AlphaFold

50 yıldır bilgisayar bilimciler, protein katlanma problemini çok az başarı ile çözmeye çalışıyorlar. Ardından 2016 yılında Google’ın ana Alphabet’inin yapay zeka yan kuruluşu DeepMind, AlphaFold programını başlattı. 150.000’den fazla proteinin deneysel olarak belirlenmiş yapılarını içeren protein veri bankasını eğitim seti olarak kullandı.

AlphaFold, beş yıldan kısa bir süre içinde protein katlama probleminin en azından en faydalı kısmını, amino asit dizisinden protein yapısını belirleme sorununu yendi. AlphaFold, proteinlerin nasıl bu kadar hızlı ve doğru bir şekilde katlandığını açıklamıyor. Bu, yapay zeka için büyük bir kazançtı. Çünkü yalnızca büyük bilimsel prestij kazanmakla kalmadı. Aynı zamanda herkesin hayatını etkileyebilecek büyük bir bilimsel ilerlemeydi.

Bugün AlphaFold2 ve RoseTTAFold gibi programlar sayesinde araştırmacılar, proteini oluşturan amino asitlerin dizilişinden proteinlerin üç boyutlu yapısını hiçbir ücret ödemeden bir veya iki saat içinde belirleyebiliyor. AlphaFold2’den önce proteinleri kristalleştirmeleri ve yapıları, aylar süren ve yapı başına on binlerce dolara mal olan bir süreç olan X-ışını kristalografisini kullanarak çözmeleri gerekiyordu.

Artık Deepmind’in insanlarda, farelerde ve 20’den fazla başka türde bulunan ve neredeyse tüm proteinlerin 3D yapılarını biriktirdiği AlphaFold Protein Yapısı Veritabanı’na da erişimleri var. Bugüne kadar bir milyondan fazla yapıyı çözdüler ve yalnızca bu yıl 100 milyon yapı daha eklemeyi planlıyorlar. Proteinlerin bilgisi hızla arttı. Bilinen tüm proteinlerin yarısının yapısının 2022’nin sonunda belgelenmesi muhtemel. Bunların arasında yeni faydalı işlevlerle bağlantılı birçok yeni benzersiz yapı bulunmakta.

Bir kimyager gibi düşünmek

AlphaFold2, proteinlerin birbirleriyle nasıl etkileşime gireceğini tahmin etmek için tasarlanmamıştı. Ancak tek tek proteinlerin birden fazla proteinden oluşan büyük karmaşık birimler oluşturmak için nasıl birleştiğini modelleyebildi. AlphaFold için zorlu bir soru vardı: Yapısal eğitim seti ona biraz kimya öğretmiş miydi? Amino asitlerin birbirleriyle reaksiyona girip girmeyeceğini söyleyebilir mi?

Floresan proteinler denizanası ve mercan gibi yüzlerce deniz organizmasında bulunan proteinler. Parıltıları hastalıkları aydınlatmak ve incelemek için kullanılabilir. Protein veri bankasında 578 floresan protein var, bunlardan 10’u kırık ve floresan yaymıyor. Proteinler nadiren kendilerine saldırır. Buna otokatalitik posttranslasyon modifikasyonu denir ve hangi proteinlerin kendileriyle reaksiyona girip hangilerinin tepki vermeyeceğini tahmin etmek çok zordur.

Floresan proteinleri ifade eden nöronlar, iki meyve sineği larvasının beyin yapılarını ortaya çıkarır.

Yalnızca önemli miktarda floresan protein bilgisi olan bir kimyager, floresan yapmak için gerekli kimyasal dönüşümlerden geçmek için doğru amino asit sekansına sahip floresan proteinleri bulmak için amino asit dizisini kullanabilir. AlphaFold2’ye protein veri bankasında olmayan 44 floresan proteinin dizilerini sunulduğunda sabit floresan proteinleri kırık olanlardan farklı katladı.

AlphaFold2, floresan proteinlerin amino asit dizisini (üstteki harfler) alabilir ve 3D fıçı şekillerini (ortada) tahmin edebilir. Ancak bu şaşırtıcı değil. Tamamen beklenmedik olan şey, hangi floresan proteinlerin kırıldığını ve floresan yayamayacağını da tahmin edebilmesidir.

Sonuç araştırmacıları hayrete düşürdü: AlphaFold2 biraz kimya öğrenmişti. Floresan proteinlerdeki hangi amino asitlerin onları parlatan kimyayı yaptığını bulmuştu. Protein veri bankası eğitim setinin ve çoklu dizi hizalamalarının AlphaFold2’nin kimyagerler gibi düşünmesine ve proteini floresan yapmak için birbirleriyle reaksiyona girmesi gereken amino asitleri aramasına olanak tanıdığından şüpheleniyorlar.

Eğitim setinden biraz kimya öğrenen bir katlama programının da daha geniş etkileri vardır. Doğru soruları sorarak diğer derin öğrenme algoritmalarından başka neler kazanılabilir? Yüz tanıma algoritmaları hastalıklar için gizli işaretler bulabilir mi? Tüketiciler arasındaki harcama modellerini tahmin etmek için tasarlanan algoritmalar, küçük hırsızlık veya aldatma eğilimi de bulabilir mi? Ve en önemlisi, diğer yapay zeka sistemlerinde bu yetenek ve benzeri yetenek sıçramaları arzu edilir mi?

Yorum bırak

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.