Tekoäly ratkaisi yhden biologian suurimmista haasteista

Tekoäly on onnistunut ratkaisemaan yhden maailman suurimmista biologisista haasteista. Deepmind-yhtiön kehittämä tekoäly pystyy ennustamaan, miten proteiinit laskostuvat kolmiulotteiseen muotoonsa.

Proteiinit toimivat solujen rakennusaineena ja määrittävät virusten, bakteerien, ihmiskehon ja kaiken elollisen toimintaa. Ne koostuvat aminohapoista, jotka yhdistyvät ketjuiksi ja järjestyvät sitten kullekin proteiinille ominaiseen kolmiulotteiseen muotoon. Tätä järjestymistä kutsutaan laskostumiseksi.

Proteiinin muoto määrittää niiden tehtävän. Muodon määritteleminen on tärkeää muun muassa lääkekehityksessä ja sairauksien ymmärtämisessä.

Sisältö jatkuu mainoksen jälkeen

Tutkijat ovat etsineet ratkaisua proteiinin rakenteen määrittämiseksi jo 50 vuoden ajan. Vuonna 1972 yhdysvaltalainen kemisti Christian Anfinsen sai Nobelin kemianpalkinnon osoittamalla, että proteiinien kolmiulotteinen rakenne oli mahdollista määritellä aminohappoketjun perusteella.

Ongelmana on, että yksi proteiini koostuu sadoista tai tuhansista aminohapoista, jotka voivat kytkeytyä toisiinsa lukuisilla tavoilla. Mahdollisia laskostumistapoja on niin paljon, että niiden kaikkien laskeminen on tietokoneella mahdotonta.

Pelkästään ihmisissä erilaisia proteiineja on kymmeniätuhansia ja kaikissa elollisissa olennoissa miljardeja. Tutkijat ovat onnistuneet määrittelemään vain 170 000 proteiinin rakenteen, kun kaikkiaan proteiineja on tunnistettu yli 200 miljoonaa.

Vuonna 1994 joukko tutkijoita ryhtyi etsimään ongelmaan ratkaisua kansainvälisen kilpailun avulla. Casp on kahden vuoden välein järjestettävä kilpailu, johon osallistuvat tutkijaryhmät yrittävät ennustaa proteiinien rakennetta tietojenkäsittelytieteen menetelmillä.

Kilpailijoille annetaan tarkasteltavaksi useiden eri proteiinien aminohappoketjuja, joiden pohjalta he yrittävät ennustaa sen kolmiulotteisen muodon. Tietokoneella tehtyjä ennustuksia verrataan laboratoriomittauksiin.

Menneinä vuosina kilpailun tulokset eivät ole olleet kummoisia. Moni alan tutkija ajatteli, että läpimurtoa jouduttaisiin odottamaan vielä vuosikymmeniä.

Sitten tulivat Deepmind ja sen kehittämä Alphafold. Deepmind on Googlen omistama tutkimusyhtiö, joka tunnetaan useista läpimurtoja tehneistä tekoälyohjelmistaan.

Yhtiön kehittämä tekoäly perustuu neuroverkoksi kutsuttuun matemaattisen laskennan malliin, joka jäljittelee ihmisaivojen mekanismeja. Neuroverkkoja opetetaan suoriutumaan erilaisista tehtävistä suuren datamäärän avulla. Ne oppivat tunnistamaan esimerkiksi kuvien seasta tiettyjä kohteita kuten kasvoja tai eläimiä, kääntämään kieliä ja tunnistamaan puhetta.

Samaan periaatteeseen nojaa myös proteiinirakenteen ennustamiseen kehitetty Alphafold. Se sai analysoitavakseen tuhansia laboratoriossa mitattuja proteiineja ja niiden rakenteita, minkä ansiosta se oppi ennustamaan proteiinien laskostumista myös sille annetun datan ulkopuolelta.

”En olisi ikinä uskonut, että näen tämän tapahtuvan elinaikanani”, Marylandin yliopiston professori John Moult sanoo Science-lehdelle.

Moult on yksi Casp-kilpailun perustajista, ja hän oli myös mukana arvioimassa tämän vuoden osallistujia. Kilpailussa Alphafold päihitti ihmisten tekemät mittaukset sekä nopeudessa että luotettavuudessa. Tehtävät, joihin tutkijoilta kului laboratoriossa vuosia, sujuivat tekoälyltä muutamassa tunnissa, jopa minuuteissa.

Kun ohjelmalle antoi tarkasteltavaksi aminohapoista koostuvan ketjun, se pystyi ennustamaan proteiinin kolmiulotteisen muodon täsmällisesti kahdessa kolmesta tapauksesta. Sen tekemät virheet olivat suurimmaksi osaksi hyvin pieniä, alle atomin kokoluokkaa.

Lopulta Alphafold onnistui tehtävässä, jota tutkijat olivat yrittäneet ratkaista jo useita vuosikymmeniä. Se ennusti yksisoluisessa mikro-organismissa, arkeonissa, sijaitsevan proteiinin kolmiulotteisen rakenteen. Kyseistä rakennetta on erityisen vaikea määritellä, sillä se sijaitsee puoliksi solun sisällä ja puoliksi sen ulkopuolella.

Tekoäly selvisi tehtävästä puolessa tunnissa.

Lääketieteessä Deepmindin teknologia mahdollistaa monenlaisia mullistuksia. Proteiinirakenteen ennustamisesta on hyötyä muun muassa erilaisten sairauksien kuten syöpien ja dementian ymmärtämisessä. Lisäksi se vauhdittaa uusien lääkkeiden ja rokotteiden kehitystä.

Jos tutkijat tuntevat proteiinin kolmiulotteisen muodon, he pystyvät määrittelemään, miten muut molekyylit voivat niihin sitoutua. Tämä on yksi tapa kehittää lääkkeitä: ne sitoutuvat haluttuihin proteiineihin ja vaikuttavat niiden toimintaan.

Max Planck -instituutin kehitysbiologi Andrei Lupas uskoo, että Alphafoldin kaltainen tekoäly voi auttaa taistelemaan koronaviruksen kaltaisia pandemioita vastaan.

”Tekoälyn avulla voitaisiin määritellä, millaisilla jo olemassa olevilla lääkkeitä uusia viruksia on mahdollista hoitaa”, Alphafoldia kehittämässä ollut Lupas kertoo The New York Timesille.

Tiede