Cena
Via Chimica

společná cena Nadace Experientia
a Učené společnosti ČR pro vysokoškolské studenty za chemii

Laureátem ceny Via Chimica pro rok 2022 je

Roman Bushuiev

za excelentní bakalářskou práci s názvem „Machine-learning prediction of terpene biosynthesis“, kterou zpracovával na Katedře aplikované matematiky FIT ČVUT ve spolupráci s Ústavem organické chemie a biochemie AV ČR. Společně s oceněním obdrží mladý vědecký talent od Nadace Experientia osobní prémii ve výši 50 000 Kč.

Pomocí strojového učení dokážeme předpovídat biosyntetické reakce, říká první laureát ceny Via Chimica pro mladé talenty v oboru chemie

Přibližně čtvrtina všech v současnosti vyráběných léčiv pochází z rostlin. Základním zdrojem chemických látek pro vývoj nových léků jsou specializované metabolity, které rostliny produkují, aby zvýšily svoji plodnost nebo se chránily proti predátorům. Jelikož chemická syntéza specializovaných metabolitů je velmi náročná, bude v blízké budoucnosti nejudržitelnějším způsobem produkce takových molekul jejich biosyntéza v upravených mikroorganismech. Laureát ceny Via Chimica pro rok 2022 Roman Bushuiev ve své studentské práci navrhl a otestoval algoritmus, který dokáže biosyntetické reakce předpovídat. “V naší práci jsme studovali terpeny, nejrozsáhlejší skupinu specializovaných metabolitů rostlin. Porozumění procesu biosyntézy terpenů je logickým krokem směrem k nové éře designu léčiv,” vysvětluje čerstvý laureát ceny Via Chimica, který svoji práci zpracovával  na Katedře aplikované matematiky FIT ČVUT ve spolupráci s Ústavem organické chemie a biochemie AV ČR.

Romane, jak jste se jako student informatiky ČVUT v Praze dostal k výzkumu biosyntézy?
Vždy mě lákala věda a výzkum. Asi před třemi lety, když jsem hledal ke studiu informatiky nějakou práci na poloviční úvazek, jsem uviděl inzerát Tomáše Pluskala (juniorního vedoucího výzkumné skupiny na ÚOCHB AV ČR zabývající se analýzou biosyntetických drah specializovaných metabolitů v rostlinách, pozn. aut.) Už při pohovoru jsem zjistil, že ačkoliv se jedná o pozici programátora, bude to hodně vědecká práce. Okamžitě jsem zatoužil dozvědět se víc. Spolupráce probíhala skvěle a začali jsme se bavit o mé bakalářské práci. Řekl jsem Tomášovi, že bych chtěl udělat něco ohromně zajímavého, něco, co nikdo přede mnou nedělal a on mi nabídl projekt předpovídání biosyntézy terpenů (těkavých vonných látek obsažených v listech, plodech, květech, oddencích i kořenech rostlin, pozn. aut.)

K čemu je předpovídání biosyntézy terpenů užitečné?
Přibližně čtvrtina všech v současnosti vyráběných léčiv pochází z rostlin. Základním zdrojem chemických látek pro vývoj nových léků jsou specializované metabolity, které rostliny produkují, aby zvýšily svoji plodnost nebo se chránily proti predátorům. Jelikož chemická syntéza specializovaných metabolitů je velmi náročná, bude v blízké budoucnosti nejudržitelnějším způsobem produkce takových molekul právě biosyntéza v upravených mikroorganismech. V naší práci jsme studovali terpeny, nejrozsáhlejší skupinu specializovaných metabolitů rostlin. Porozumění reakcím biosyntézy terpenů je logickým krokem směrem k nové éře designu léčiv.

Bylo pro vás jako pro informatika těžké do tématu proniknout?
Měl jsem velkou výhodu v tom, že můj školitel dokáže vysvětlit složité věci jednoduchými slovy. Abych do tématu pronikl, začal jsem si číst knížky z organické chemie a z buněčné biologie, prostudoval jsem si nějaké články a pochopil jsem základní mechanismy. Téma predikce biosyntézy mě velice zaujalo. Do biologie i chemie jsem se díky tomu zamiloval.

Na jakém principu predikce za pomoci strojového učení funguje?
Obecně strojové učení potřebuje nějaká data, najde v nich určité vzorce a zákonitosti a na základě toho potom může dělat predikce. Náš algoritmus  jsme navrhli tak, že jsme sjednotili tři neuronové sítě. Nejprve dvě nezávislé neuronové sítě převedou malé molekuly a enzymy do dvou vektorových prostorů. Následně třetí neuronová síť se učí přiřazovat vektory malých molekul vektorům enzymů tak, aby takové přiřazení odpovídalo skutečným biosyntézám specializovaných metabolitů, a to znamená, že dokáže potom předpovídat i jejich reakce.

Jak byla predikce umělé inteligence v oblasti biosyntézy úspěšná?
Námi navržená neuronová síť dokázala přesně predikovat každou třetí biosyntetickou reakci s vysokou jistotou a většina zbývajících predikcí celkově odpovídala skutečné struktuře produktů reakcí.

Kam by váš výzkum mohl dále směřovat?
V budoucnu plánujeme s predikcemi biosyntéz pokračovat. Věřím, že jednoho dne sjednotíme oblasti biochemie, matematiky a strojového učení do takové míry, že budeme vnímat biosyntézy (a jiné přírodní procesy) jako jasně definované operace ve formálních matematických prostorech.

Jak vnímáte fakt, že jste za svůj výzkum dostal cenu za obor chemie?
Mám z toho velice dobrý pocit. Je to mnohem zajímavější, než kdybych dostal cenu za obor informatika. Jednak jsem si opravdu užil spolupráci v rámci interdisciplinárního výzkumného týmu. Navíc, vědy jako chemie a biologie jsou jedny z nejlepších, možná úplně nejlepší aplikační oblastí informatiky. To, že dostávám cenu za chemii, znamená, že do nějaké míry dokážeme skrze informatiku luštit tajemství přírody. To mi přijde absolutně fascinující!

Roman Bushuiev

Laureát ceny Via Chimica pro rok 2022 Roman Bushuiev (*2000) se narodil v ukrajinském Doněcku. Po absolvování gymnázia v Kyjevě odešel studovat do Prahy. Je studentem prvního ročníku magisterského studia informatiky na ČVUT v Praze, obor znalostní inženýrství. Zároveň pracuje na ÚOCHB AV ČR ve výzkumné skupině Tomáš Pluskala a podílí se na výzkumu analýzy biosyntetických drah specializovaných metabolitů v rostlinách.

Vyjádření společné hodnotící komise Učené společnosti ČR a Nadace Experientia:

Po pečlivém zvážení všech aspektů se komise rozhodla ocenit bakalářskou práci Romana Bushuieva, studenta studijního programu Informatiky Českého vysokého učení technického v Praze, specializace Znalostní inženýrství. Práce s názvem „Machine-learning prediction of terpene biosynthesis“ byla zpracovaná na Katedře aplikované matematiky FIT ČVUT ve spolupráci s Ústavem organické chemie a biochemie AV ČR pod vedením školitele Tomáše Pluskala. Komise ocenila zejména interdisciplinární zaměření a inovativnost práce založené na aplikaci nejnovějších přístupů strojového učení na modelování funkce biosyntetických enzymů a predikci biosyntetických reakcí. K tomuto účelu byla sestavena a otestována kombinace neuronových sítí a vytvořen model predikující produkty biosyntéz přímo ze sekvencí aminokyselin enzymů.

Predikce biosyntézy terpenů pomocí strojového učení

Popularizační článek Predikce biosyntézy terpenů pomocí strojového učení vycházející z vítězné bakalářské práce Romana Bushuieva si můžete přečíst na stránkách Nadace Experientia.

Článek Romana Bushuieva