MISANU

Seminar on Computer Science and Applied Mathematics

PROGRAM

Matematički Institut SANU, Beograd
Knez Mihajlova 36
Fakultet organizacionih nauka, Univerzitet u Beogradu,
Jove Ilica 154
IEEE Chapter Computer Science (CO-16) Belgrade, Republic of Serbia

SEMINAR ZA RAČUNARSTVO I PRIMENJENU MATEMATIKU

MI SANU, Knez Mihailova 36, sala 301f

PLAN RADA SEMINARA ZA DECEMBAR 2021. GODINE

Zbog trenutne epidemiološke situacije, predavanja na seminaru će se održavati na daljinu, a slušaoci mogu da ih prate preko linka https://miteam.mi.sanu.ac.rs/asset/YoqHWKALRkRTbK9So.
Registracija za on-line praćenje predavanja na Seminaru je na linku https://miteam.mi.sanu.ac.rs/asset/xzGqvSp7aWbg8WpYX.

Utorak, 07.12.2021. u 14:15, Online
Biljana Stojanović, Matematički institut SANU
POLIMORFIZAM U UPOTREBI KODONA KODIRAJUĆIH SEKVENCI PROTEINA ZA SARS-CoV-2
U ovom izlaganju biće prikazana analiza obrazaca upotrebe kodona (Codon Usage, CU) u kodirajućim sekvencama proteina (Open Reading Frames, ORFs) za akutni respiratorni sindrom korona virus 2 (SARS-CoV-2). Poznato je da se virusi razlikuju po svojoj specifičnosti prema organizmima domaćinima. Analiza organizacije virusnog genoma doprinosi boljem razumevanju mehanizama ekspresije gena, njihove evolucije i adaptacije u domaćinu. Pojam upotrebe kodona se odnosi na razlike u učestalosti pojavljivanja sinonimnih kodona aminokiselina tokom translacije proteina. Polimorfizam u genomskom sastavu se ogleda u obrascima upotrebe sinonimnih kodona i aminokiselina, kao i u brzini translacije (gde se pretpostavlja da se retki kodoni prevode sporije od optimalnih kodona). Isto važi i za specifične kodirajuće sekvence i odgovarajuće tipove proteina.
Istraživanje je rađeno na skupu podataka izolata za SARS-CoV-2 i kodirajućih sekvenci njihovih proteina koji je raspoloživ na NCBI (https://www.ncbi.nlm.nih.gov/sars-cov-2/). Podaci su preprocesirani radi uklanjanja instanci sa nedostajućim vrednostima, dvosmislenim slovima i kompletnim duplikatima, na kraju sa oko 347.000 kompletnih izolata i oko 2.450.000 kodirajućih sekvenci podeljenih u 12 glavnih proteinskih grupa. Izvršeno je poravnanje kodirajućih sekvenci kako bi se otkrilo da li postoji specifičnost upotrebe kodona za različite tipove proteina unutar virusnog genoma tokom pandemije. Kodirajuće sekvence proteina u svakoj grupi su poravnate sa odgovarajućim ORF-om iz referentnog SARS-CoV-2 genoma (NC_045512.2). Analizirana je promena frekvencija pojavljivanja G, A, T i C nukleotida na prvoj, drugoj i trećoj poziciji u kodonu, kao i njihov uticaj na upotrebu kodona.
Na osnovu upotrebe kodona izvršena je i klaster analiza svih kodirajućih sekvenci iz skupa podataka. Rezultati grupisanja uključuju 12 klastera koji sadrže skoro idealno razdvojene tipove proteina. Ovo se može koristiti kao argument da specifični tipovi proteina imaju svoje specifične obrasce upotrebe kodona koji se zatim mogu koristiti za izgradnju modela klasifikacije proteina. Osim modela klasifikacije zasnovanog na grupisanju proteina posmatrano je i grupisanje virusnih izolata praćenjem dinamike obrazaca upotrebe kodona u funkciji vremena tokom pandemije.

Utorak, 14.12.2021. u 14:15, Online
Miloš Kotlar, Elektrotehnički fakultet u Beogradu
DETEKCIJA ANOMALIJA KORIŠĆENJEM META PODATAKA U AUTOMATIZOVANIM SISTEMIMA ZA MAŠINSKO UČENJE
Generisanje velike količine podataka uslovljeno razvojem krajnjih uređaja (eng. Edge Devices) i internet stvari (eng. Internet of Things) dovelo je do ubrzanog razvoja tehnologije i algoritama za mašinsko učenje koji se koriste u sistemima za analizu i obradu podataka. Sa velikom količinom podataka u sistemima za njihovu analizu i obradu, zasnovanim na algoritmima za mašinsko učenje, performanse sistema isključivo zavise od kvaliteta podataka, odabranog modela i parametara modela. Anomalije u podacima predstavljaju instance koje se razlikuju od distribucije podataka, utiču na kvalitet podataka i mogu da se detektuju korišćenjem algoritama za mašinsko učenje. Predlog modela i parametara modela za detekciju anomalija isključivo zavisi od ekspertize kreatora sistema ili domenskog eksperta. U slučajevima kada ne postoji uzorak podataka sa obeleženim anomalijama, što je čest slučaj u podacima iz realnog sveta, predlog modela za detekciju anomalija nije trivijalan. Predlog modela za detekciju anomalija se može automatizovati, pri čemu takav sistem za automatizovano mašinsko učenje (eng. AutoML) predlaže model za detekciju anomalija u podacima na osnovu podataka, meta podataka, odgovarajuće optimitacione metrike i prethodno stečenog znanja. Kako bi se omogućila implementacija automatizovanog sistema za detekciju anomalija, potrebno je definisati skup funkcija za izračunavanje meta podataka koji će se koristiti za predlaganje modela za odgovarajuću optimizacionu metriku.
Ideja je da se sistem za izračunavanje meta podataka zasniva na funkcijama koje koriste domensko znanje. Podrazumeva se da se za detekciju anomalija koriste postojeći algoritmi, tako da se problem svodi na kreiranje skupa funkcija za izračunavanje meta podataka koji će karaterizovati anomalije u podacima. Korišćenjem funkcija koje koriste domensko znanje, kreator podataka ili domenski ekspert će biti u mogućnosti da izračuna meta podatke u slučajevima kada ne postoji uzorak podataka sa obeleženim anomalijama. Prethodna istraživanja su pokazala da je detekcija anomalija zastupljena u različitim oblastima i za različite tipove podataka, tako da navedeni aspekti treba da budu posebno analizirani za različite tipove lokaliteta i različite dimenzionalne prostore anomalija. Kako se u automatizovanim sistemima za mašinsko učenje koriste funkcije koje mere udaljenost između skupova podataka na osnovu meta podataka, ideja je da se uradi evaluacija postojećih i predlog novih funkcija za merenje udaljenosti između meta podataka kako bi se pokazalo koji tip funkcija za merenje udaljenosti daje dobre rezultate za predloženi skup meta podataka. Takođe, biće analizirana efikasnost sistema na različitim arhitekturama i mestima izvršavanja kako bi se pokazalo u kojim okruženjima predloženo rešenje može da se implementira i pod kojim uslovima.

Utorak, 21.12.2021. u 14:15, Live stream Niš
Nenad Gligorić, IOTA Foundation
BLOCKCHAIN TECHNOLOGY FOR SUSTAINABLE DIGITAL MINES OF THE FUTURE
The mining industry, which dates back thousands of years, has provided the world with the raw materials needed to develop economies and communities. With the rise of key enabling technologies and rapidly increasing demands for raw materials, mining is embarking on a path towards digital transformation. The EU-funded Dig\_IT is addressing the needs of the mining industry to move towards a human-centred, environmentally oriented and society-driven approach. To improve the efficiency and sustainability of mining operations by connecting cyber and physical systems, the data-driven services collecting data from sensors (human, assets, and environment) are integrated with the Blockchain technology.

Utorak, 28.11.2021. u 14:15, Online
Miljan Djordjević, Elektrotehnički fakultet u Beogradu
DA LI ĆE DEEPFAKE-ovi PROMENITI NAČIN NA KOJI POSMATRAMO TEHNOLOGIJU?
Skorije osvešćavanje po pitanju uloge internet algoritama pretrage na širenje lažnih vesti i teorija zavere uzrokuju migracije korisnika sa platformi tehnoloških džinova na nove alternative. Ovaj trend se primećuje kod 'non open-source' servisa kompanija poput Google-a, Facebook-a, Amazon-a i sličnih. Deepfake-ovi su relativno nov način za lažiranje audio/video sadržaja, koji prethodno skup i dug proces čine trivijalnim. Sa napretkom algoritama mašinskog učenja koji stoje iza Deepfake-ova, lažirani audio/video materijali polako se bliže nivou na kome se ne mogu razlikovati od originala. Da li će kombinacija ova dva trenda uzrokovati promenu načina na koji posmatramo internet (tehnologiju generalno) i kako?

RUKOVODIOCI SEMINARA
MI SANU
Vera Kovačević-Vujčić
Milan Dražić

FON
Zorica Bogdanovic
Marijana Despotovic-Zrakic

IEEE
Bozidar Radenkovic