Učni načrt predmeta

Predmet:
Računalniško podprto odkrivanje znanstvenih zakonitosti in e-znanost
Course:
Computational Scientific Discovery and e-Science
Študijski program in stopnja /
Study programme and level
Študijska smer /
Study field
Letnik /
Academic year
Semester /
Semester
Informacijske in komunikacijske tehnologije, 2. stopnja Tehnologije znanja 1 2
Information and Communication Technologies, 2nd cycle Knowledge Technologies 1 2
Vrsta predmeta / Course type
Izbirni / Elective
Univerzitetna koda predmeta / University course code:
IKT2-709
Predavanja
Lectures
Seminar
Seminar
Vaje
Tutorial
Klinične vaje
work
Druge oblike
študija
Samost. delo
Individ. work
ECTS
30 30 30 210 10

*Navedena porazdelitev ur velja, če je vpisanih vsaj 15 študentov. Drugače se obseg izvedbe kontaktnih ur sorazmerno zmanjša in prenese v samostojno delo. / This distribution of hours is valid if at least 15 students are enrolled. Otherwise the contact hours are linearly reduced and transfered to individual work.

Nosilec predmeta / Course leader:
prof. dr. Sašo Džeroski
Sodelavci / Lecturers:
Jeziki / Languages:
Predavanja / Lectures:
Slovenščina, angleščina / Slovenian, English
Vaje / Tutorial:
Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti:
Prerequisites:

Zaključena prva stopnja bolonjskega študija. Potrebna so tudi osnovna znanja matematike, računalništva in informatike.

Completed Bologna first-cycle undergraduate education. Basic knowledge of mathematics, computer science and informatics is also requested.

Vsebina:
Content (Syllabus outline):

1) Znanstvena metoda
Strukture znanstvenega védenja, znanstvene aktivnosti in procesi.

2) Računalniško podprto odkrivanje znanstvenih zakonitosti
Uvod, zgodovinski razvoj področja, osnovne metode, npr. odkrivanje enačb, omrežij in poti, induktivno modeliranje procesov.

3) Rudarjenje znanstvenih podatkov
Posebne zahteve pri rudarjenju znanstvenih podatkov v primerjavi z rudarjenjem poslovnih, finančnih, prodajnih podatkov; induktivne baze podatkov.

4) Aplikacije v znanostih o okolju
Modeliranje habitatov in populacijske dinamike.

5) Aplikacije v znanostih o življenju
Aplikacije v bioinformatiki, biomedicini in
sistemski biologiji, npr. napovedovanje
funkcije genov, odkrivanje metaboličnih in
regulacijskih poti.

6) Uvod v e-znanosti
Grid, diagrami poteka, semantični
splet/Grid, znanstvene ontologije.

1) The scientific method
Scientific knowledge structures, scientific activities/processes.

2) Computational scientific discovery
Introduction, history of development of the area, basic methods, e.g., equation discovery, discovering networks, discovering pathways, inductive process modelling.

3) Mining scientific data
Specific requirements for mining scientific data vs. data mining in business, finance, retail.

4) Applications in Environmental Sciences
Habitat modeling, modeling population dynamics.

5) Applications in Life Sciences
Applications in bioinformatics, biomedicine,
and systems biology, e.g., predicting gene function, discovering metabolic and regulation pathways.

6) Introduction to e-Science
The Grid, work-flows, semantic web/Grid, scientific ontologies.

Temeljna literatura in viri / Readings:

Džeroski, S, and Todorovski, L. (Eds.) Computational Discovery of Scientific Knowledge. Springer, 2007. ISBN 978-3-540-73919-7.
Hey, T., Tansley, S., and Tolle, K. (Eds.) The Fourth Paradigm: Data-Intensive Scientific Discovery. Microsoft Research, 2009. ISBN 978-0-982-54420-4.
Gaber, M. (Ed.) Scientific Data Mining and Knowledge Discovery: Principles and Foundations. Springer, 2010. ISBN 978-3-642-02787-1.
Yang, X., Wang, L., and Jie, W. (Eds.) Guide to e-Science: Next Generation Scientific Research and Discovery. Springer, 2011. ISBN 978-0-857-29438-8.Critchlow, T. and Kleese van Dam, K. (Eds.) Data-Intensive Science. Chapman & Hall/CRC Computational Science, 2013. ISBN 978-1-439-88139-2.
Mobus, G.E. and Kalton, M.C. Principles of Systems Science. Springer, 2015. ISBN 978-1-493-91919-2.

Cilji in kompetence:
Objectives and competences:

Cilj predmeta je seznaniti študenta s področjem računalniško podprtega odkrivanja znanstvenih zakonitosti oz. z računalniškimi postopki za avtomatizacijo ali podporo glavnih vidikov odkrivanja znanstvenih zakonitosti. Na začetku bodo obdelani osnovni koncepti vključno z znanstveno metodo in elementi znanstvenega obnašanja, ki vsebujejo strukture znanstvenega védenja kot tudi aktivnosti za generiranje in upravljanje s temi strukturami. Predstavljen bo zgodovinski razvoj področja in obravnavana bo povezava z novejšimi trendi razvoja, kot je na primer rudarjenje znanstvenih podatkov. Predmet bo pokril vrsto tehnik, kot tudi njihovih aplikacij na področju znanosti o okolju (ekologija) in znanosti o življenju (bioinformatika).

Študenti bodo pridobili osnovno razumevanje struktur znanstvenega vedenja in z njimi povezanih aktivnosti, kot tudi računalniških metod za njihovo podporo in avtomatizacijo.

The goal of the course is to familiarize the student with the field of computational scientific discovery, i.e., with computational approaches to automating or supporting crucial aspects of scientific discovery. Basic concepts will be covered first, including the scientific method and the elements of scientific behavior, which include scientific knowledge structures, as well as scientific activities that generate and manipulate these structures. The history of the development of the field will be presented and its relation to recent developments such as mining scientific data will be discussed. A range of techniques will be covered, as well as their applications in environmental sciences (ecology) and life sciences (bioinformatics).

The students will acquire a basic understanding of scientific knowledge structures and activities, as well as computer methods to support their automation.

Predvideni študijski rezultati:
Intendeded learning outcomes:

Študent, ki bo uspešno končal ta predmet, bo pridobil znanje in razumevanje:

Splošne kompetence:
- znanstvena metoda
- strukture znanstvenega védenja, kot so taksonomije, znanstveni zakoni in teorije
- znanstvene aktivnosti, kot na primer snovanje in revizija taksonomij, zakonov in teorij
- zmožnost komunikacije znanstvenega védenja preko člankov in prezentacij
- osnovni koncepti mreže, semantičnega spleta in e-znanosti

Predmetnospecifične kompetence:
- zgodovina razvoja področja računalniško podprtega odkrivanja znanstvenih zakonitosti
- osnovni procesi klasičnega in računalniško podprtega odkrivanja znanstvenih zakonitosti
- pregled obstoječih nalog in metod računalniško podprtega odkrivanja znanstvenih zakonitosti
- sposobnost uporabe obstoječih metod na novih problemih računalniško podprtega odkrivanja znanstvenih zakonitosti
- sposobnost ugotavljanja primernosti metod podatkovnega rudarjenja ali računalniško podprtega odkrivanja znanstvenih zakonitosti za analizo znanstvenih podatkov
- sposobnost postavljanja novih nalog računalniško podprtega odkrivanja znanstvenih zakonitosti ter zasnova in implementacija metod za njihovo reševanje

Knowledge and Understanding: A student who completes this course successfully will know and understand:

General Competences:
- The scientific method
- Scientific knowledge structures, such as taxonomies, laws and theories
- Scientific activities, such as the formation/revision of taxonomies, laws and theories
- Communicability of scientific knowledge and the capability therefore
- Basic concepts of The Grid, The Semantic Web and e-Science

Course Specific Competences:
- History of development of computational scientific discovery
- Basic processes of scientific discovery and computational scientific discovery
- Overview of existing tasks and methods of computational scientific discovery
- The ability to apply existing methods to new problems of computational scientific discovery
- The ability to identify whether data mining or computational scientific discovery methods are needed to analyse scientific data
- The ability to formulate new tasks of computational scientific discovery and to initiate the design/implementation of methods to solve such problems

Metode poučevanja in učenja:
Learning and teaching methods:

Predavanja, seminar, konzultacije, individualno
delo.

Lectures, seminar, consultations, individual work.

Načini ocenjevanja:
Delež v % / Weight in %
Assesment:
Seminar
50 %
Seminar
Ustni izpit
50 %
Oral exam
Reference nosilca / Lecturer's references:
1. N Omejc, B Gec, J Brence, L Todorovski, S Džeroski (2024) Probabilistic grammars for modeling dynamical systems from coarse, noisy, and partial data. Machine Learning, DOI: 10.1007/s10994-024-06522-1
2. M Petković, L Lucas, J Levatić, M Breskvar, T Stepišnik, A Kostovska, P Panov, A Osojnik, R Boumghar, JA Martínez-Heras, J Godfrey, A Donati, S Džeroski, N Simidjievski, B Ženko, D Kocev (2022) Machine-learning ready data on the thermal power consumption of the Mars Express spacecraft. Scientific Data 9, 229, DOI: 10.1038/s41597-022-01336-z
3. A Kostovska, J Bogatinovski, S Džeroski, D Kocev, P Panov (2022) A catalogue with semantic annotations makes multilabel datasets FAIR. Scientific Reports 12, 7267, DOI: 10.1038/s41598-022-11316-3
4. J Bogatinovski, L Todorovski, S Džeroski, D Kocev (2022) Comprehensive comparative study of multi-label classification methods. Expert Systems with Applications 203, 117215, DOI: 10.1016/j.eswa.2022.117215
5. M Petković, S Džeroski, D Kocev (2020) Multi-label feature ranking with ensemble methods. Machine Learning 109, 2141-2159, DOI: 10.1007/s10994-020-05908-1