FI:PV211 Information Retrieval - Informace o předmětu
PV211 Introduction to Information Retrieval
Fakulta informatikyjaro 2024
- Rozsah
- 2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
- Vyučující
- doc. RNDr. Petr Sojka, Ph.D. (přednášející)
Mgr. Marek Toma (cvičící)
Ing. Martin Fajčík (cvičící)
Santosh Kesiraju, Ph.D. (cvičící)
Mgr. Šárka Ščavnická (cvičící)
Mgr. Michal Štefánik (pomocník)
RNDr. Viktória Spišaková (pomocník)
Mgr. Tereza Vrabcová (pomocník)
Mgr. Marek Kadlčík (pomocník) - Garance
- doc. RNDr. Petr Sojka, Ph.D.
Katedra vizuální informatiky – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Petr Sojka, Ph.D.
Dodavatelské pracoviště: Katedra vizuální informatiky – Fakulta informatiky - Rozvrh
- St 12:00–13:50 D2, kromě St 17. 4. ; a St 17. 4. 12:00–13:50 B517
- Rozvrh seminárních/paralelních skupin:
PV211/02: Čt 13:00–13:50 B011, M. Fajčík, S. Kesiraju, Š. Ščavnická, M. Štefánik, M. Toma - Předpoklady
- SOUHLAS
As the main teacher will take a sabbatical in Spring 2024, this year's lectures will be [partly] substituted by previous year's recordings and invited lectures. Enrollment will be limited (SOUHLAS needed) with preference given to UMI students. Curiosity and motivation to retrieve information about information retrieval. Chapters 1--5 benefit from a basic course on algorithms and data structures. Chapters 6--7 need in addition linear algebra, vectors, and dot products. For Chapters 11--13 basic probability notions are needed. Chapters 18--21 demand course in linear algebra, notions of matrix rank, eigenvalues, and eigenvectors. - Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Analýza a zpracování obrazu (program FI, N-VIZ)
- Aplikovaná informatika (program FI, B-AP)
- Aplikovaná informatika (program FI, N-AP)
- Bezpečnost informačních technologií (angl.) (program FI, N-IN)
- Bezpečnost informačních technologií (program FI, N-IN)
- Bioinformatika a systémová biologie (program FI, N-UIZD)
- Bioinformatika (program FI, B-AP)
- Bioinformatika (program FI, N-AP)
- Computer Games Development (program FI, N-VIZ_A)
- Computer Graphics and Visualisation (program FI, N-VIZ_A)
- Computer Networks and Communications (program FI, N-PSKB_A)
- Cybersecurity Management (program FI, N-RSSS_A)
- Formální analýza počítačových systémů (program FI, N-TEI)
- Grafický design (program FI, N-VIZ)
- Graphic Design (program FI, N-VIZ_A)
- Hardware Systems (program FI, N-PSKB_A)
- Hardwarové systémy (program FI, N-PSKB)
- Image Processing and Analysis (program FI, N-VIZ_A)
- Informační bezpečnost (program FI, N-PSKB)
- Informační systémy (program FI, N-IN)
- Informatika a druhý obor (program FI, B-EB)
- Informatika a druhý obor (program FI, B-FY)
- Informatika a druhý obor (program FI, B-GE)
- Informatika a druhý obor (program FI, B-GK)
- Informatika a druhý obor (program FI, B-CH)
- Informatika a druhý obor (program FI, B-IO)
- Informatika a druhý obor (program FI, B-MA)
- Informatika a druhý obor (program FI, B-TV)
- Informatika (program FI, B-INF) (2)
- Informatika ve vzdělávání (program FI, B-IVV) (2)
- Information Security (program FI, N-PSKB_A)
- Kvantové a jiné neklasické výpočetní modely (program FI, N-TEI)
- Matematická informatika (program FI, B-IN)
- Paralelní a distribuované systémy (program FI, B-IN)
- Paralelní a distribuované systémy (program FI, N-IN)
- Počítačová grafika a vizualizace (program FI, N-VIZ)
- Počítačová grafika a zpracování obrazu (program FI, B-IN)
- Počítačová grafika (program FI, N-IN)
- Počítačové sítě a komunikace (program FI, B-IN)
- Počítačové sítě a komunikace (program FI, N-IN)
- Počítačové sítě a komunikace (program FI, N-PSKB)
- Počítačové systémy a zpracování dat (program FI, B-IN)
- Počítačové systémy (program FI, N-IN)
- Principy programovacích jazyků (program FI, N-TEI)
- Programování a vývoj aplikací (program FI, B-PVA)
- Programovatelné technické struktury (angl.) (program FI, N-IN)
- Programovatelné technické struktury (program FI, B-IN)
- Programovatelné technické struktury (program FI, N-IN)
- Řízení kyberbezpečnosti (program FI, N-RSSS)
- Řízení vývoje služeb (program FI, N-RSSS)
- Řízení vývoje softwarových systémů (program FI, N-RSSS)
- Services Development Management (program FI, N-RSSS_A)
- Služby - výzkum, řízení a inovace (angl.) (program FI, N-AP)
- Služby - výzkum, řízení a inovace (program FI, N-AP)
- Sociální informatika (program FI, B-AP)
- Software Systems Development Management (program FI, N-RSSS_A)
- Software Systems (program FI, N-PSKB_A)
- Softwarové systémy (program FI, N-PSKB)
- Strojové učení a umělá inteligence (program FI, N-UIZD)
- Teoretická informatika (program FI, N-IN)
- Učitel informatiky a správce sítě (program FI, N-UCI)
- Učitelství informatiky pro střední školy (program FI, N-UCI) (2)
- Učitelství výpočetní techniky pro střední školy (program FI, N-SS) (2)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, B-IN)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, N-IN)
- Vývoj počítačových her (program FI, N-VIZ)
- Zpracování a analýza rozsáhlých dat (program FI, N-UIZD)
- Zpracování obrazu (program FI, N-AP)
- Zpracování přirozeného jazyka (program FI, N-UIZD)
- Cíle předmětu
- The main objectives of this course are to introduce principles of information retrieval and get acquainted with machine learning algorithms for NLP-based text processing.
- Výstupy z učení
- Students will understand document preprocessing, tokenization, lemmatization, indexing, and querying done on up to a web-scale (as Google does). First principles and algorithms of NLP-based text preprocessing, text semantic filtering and classification, and web searching needed for information systems and digital library design will be taught.
- Osnova
- Boolean retrieval; The term vocabulary and postings lists
- Dictionaries and tolerant retrieval
- Index construction, index compression
- Scoring, term weighting, and the vector space model
- Computing scores in a complete search system
- Evaluation in information retrieval
- Relevance feedback and query expansion
- XML/MathML retrieval
- Text classification with vector space model
- Machine learning and information retrieval
- Matrix decompositions and latent semantic indexing
- Web search basics
- Web crawling and indexes
- Link analysis, PageRank
- Invited lectures on hot topics, e.g. deep learning approaches to multilingual NLP and multimodal IR.
- Literatura
- povinná literatura
- MANNING, Christopher D., Prabhakar RAGHAVAN a Hinrich SCHÜTZE. Introduction to information retrieval. 1st pub. Cambridge: Cambridge University Press, 2008, xxi, 482. ISBN 9780521865715. info
- http://informationretrieval.org
- doporučená literatura
- BAEZA-YATES, R. a Berthier de Araújo Neto RIBEIRO. Modern information retrieval : the concepts and technology behind search. 2nd ed. Harlow: Pearson, 2011, xxx, 913. ISBN 9780321416919. info
- Výukové metody
- Student activities explicitly welcomed as a part of evaluation.
Mentoring rather than ex-cathedra lectures: ``The flipped classroom is a pedagogical model in which the typical lecture and homework elements of a course are reversed.''
Students will be expected to come prepared by reading the given materials in advance.
Contact hours will be devoted to a topically constrained discussion or to solving examples during exercises.
This will respect individual learning speed and students' apriori knowledge. Rich study materials are available:
MOOC, materials on http://web.stanford.edu/class/cs276/, including
the whole IIR book http://nlp.stanford.edu/IR-book/.
These teaching methods may be complemented by invited lectures of specialists from the IR community (researchers of Seznam, Facebook, RaRe Technologies, etc.). - Metody hodnocení
- Evaluation is based on the system that motivates students for continuous work during the semester and for active participation in the course.
The classification system is based on points achieved (100 pts). A student can get 60 pts during the term: 20 pts for each of two programming tasks, 12 pts for evaluation of your colleague's results, 8 pts for your activity during the term (lectures or discussion forums,...). 40 pts could be achieved in the final test (ROPOT in IS), consisting of multiple-choice questions (2x20 pts). In addition, one can get additional premium points based on activities during lectures, exercises (good answers) or negotiated related projects. Grading scale (adjustments based on ECTS suggestions) z/k[/E/D/C/B/A] corresponds approximately to 50/57/[64/71/78/85/92] points.
Dates of at least three terms of final exams will be announced via IS.muni.cz. - Vyučovací jazyk
- Angličtina
- Informace učitele
- https://www.fi.muni.cz/~sojka/PV211/
Materials will be posted and updated in the interactive syllabi https://is.muni.cz/auth/el/fi/jaro2024/PV211/index.qwarp. - Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (jaro 2024, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/jaro2024/PV211