👷 Introduction to Information Retrieval
Index compression, and scoring, term weighting and the vector space model 8. 3. 2023
Lecture
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/jaro2023/PV211/um/2023-p05comp.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/jaro2023/PV211/um/2023-p06score.pdf
Readings
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/jaro2023/PV211/um/readings/05comp.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/jaro2023/PV211/um/readings/06vect.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/jaro2023/PV211/um/readings/lecture6-tfidf-1per.pdf
Soft Cosine Similarity
A tutorial for computing the soft cosine similarity measure between two documents in Python.
Seminar
Index compression and scoring, term weighting, and the vector space model
Exercise solution for seminars in the fourth week
Index compression
Google Colaboratory code for seminars in the fourth week
Scoring, term weighting, and the vector space model
Google Colaboratory code for seminars in the fourth week
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/jaro2023/PV211/um/whiteboards/
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/jaro2023/PV211/um/whiteboards/spring_2021/seminar01/week04/Notes_for_week_4.pdf
First term project
Below, you can find the homework vaults for submitting the first term project.
First term project assignment
Google Colaboratory code for the first term project
First term project leaderboard
Google Spreadsheet leaderboard for the first term project
Gensim: Topic Modeling for Humans
Core Tutorials: New Users Start Here!
First term project (seminar group 01)
Homework vault for the first term project (a ranked unsupervised retrieval system for Cranfield collection).
First term project (seminar group 02)
Homework vault for the first term project (a ranked unsupervised retrieval system for Cranfield collection).