Corpus de rap
Structure
Stockage des données dans le système informatique de l'UM
Data_FR písně - stockage de données pour les différents formats de chansons (découpages de paroles, textes océrisés, comparaison de la version écrite avec la version chantée, texte brut, verticale enrichie)
Data_FR alba - stockage de données pour les différentes parties des albums (couvertures, scans d'albums, musique)
Data_FR skupina/interpret - stockage de données pour les sources concernant les groupes et les artistes (coupures de photos d'albums, captures de pages web avec les métadonnées, paroles publiées en dehors des CD, éventuellement notre communication avec les rappeurs).
Forum
– fils de discussion mais surtout informations sur les changements de codes, nécessaires pour la révision à rebours.
Tableaux sur Google
Liste des albums
RapCor - albums – inventaire de nouveaux albums (codage chronologique).
Liste des chansons et de leurs interprètes
RAPCOR - les codes et les sources de données pour les chansons traitées (Bibliothèque) et une vue d'ensemble des métadonnées des artistes et des groupes, y compris les sources (Métadonnées, ressources pour les interprètes solo, ressources pour les groupes)
Aperçu des travaux en cours pour les différents codes
Des informations sur les avancées des travaux (par code et par format) sur la qualité de ceux-ci. Inventaire des chansons
Aperçu de l'ordre chronologique des chansons dans l'œuvre de l'auteur
Ajout des codes des chansons via les tracklists (listes des chansons) des albums pour chaque artiste répertorié dans le document. Tracklists des albums.
Portail du projet collaboratif avec le Centre du traitement du langage naturel de la Faculté d'Informatique de l'UM
Projet RapCor – recherche automatique des textes sur Internet, entraînement d'étiquetteurs, inventaires des albums, albums recherchés, tableau de codes utilisés et disponibles.