Vyhledejte paralogy (dalsi podobne sekvence v ATH1.fa) s rozumnou delkou a procentem identity/podobnosti.
Dohledejte ortology v Uniprot (k nahodne vybrane sekvenci, pripadne k zastupci z PDB) tak, aby vseho vsudy bylo 10-15 podobnych sekvenci k analyze.
Sekvence vicenasobne zarovnejte
(CLUSTAL Omega, Muscle, Mafft), sekvence by se meli "rozumne" zarovnat.
Pokud ne, mohl blast najit prilis lokalni podobnosti a je potreba,
hlavne u vicedomenovych proteinu nepodobne casti v sekvencich ignorovat
(napr. editaci FASTA souboru).