O algoritmo, de forma increme ntal, realiza a jun¸c˜ao dos runs do in´ıcio para o final dos
proteomas, ou seja, uma regi˜ao ort´ologa resultante da uni˜ao de runs pr´oximos poder´a ser
unida com o pr´oximo run `a direita. A complexidade de tempo do algoritmo, no pior caso
´e O(|LR|
2
), onde |LR| ´e o n´umero de runs na lista LR. O pior caso do pesudo-algoritmo
ocorre quando todos os runs n˜ao passarem na regra de distˆancia, definida anteriormente.
Segundo Almeida, poderemos ter uma situa¸c˜ao onde um run est´a pr´oximo a um match
isolado, e ambos n˜ao podem ser juntados se estiverem isolados no decorrer do proteoma.
Essa jun¸c˜ao pode ser importante, pois po der´a gerar uma regi˜ao com 3 ou mais matches.
Para esses casos, permitiremos que o run possa ser juntado com o match se este match
contribuir significativamente para a regi˜ao, ou seja, se o match for BBH e obedecer a regra
de distˆancia em rela¸c˜ao ao run. Logo, consideramos um BBH isolado como um run.
egg mostra as regi˜oes ort´ologas encontradas em um arquivo texto. Na Figura 3.8 temos
um trecho do arquivo texto da Regi˜ao Ort˜ologa resultante da compara¸c˜ao entre Xylella
fastidiosa 9a5c e Neisseria meningitidis MC58. Maiores detalhes sobre o arquivo de texto
podem ser vistos no Apˆendice A.
>XFNMB20060710-26-Rc
7 matches
7kb in XF - 10kb in NMB
=====================================================================
Gene Synonym (XF) gi size product
=====================================================================
+_ XF0736 15837338 635aa threonyl-tRNA synthetase
+infC XF0737 15837339 159aa translation initiation factor IF-3
+_ XF0738 15837340 31aa hypothetical protein
+rpmI XF0739 15837341 65aa 50S ribosomal protein L35
+_ XF0740 15837342 119aa 50S ribosomal protein L20
+pheS XF0741 15837343 333aa phenylalanyl-tRNA synthetase alpha subunit
+pheT XF0742 15837344 792aa phenylalanyl-tRNA synthetase beta subunit
+_ XF0743 15837345 99aa integration host factor alpha subunit
=====================================================================
Gene Synonym (NMB) gi size product
=====================================================================
+thrS NMB0720 15676618 637aa threonyl-tRNA synthetase
+infC NMB0721 15676619 155aa translation initiation factor 3
+rpmI NMB0722 15676620 65aa 50S ribosomal protein L35
+rplT NMB0723 15676621 119aa 50S ribosomal protein L20
+pheS NMB0724 15676622 330aa phenylalanyl-tRNA synthetase alpha subunit
+_ NMB0725 15676623 352aa modification methylase HgaI-1
+_ NMB0726 15676624 489aa type II restriction enzyme HgaI
+_ NMB0727 15676625 216aa N-6 adenine-specific DNA methylase
+phe NMB0728 15676626 787aa phenylala nyl- tRNA synthetase beta subunit
+himA NMB0729 15676627 100aa integration host factor, alpha subunit
=======
matches
=======
===============================================================================================
Gene Synonym start size e-value [ best hit ] product
===============================================================================================
+_ XF0743 698556 99 1e-27 [best ] integration host factor alpha subunit
+himA NMB0729 761371 100 2e-27 [best ] integration host factor, alpha subunit
------------------------------------------
+pheT XF0742 696154 792 1e-151 [best ] phenylalanyl tRNA synthetase beta subunit
+pheT NMB0728 758934 787 1e-150 [best ] phenylalanyl tRNA synthetase beta subunit
------------------------------------------
+pheS XF0741 695069 333 1e-104 [best ] phenylalanyl tRNA synthetase alpha subunit
+pheS NMB0724 754557 330 2e-88 [best ] phenylalanyl tRNA synthetase alpha subunit
------------------------------------------
+_ XF0740 694438 119 2e-40 [best ] 50S ribosomal protein L20
+rplT NMB0723 753852 119 1e-35 [best ] 50S ribosomal protein L20
------------------------------------------
+rpmI XF0739 694230 65 2e-12 [best ] 50S ribosomal protein L35
+rpmI NMB0722 753642 65 3e-12 [best ] 50S ribosomal protein L35
------------------------------------------
+infC XF0737 693490 159 2e-47 [best ] translation initiation factor IF 3
+infC NMB0721 753028 155 3e-55 [best ] translation initiation factor 3
------------------------------------------
+_ XF0736 691467 635 0 [best ] threonyl tRNA synthetase
+thrS NMB0720 751043 637 0 [best ] threonyl tRNA synthetase
------------------------------------------
Figura 3.8: Exemplo de uma RO entre Xylella fastidiosa 9a5c e Neisseria meningitidis
MC58.
27