GENSCAN 1.0	Date run: 16-Jan-104	Time: 10:55:14

Sequence UGT2B7_1 : 18879 bp : 33.29% C+G : Isochore 1 ( 0 - 43 C+G%)

Parameter matrix: HumanIso.smat

Predicted genes/exons:

Gn.Ex Type S .Begin ...End .Len Fr Ph I/Ac Do/T CodRg P.... Tscr..
----- ---- - ------ ------ ---- -- -- ---- ---- ----- ----- ------

 1.01 Init +   1215   1935  721  2  1   63   97   206 0.971  14.05
atttaccttcatttgtctctttgccatccacatgctcagactgttgatttaatgatattg
tatgtactttgacttataagggttacattttaacttcttggctaatttatctttggacat
aaccatgagaaatgacagaaaggaacagcaactggaaaacaagcattgcattgcaccagg
ATGTCTGTGAAATGGACTTCAGTAATTTTGCTAATACAACTGAGCTTTTGCTTTAGCTCT
GGGAATTGTGGAAAGGTGCTGGTGTGGGCAGCAGAATACAGCCATTGGATGAATATAAAG
ACAATCCTGGATGAGCTTATTCAGAGAGGTCATGAGGTGACTGTACTGGCATCTTCAGCT
TCCATTCTTTTTGATCCCAACAACTCATCCGCTCTTAAAATTGAAATTTATCCCACATCT
TTAACTAAAACTGAGTTGGAGAATTTCATCATGCAACAGATTAAGAGATGGTCAGACCTT
CCAAAAGATACATTTTGGTTATATTTTTCACAAGTACAGGAAATCATGTCAATATTTGGT
GACATAACTAGAAAGTTCTGTAAAGATGTAGTTTCAAATAAGAAATTTATGAAAAAAGTA
CAAGAGTCAAGATTTGACGTCATTTTTGCAGATGCTATTTTTCCCTGTAGTGAGCTGCTG
GCTGAGCTATTTAACATACCCTTTGTGTACAGTCTCAGCTTCTCTCCTGGCTACACTTTT
GAAAAGCATAGTGGAGGATTTATTTTCCCTCCTTCCTACGTACCTGTTGTTATGTCAGAA
TTAACTGATCAAATGACTTTCATGGAGAGGGTAAAAAATATGATCTATGTGCTTTACTTT
GACTTTTGGTTCGAAATATTTGACATGAAGAAGTGGGATCAGTTTTATAGTGAAGTTCTA
G
gtaagtatttttttcaatcagtaacatgaagctctaacttatttgtgtctttgaagcaga
gcttatataaagccataaagtcagggtagtggggttttggtaagtgaatttataaaacaa
aaatacaagatgatctattaatctcacaaatattatagaaaagcttaaattacagggtca

 1.02 Intr +   3234   3382  149  1  2   88   92   111 0.999  10.53
acatgggcaaaatatgtaatacataaaattaaattatatctatatatgaatatgtgtata
tatttttcaaagcacagatatttgcctacatttttgcctacattattctaacccctttca
gaaatttacctaaagtaattatcttgtgtcatccaccttttttttttctattcctgtcag
GAAGACCCACTACATTATCTGAGACAATGGGGAAAGCTGACGTATGGCTTATTCGAAACT
CCTGGAATTTTCAGTTTCCATATCCACTCTTACCAAATGTTGATTTTGTTGGAGGACTCC
ACTGCAAACCTGCCAAACCCCTGCCTAAG
gtaaacatacttttgttggttttattttgttggctttgaattttcagtagaaatgattct
atagtcttctttcagagtgtttgacttacactgaaagaaagatgggaaatgggtggggta
aagcagataccaattagaaactcatgtgcacgttaataccatcacacgtatatgagtttt

 1.03 Intr +   6108   6203   96  2  0   68   38    89 0.693   1.19
gtgtcacatgtgtacattgagctatgtaaataggacaaaagccatgatgaaaaaatatat
tttacataaataatatcacaacataaaaattttagaaaaattttatttaaaaaaattttt
ttcatgcttttataaaatttcttacattaatcttatattatttttattatgttatcacag
AAGAAGAAACAACCAGTCCATATCAGTGATGAATCTGTAAAGAGGCTCGATTCCTTCAAC
ACTGGGTGGATAAATAAGGCTCTGGGCATCAAGCTA
gtgagatgaaacactgaacaccagttacattaaatatggctacaggcaactgcaatcaca
cgcaatacctagatgccccaagtattacctggaatagcagtacaatgactctcatgttaa
gattaaaaatcatattttaaaaaaacactctgtaatatgtggtctgcagagttaacattt

 1.04 Intr +   7501   7632  132  0  0   95  116   114 0.996  14.82
tctcatattatacatctacttgcaaaaaaactgagtgattgggtcagttaaaaaatatta
tttactccaataattcctcaaaatactggattttctctctttagtaatttgcaccaattc
ttttggtagtgcccgctgtgctaatactcttttgtgatgaagcaaattctttcttcacag
GAAATGGAAGACTTTGTACAGAGCTCTGGAGAAAATGGTGTTGTGGTGTTTTCTCTGGGG
TCAATGGTCAGTAACATGACAGAAGAAAGGGCCAACGTAATTGCATCAGCCCTGGCCCAG
ATCCCACAAAAG
gtaagatgaagtgccttactggtgtggaaaactactgaaagaggctgttaaagtttgaag
taatccaattatagaaacttctgataaatgtgaagttgaccaaaagttgaaaaattagaa
caaggataatcttggagaaactatgagaagtttgaaaattgtggttgcatttttttttaa

 1.05 Intr +  11869  11956   88  0  1   76   82    27 0.956  -0.48
atatacctaactaattataaaagttgagaaaattaatgtgagtattctatttacattagt
ctttgagtagttcttatttactaacatcccttgatctcattcctactctttatacagttc
tcacattctataacttttgaattccactcatggaataaaatattttctttattgtaacag
GTTCTGTGGAGATTTGATGGGAATAAACCAGATACCTTAGGTCTCAATACTCGGCTCTAC
AAGTGGATACCCCAGAATGACCTTCTAG
gtaagactctggtgaacaaatactgaatatattagtaacagcacattagagtgttaatag
ttcatcatgaaacaagcttattgaatatttgttaaggaaaaacaaaatgtaacttcttta
tattgattttccagtcttaagggagaaagaatacattataatttttggcattttatgata

 1.06 Intr +  12797  13016  220  0  1   51   69   228 0.965  13.64
caccgtatagccttcagttacatacccagtacaagtacgtgttttttcctccgaagtctg
aaacacaattttaatttagttcagtgttttagctggaaaacactgtcactttcagagcct
ttcattgtgcatctcattttattcctatgagtaattttgctaaaattcatccaatcctag
GTCATCCAAAGACCAGAGCTTTTATAACTCATGGTGGAGCCAATGGCATCTACGAGGCAA
TCTACCATGGGATCCCTATGGTGGGGATTCCATTGTTTGCCGATCAACCTGATAACATTG
CTCACATGAAGGCCAGGGGAGCAGCTGTTAGAGTGGACTTCAACACAATGTCGAGTACAG
ACTTGCTGAATGCATTGAAGAGAGTAATTAATGATCCTTC
gtgagtagaacaatatttttcactaggtggtatttacagatagcttctcttgtcaatagt
gagtgtgagtttcatcctttttataagagactaattttgaaagaatttaaatgatttaac
caatctgaaatctgcttttatttttataagttatttaaaaattgaatttgaaacacatac

 1.07 Intr +  17151  17334  184  0  1  103   30   243 0.209  18.87
cttagagttgtgagcccttaaaagggacaggaattgctcactcagggagttcagctcttg
agagaggagtcttgccgatgctcccagccgaataaaacccttccttctttaactcggtgt
ctgaggggttttgtctgtaactcttcctgctacattactgtctttatttttatctttcag
ATATAAAGAGAATGTTATGAAATTATCAAGAATTCAACATGATCAACCAGTGAAGCCCCT
GGATCGAGCAGTCTTCTGGATTGAATTTGTCATGCGCCACAAAGGAGCTAAACACCTTCG
GGTTGCAGCCCACGACCTCACCTGGTTCCAGTACCACTCTTTGGATGTGATTGGGTTCCT
GCTG
gtctgtgtggcaactgtgatatttatcgtcacaaaatgttgtctgttttgtttctggaag
tttgctagaaaagcaaagaagggaaaaaatgattagttatatctgagatttgaagctgga
aaacctgataggtgagactacttcagtttattccagcaagaaagattgtgatgcaagatt

Predicted peptide sequence(s):


>UGT2B7_1|GENSCAN_predicted_peptide_1|530_aa
MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG
DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF
EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL
GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKKKKQPVHISD
ESVKRLDSFNTGWINKALGIKLEMEDFVQSSGENGVVVFSLGSMVSNMTEERANVIASAL
AQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQNDLLGHPKTRAFITHGGANGIYEAIYHGI
PMVGIPLFADQPDNIAHMKARGAAVRVDFNTMSSTDLLNALKRVINDPSYKENVMKLSRI
QHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAAHDLTWFQYHSLDVIGFLL