GENSCAN 1.0 Date run: 16-Jan-104 Time: 10:55:14 Sequence UGT2B7_1 : 18879 bp : 33.29% C+G : Isochore 1 ( 0 - 43 C+G%) Parameter matrix: HumanIso.smat Predicted genes/exons: Gn.Ex Type S .Begin ...End .Len Fr Ph I/Ac Do/T CodRg P.... Tscr.. ----- ---- - ------ ------ ---- -- -- ---- ---- ----- ----- ------ 1.01 Init + 1215 1935 721 2 1 63 97 206 0.971 14.05 atttaccttcatttgtctctttgccatccacatgctcagactgttgatttaatgatattg tatgtactttgacttataagggttacattttaacttcttggctaatttatctttggacat aaccatgagaaatgacagaaaggaacagcaactggaaaacaagcattgcattgcaccagg ATGTCTGTGAAATGGACTTCAGTAATTTTGCTAATACAACTGAGCTTTTGCTTTAGCTCT GGGAATTGTGGAAAGGTGCTGGTGTGGGCAGCAGAATACAGCCATTGGATGAATATAAAG ACAATCCTGGATGAGCTTATTCAGAGAGGTCATGAGGTGACTGTACTGGCATCTTCAGCT TCCATTCTTTTTGATCCCAACAACTCATCCGCTCTTAAAATTGAAATTTATCCCACATCT TTAACTAAAACTGAGTTGGAGAATTTCATCATGCAACAGATTAAGAGATGGTCAGACCTT CCAAAAGATACATTTTGGTTATATTTTTCACAAGTACAGGAAATCATGTCAATATTTGGT GACATAACTAGAAAGTTCTGTAAAGATGTAGTTTCAAATAAGAAATTTATGAAAAAAGTA CAAGAGTCAAGATTTGACGTCATTTTTGCAGATGCTATTTTTCCCTGTAGTGAGCTGCTG GCTGAGCTATTTAACATACCCTTTGTGTACAGTCTCAGCTTCTCTCCTGGCTACACTTTT GAAAAGCATAGTGGAGGATTTATTTTCCCTCCTTCCTACGTACCTGTTGTTATGTCAGAA TTAACTGATCAAATGACTTTCATGGAGAGGGTAAAAAATATGATCTATGTGCTTTACTTT GACTTTTGGTTCGAAATATTTGACATGAAGAAGTGGGATCAGTTTTATAGTGAAGTTCTA G gtaagtatttttttcaatcagtaacatgaagctctaacttatttgtgtctttgaagcaga gcttatataaagccataaagtcagggtagtggggttttggtaagtgaatttataaaacaa aaatacaagatgatctattaatctcacaaatattatagaaaagcttaaattacagggtca 1.02 Intr + 3234 3382 149 1 2 88 92 111 0.999 10.53 acatgggcaaaatatgtaatacataaaattaaattatatctatatatgaatatgtgtata tatttttcaaagcacagatatttgcctacatttttgcctacattattctaacccctttca gaaatttacctaaagtaattatcttgtgtcatccaccttttttttttctattcctgtcag GAAGACCCACTACATTATCTGAGACAATGGGGAAAGCTGACGTATGGCTTATTCGAAACT CCTGGAATTTTCAGTTTCCATATCCACTCTTACCAAATGTTGATTTTGTTGGAGGACTCC ACTGCAAACCTGCCAAACCCCTGCCTAAG gtaaacatacttttgttggttttattttgttggctttgaattttcagtagaaatgattct atagtcttctttcagagtgtttgacttacactgaaagaaagatgggaaatgggtggggta aagcagataccaattagaaactcatgtgcacgttaataccatcacacgtatatgagtttt 1.03 Intr + 6108 6203 96 2 0 68 38 89 0.693 1.19 gtgtcacatgtgtacattgagctatgtaaataggacaaaagccatgatgaaaaaatatat tttacataaataatatcacaacataaaaattttagaaaaattttatttaaaaaaattttt ttcatgcttttataaaatttcttacattaatcttatattatttttattatgttatcacag AAGAAGAAACAACCAGTCCATATCAGTGATGAATCTGTAAAGAGGCTCGATTCCTTCAAC ACTGGGTGGATAAATAAGGCTCTGGGCATCAAGCTA gtgagatgaaacactgaacaccagttacattaaatatggctacaggcaactgcaatcaca cgcaatacctagatgccccaagtattacctggaatagcagtacaatgactctcatgttaa gattaaaaatcatattttaaaaaaacactctgtaatatgtggtctgcagagttaacattt 1.04 Intr + 7501 7632 132 0 0 95 116 114 0.996 14.82 tctcatattatacatctacttgcaaaaaaactgagtgattgggtcagttaaaaaatatta tttactccaataattcctcaaaatactggattttctctctttagtaatttgcaccaattc ttttggtagtgcccgctgtgctaatactcttttgtgatgaagcaaattctttcttcacag GAAATGGAAGACTTTGTACAGAGCTCTGGAGAAAATGGTGTTGTGGTGTTTTCTCTGGGG TCAATGGTCAGTAACATGACAGAAGAAAGGGCCAACGTAATTGCATCAGCCCTGGCCCAG ATCCCACAAAAG gtaagatgaagtgccttactggtgtggaaaactactgaaagaggctgttaaagtttgaag taatccaattatagaaacttctgataaatgtgaagttgaccaaaagttgaaaaattagaa caaggataatcttggagaaactatgagaagtttgaaaattgtggttgcatttttttttaa 1.05 Intr + 11869 11956 88 0 1 76 82 27 0.956 -0.48 atatacctaactaattataaaagttgagaaaattaatgtgagtattctatttacattagt ctttgagtagttcttatttactaacatcccttgatctcattcctactctttatacagttc tcacattctataacttttgaattccactcatggaataaaatattttctttattgtaacag GTTCTGTGGAGATTTGATGGGAATAAACCAGATACCTTAGGTCTCAATACTCGGCTCTAC AAGTGGATACCCCAGAATGACCTTCTAG gtaagactctggtgaacaaatactgaatatattagtaacagcacattagagtgttaatag ttcatcatgaaacaagcttattgaatatttgttaaggaaaaacaaaatgtaacttcttta tattgattttccagtcttaagggagaaagaatacattataatttttggcattttatgata 1.06 Intr + 12797 13016 220 0 1 51 69 228 0.965 13.64 caccgtatagccttcagttacatacccagtacaagtacgtgttttttcctccgaagtctg aaacacaattttaatttagttcagtgttttagctggaaaacactgtcactttcagagcct ttcattgtgcatctcattttattcctatgagtaattttgctaaaattcatccaatcctag GTCATCCAAAGACCAGAGCTTTTATAACTCATGGTGGAGCCAATGGCATCTACGAGGCAA TCTACCATGGGATCCCTATGGTGGGGATTCCATTGTTTGCCGATCAACCTGATAACATTG CTCACATGAAGGCCAGGGGAGCAGCTGTTAGAGTGGACTTCAACACAATGTCGAGTACAG ACTTGCTGAATGCATTGAAGAGAGTAATTAATGATCCTTC gtgagtagaacaatatttttcactaggtggtatttacagatagcttctcttgtcaatagt gagtgtgagtttcatcctttttataagagactaattttgaaagaatttaaatgatttaac caatctgaaatctgcttttatttttataagttatttaaaaattgaatttgaaacacatac 1.07 Intr + 17151 17334 184 0 1 103 30 243 0.209 18.87 cttagagttgtgagcccttaaaagggacaggaattgctcactcagggagttcagctcttg agagaggagtcttgccgatgctcccagccgaataaaacccttccttctttaactcggtgt ctgaggggttttgtctgtaactcttcctgctacattactgtctttatttttatctttcag ATATAAAGAGAATGTTATGAAATTATCAAGAATTCAACATGATCAACCAGTGAAGCCCCT GGATCGAGCAGTCTTCTGGATTGAATTTGTCATGCGCCACAAAGGAGCTAAACACCTTCG GGTTGCAGCCCACGACCTCACCTGGTTCCAGTACCACTCTTTGGATGTGATTGGGTTCCT GCTG gtctgtgtggcaactgtgatatttatcgtcacaaaatgttgtctgttttgtttctggaag tttgctagaaaagcaaagaagggaaaaaatgattagttatatctgagatttgaagctgga aaacctgataggtgagactacttcagtttattccagcaagaaagattgtgatgcaagatt Predicted peptide sequence(s): >UGT2B7_1|GENSCAN_predicted_peptide_1|530_aa MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKKKKQPVHISD ESVKRLDSFNTGWINKALGIKLEMEDFVQSSGENGVVVFSLGSMVSNMTEERANVIASAL AQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQNDLLGHPKTRAFITHGGANGIYEAIYHGI PMVGIPLFADQPDNIAHMKARGAAVRVDFNTMSSTDLLNALKRVINDPSYKENVMKLSRI QHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAAHDLTWFQYHSLDVIGFLL