GENSCAN 1.0 Date run: 15-Jan-104 Time: 04:16:45 Sequence NR1H4_1 : 92364 bp : 39.84% C+G : Isochore 1 ( 0 - 43 C+G%) Parameter matrix: HumanIso.smat Predicted genes/exons: Gn.Ex Type S .Begin ...End .Len Fr Ph I/Ac Do/T CodRg P.... Tscr.. ----- ---- - ------ ------ ---- -- -- ---- ---- ----- ----- ------ 1.02 Intr - 2890 2767 124 2 1 122 94 63 0.217 9.02 1.01 Init - 12468 12411 58 0 1 66 88 68 0.976 6.12 1.00 Prom - 16980 16941 40 -2.35 2.01 Init + 24320 24458 139 1 1 76 20 96 0.040 1.95 ggagacaataatgaccttttcagtgataacttgcagcttcttctagaggtgaccatgggc cccttactcttcaaaggctttgcttaaggtgaaggggaaatttcttcacccctgtaatgt ttattccaaaaagcagagcccaaatgaggacttgtgtgaaggcagtttatgtgagacatg ATGAGGGAGTGGAGGCGAGGGAGTGGGCGATGCAACAGGGAAGGAGGGAAAACCAAAGAG GTCAGTTGTCAAGATCCCTGGTGTGGGGGAGGCCAGCTTGATGCCACTGGGAGCAGCACA GAGAACTGTCAGCAGAGGG gtcagggactggagcatatattaatattaactgcccctcggctcccgttggttgagcgtc accccagggggcattaattccccgcacttctggactgtttttgagctcaggccaagctgt ctcctgtgggattagagaagttctgggcagaaagcataggaacgtgcggcatgctcttga 2.02 Intr + 30668 30796 129 0 0 86 97 10 0.174 1.45 aaactggaaaagtactcccccaaaatgtttatctaagagactggtttccagcttactagg caatttggcattaagaactttcctcataaacatttacaaatattctgctccgtaatgaag ttaatcagtaaaccacacaacctctgtcctctctcactccttacctagtctcattttcag TGGCTGTGAATAAGCTAAGAATGGTAATGCAGTTTCAGGGGTTAGAAAATCCAATTCAAA TTAGTCCTCACTGCAGCTGTACGCCGTCAGGATTTTTCATGGAAATGATGAGTATGAAGC CCGCGAAAG gtaggacactgttcacaggtgctttcaggtcgagctcttgcaactggactgaggaaatct ggggactttggttggagatgacagtaacagatgtctgtcaaagatagtggctcagtcaga cccagaagactggaatgagagtttgggttggggtgatttttatagggttctaaacagacg 2.03 Intr + 38078 38443 366 0 0 78 121 211 0.915 17.59 catttaattttatatatatatatatatatatatatatactctaaagaagttgtaaacttt tatgtagttaaatgtttcaatcttttcttagagcccacactcctaaccattacgccaaac tgcctctctaatttccagaatgatgacattcattccagttttgttgtcacttttgttcag GTGTTTTAACAGAACAAGTGGCAGGTCCTCTGGGACAGAACCTGGAAGTGGAACCATACT CGCAATACAGCAATGTTCAGTTTCCCCAAGTTCAACCACAGATTTCCTCGTCATCCTATT ATTCCAACCTGGGTTTCTACCCCCAGCAGCCTGAAGAGTGGTACTCTCCTGGAATATATG AACTCAGGCGTATGCCAGCTGAGACTCTCTACCAGGGAGAAACTGAGGTAGCAGAGATGC CTGTAACAAAGAAGCCCCGCATGGGCGCGTCAGCAGGGAGGATCAAAGGGGATGAGCTGT GTGTTGTTTGTGGAGACAGAGCCTCTGGATACCACTATAATGCACTGACCTGTGAGGGGT GTAAAG gtaagcatctttgattggcagttttctccttcaggttttactatattggttgttgaaatc ccttgaactaattgcttcccttttcccaggcaacttcccattttctcctcctgtgcgcct acctcctcctacatcctcacctttgttgtgtagtcaaagatctgtaggaaaagactgtta 2.04 Intr + 46611 46845 235 1 1 9 94 111 0.014 -0.38 gctgtgtagtgaatgagcacaagattcaactcacagcccctatgtgagagaaatgtaact ttattttttaaaattggatttaattcagtctagagctcggtggaaactttatttcatttt attcagtatcattccattcacccccgccaaaattcttctggcggtttatctaagtaccag GATTAAGGGAGGGTTGTGGAGGGATTGGGCACTGGGGAGTGGGGCTCTGGCCCCACAGCT GTGGGGCTGGGTGGGGCTTGGTGCCACAGCTGTTGACACAGTCTGAGATCTGTTGGAGTG CTGTTGTATTTGGTCTTCAGTCACCAGTGGGAAAGGTCTCTGTGACACCATCCTGGGGTA CTGAGCACACTCTTCCATCACGTCTGGCCCTGGCTGTCTCCTTCATTCAGCTCAG gtgggtgggttctgatgttgcatcagtgctgtgttgggatgcctggcttcccagagaaac catgctgccatttcatctgctctatgccatgctgggtgcagagaaccctgggggtttctc cagttctacccaggaaagggcataagaatcctcgtcttccaggatcccaaatgacgtgga 2.05 Intr + 55772 55935 164 2 2 68 87 94 0.743 6.00 aggaagcagaggttgcagtgagctgagatcacgccactgcacttcagcctgggcaacaga gtgaggctccatctgggaaagaaaaaaaaaaaagaggcagaaaagcagtgtgcaatattc tgcagaatcgaggaatccatgtaaaagtaccatcctatagctattttcttgctaccccag GGATCCCATTGGTGCTACACATTCCCCAGATGGCAATGCCAACCCTGTCTACTTATCCTG TATTACCAGCAAGGCTCTGTTCCTCAGTGAATTTCCTTTCCATTCATTTTCAAATGACTT TTCTGATATGAGCATTGTTGAATATGCACAAGAAAGAGGCAGAG gtatgtgtatggatagatttgcataagtataaatacagtatatgtacccatatttaaatg atataatgataatattgtgttgctattcagagtgaaagctaattaattcagctattgaga tgataatgatttctttttcagttaataccagagtcaaaaaaccctgcagaatggttctac 2.06 Intr + 56604 56711 108 1 0 92 66 43 0.508 1.84 gaaaaatgttaagatctttcctactgaaatttacaccagctgaaaaattcacaagcaagt ccatgactttcttaaccttgacatctctaacttttccttcagcctctgttttcatatttc atgagttaccaaaacctgatgttctctctgtttcctcctttctcttctgtcccactttag TTCAGGCATTGGTAGCCTCTCAGTTGTATTATGGCAATAGTCTCCTCTCTCTAGTCTCCA ATACGCGTTCCACCTTTACCTTGCTCCGAGGAGCTTCCCAACATACAG gttaggtcatactgtcccctgtcaaagcctttaatggcttccctctttcaacatggtaaa gactcaactcctttgcttggcattcaaggacacttaatcacattctgttcctgttacaac tgcttacccatctcccactaattctctccatactctacccaaccgccaccaagatggagt 2.07 Intr + 59758 59967 210 2 0 95 93 85 0.370 7.66 caacaggcttctcaacaacacaatgtcacataaagtatttgtcactggtgtgctcaagga tggcctgggtgctctccagcagttggtgagaaaatgtcctggcatctctcaatccaaacc tgtttttttcctgagaagctgtgagaggactttttacacttttcagtgtttctcccacag GTTTCTTCAGGAGAAGCATTACCAAAAACGCTGTGTACAAGTGTAAAAACGGGGGCAACT GTGTGATGGATATGTACATGCGAAGAAAGTGTCAAGAGTGTCGACTAAGGAAATGCAAAG AGATGGGAATGTTGGCTGAATGTATGTATACAGGTATTCACTTCAAGCAATTACATTTCA CTAAAAATCTCTTAAGGAGGCAGATGTCAG gtaactcatcacgagagtgctacttcacatattaaagaaggaacctactaagccatctaa gttcttgaaaagggtaatgaaccactgaaattgtccaaactgtcaactaaagagcatttt agtcacccgaaagaaatgggttttttttgttgtttttctttgtcgcagtgaactatacat 2.08 Intr + 62190 62323 134 1 2 70 52 213 0.942 15.34 ttgttcaaggttaagtctcaaaccttggccttccctttctaaaatgcataaaaggctagc gttagttctgtgccattgcataggggatcttctgggccaggtacatatcagtggttttat gaccacacacccaacagtactttctgtgattggtgaagtctctatgcttatttgttttag GCTTGTTAACTGAAATTCAGTGTAAATCTAAGCGACTGAGAAAAAATGTGAAGCAGCATG CAGATCAGACCGTGAATGAAGACAGTGAAGGTCGTGACTTGCGACAAGTGACCTCGACAA CAAAGTCATGCAGG gtaataatatgcaatggtgtctgccaagactggcaggaactgagtttctaggtacatagt gagctggccaggaggctttcaaattaaagccacaggcacagctgaatttctagtccaatt gttcattaaaatggattcctaatacatgctttgatgtaaacattcaaatagtagcaatgc 2.09 Intr + 64248 64347 100 2 1 37 68 70 0.921 -1.34 tcaagagtatgaagtctcccacctatcttgataatggtaattgccctccaaagatctgag aaatagtaagatgggttttcaaattttatcatctaaacctagtttttctttagtctaatg gttttatattatcattttcttatctactttttaatcattggtttttttcttaaaatttag TTAAAAGAAGAATTCAGTGCAGAAGAAAATTTTCTCATTTTGACGGAAATGGCAACCAAT CATGTACAGGTTCTTGTAGAATTCACAAAAAAGCTACCAG gtattttttaaataatcaaagttaatatttattgagagtttaaatatgtgcccacagatt agattacctattttacatacggtgttttaattttcaaaacattcctgtgagatcagctct attttcactattactttgccaagtattttcacatgtacttatttcactgctattctctac 2.10 Intr + 67972 68118 147 2 0 60 103 129 0.956 10.89 attctgctcaatgaagataaaagcctctattttattggcgagtacaaatggactcaacta gactacccaattttaaacaactacagaatcacttgatgtaaatgttttatcaatggcaat gatggtgatcatgaaatattgttactccttgataccaatttgattatcatcattacctag GATTTCAGACTTTGGACCATGAAGACCAGATTGCTTTGCTGAAAGGGTCTGCGGTTGAAG CTATGTTCCTTCGTTCAGCTGAGATTTTCAATAAGAAACTTCCGTCTGGGCATTCTGACC TATTGGAAGAAAGAATTCGAAATAGTG gtaagtgatttggctaatggtaaaagagtttgtttctaggagtaaaattggtgtgcttca tgagggtggggctcttgccaatcttatgcaatgttatatgcctgttgtgcctagcatgaa gaatggctctaaaaagatatgtgttaaattgataagacttctagaggcttggttcaaata 2.11 Intr + 86631 87152 522 1 0 61 44 278 0.027 12.69 agagagaaagtatgtgatgtgatctgatttttagaaaggtcattccaatgagaggtgaca gcgtgctggcagtcctcagagccctcgcttgctctcggcacctcctctgcctgggctccc actttggcagcacttgaggagcccttcagcccaccactgcactgtgggagcccctttcag GGCTGGCCAAGGCTGGAGCCCACTCCCTTAGCTTGCAGGGAGGTGTGGAGGGAGAGACGC GAGCGGGAACCGGGGCTGCGTGCAGCGCTTGCAGGCCAGCTGGAATTCCGGGTGGGCGTG GGCTTGGCGGGCCCCTCACTCGGAGCAGCCGGCCAGCCCTGCTGGCCCCGGGTAATAAGG GACTTAGCACCCGGGCCAGTGGCTGCGGAGGGTGTACTGGGTCCCCCAGCAGTGCCAGCC CACCGGCGCTGCGCTGGATTTCTCACCGAGCCTTAGCTGCCTTCCCGAGGGGCAGGGCTC GGGACCTGCAGCCCGCCATGCCTGAGCCTCCCACCCACTCCATGGGCTCCTGTGCGGCCC AAGCCTCCCCAACGAGCACCACCCCCTGCTCCACGGCGCCCAGTCCCATCGACCACCCAA GGGCTGAGGAATGCGAGCGCAGGGCGCATGACTGGCAGACAGCTCCACCTGCAGCCCTGG TGCCGGATCCACTAGGTGAAGCCAGCTGGGCTCCTGAGTCTG gtggggacgtggagagtctttatatctagctcagggattataaacacaccaatcagcacc ctgtgtctagctcaaggtttgtgagtgcaccaatcgacactgtatctagctgctctggtg gggccttggagaacctttatgcctagctcagggattgtaaatacaccaatcagcaccctg 2.12 Intr + 89185 89298 114 2 0 115 91 54 0.083 7.90 gtcaactgattgtcttcacaatgtccttcctttggacatataataaaaataatatagtca ttatttgaatgtgtgcatatagttgcaaaattaccatgtgtttatatgtataatgtgttt ctagttttacactgtttagtcactcaaaaattgtattatgattgcaactttcccccacag GTATCTCTGATGAATATATAACACCTATGTTTAGTTTTTATAAAAGTATTGGGGAACTGA AAATGACTCAAGAGGAGTATGCTCTGCTTACAGCAATTGTTATCCTGTCTCCAG gtaattccaatgttacattttaatttttatgccatttttttcagtatactagtaataacg tttattgaaaaaaatctggaaaacatagaaatataaagaaaaagtaaagtagcctataat tctgctatccaaatagaaccattattaacctttcagtgcacttcttttcagtctttttaa 2.13 Term + 90551 90789 239 0 2 44 45 109 0.078 -2.45 cttgatctcgttataattacgtgtgtgtgcataaaaattcatcaggttgaacacttaatt ttcacattttgtgtacaacatttaacttacacttcaaaatagttaacgttgctataatta tgctgaattaatgcttttccactttttaattttgtcattttattttaaacttcaaaacag ATAGACAATACATAAAGGATAGAGAGGCAGTAGAGAAGCTTCAGGAGCCACTTCTTGATG TGCTACAAAAGTTGTGTAAGATTCACCAGCCTGAAAATCCTCAACACTTTGCCTGTCTCC TGGGTCGCCTGACTGAATTACGGACATTCAATCATCACCACGCTGAGATGCTGATGTCAT GGAGAGTAAACGACCACAAGTTTACCCCACTTCTCTGTGAAATCTGGGACGTGCAGTGA tggggattacaggggaggggtctagctcctttttctctctcatattaatctgatgtataa ctttcctttatttcacttgtacccagtttcactcaagaaatcttgatgaatatttatgtt gtaattacatgtgtaacttccacaactgtaaatattgggctagatagaacaactttctct Predicted peptide sequence(s): >NR1H4_1|GENSCAN_predicted_peptide_1|61_aa MNESNEPHIQNRAAECDWAEYKGLTTNGYSIAIGPILKRWKQEEGQGFHDFPSPAVRRGQ X >NR1H4_1|GENSCAN_predicted_peptide_2|868_aa MREWRRGSGRCNREGGKTKEVSCQDPWCGGGQLDATGSSTENCQQRVAVNKLRMVMQFQG LENPIQISPHCSCTPSGFFMEMMSMKPAKGVLTEQVAGPLGQNLEVEPYSQYSNVQFPQV QPQISSSSYYSNLGFYPQQPEEWYSPGIYELRRMPAETLYQGETEVAEMPVTKKPRMGAS AGRIKGDELCVVCGDRASGYHYNALTCEGCKGLREGCGGIGHWGVGLWPHSCGAGWGLVP QLLTQSEICWSAVVFGLQSPVGKVSVTPSWGTEHTLPSRLALAVSFIQLRDPIGATHSPD GNANPVYLSCITSKALFLSEFPFHSFSNDFSDMSIVEYAQERGRVQALVASQLYYGNSLL SLVSNTRSTFTLLRGASQHTGFFRRSITKNAVYKCKNGGNCVMDMYMRRKCQECRLRKCK EMGMLAECMYTGIHFKQLHFTKNLLRRQMSGLLTEIQCKSKRLRKNVKQHADQTVNEDSE GRDLRQVTSTTKSCRLKEEFSAEENFLILTEMATNHVQVLVEFTKKLPGFQTLDHEDQIA LLKGSAVEAMFLRSAEIFNKKLPSGHSDLLEERIRNSGLAKAGAHSLSLQGGVEGETRAG TGAACSACRPAGIPGGRGLGGPLTRSSRPALLAPGNKGLSTRASGCGGCTGSPSSASPPA LRWISHRALAAFPRGRARDLQPAMPEPPTHSMGSCAAQASPTSTTPCSTAPSPIDHPRAE ECERRAHDWQTAPPAALVPDPLGEASWAPESGISDEYITPMFSFYKSIGELKMTQEEYAL LTAIVILSPDRQYIKDREAVEKLQEPLLDVLQKLCKIHQPENPQHFACLLGRLTELRTFN HHHAEMLMSWRVNDHKFTPLLCEIWDVQ