GENSCAN 1.0	Date run: 16-Jan-104	Time: 16:21:21

Sequence COL21A1_1 : 193353 bp : 35.37% C+G : Isochore 1 ( 0 - 43 C+G%)

Parameter matrix: HumanIso.smat

Predicted genes/exons:

Gn.Ex Type S .Begin ...End .Len Fr Ph I/Ac Do/T CodRg P.... Tscr..
----- ---- - ------ ------ ---- -- -- ---- ---- ----- ----- ------

 1.05 PlyA -    111    106    6                               1.05
 1.04 Term -   1322    675  648  2  0   23   49   390 0.105  21.69
 1.03 Intr -   4714   4620   95  2  2   66   93    69 0.084   3.96
 1.02 Intr -  10198  10029  170  0  2   53   13   100 0.086  -2.33
 1.01 Init -  19136  19063   74  2  2   65  116    50 0.518   6.09
 1.00 Prom -  21289  21250   40                              -4.55

 2.02 PlyA -  22264  22259    6                               1.05
 2.01 Sngl -  43723  43406  318  1  0   88   41   275 0.951  18.52
 2.00 Prom -  56750  56711   40                              -5.95

 3.03 PlyA -  57085  57080    6                               1.05
 3.02 Term -  60219  59848  372  0  0   53   42   277 0.654  13.31
 3.01 Init -  65379  65221  159  0  0   48   93   111 0.727   7.47
 3.00 Prom -  65633  65594   40                             -11.24

 4.01 Init +  66127  66214   88  0  1   93   71    16 0.466   0.65
ctgttttaaacagatttaagttaattctaatagtcacaaaattagctgtacttcaattgg
ctcttgtttcaaaatgtaaatgtataatggctagatgttgactttaattaatatatttaa
cttgccttttttttccccctaggaatcctaaaaccaaaatattagaacgaaaacagaaac
ATGGCTCACTATATTACATTTCTCTGCATGGTTTTGGTGCTGCTTCTTCAGAATTCTGTG
TTAGCTGAAGATGGGGAAGTAAGATCAA
gtaagaactatcagcattgtccttttttgttatcaacaaattaatctggaaattaaacta
ggggagttcaagtaatggttttaaggatctcattcttactgtctttgattctgtaactcc
ctaaaataaatgaattgctatgttactcattaactgagaagaaaagcttccctcagagat

 4.02 Intr +  68616  69167  552  1  0   82  121   501 0.725  44.70
ccctattcactggcttatatttttgtaatatttcacgttagcattaagctaaacatattt
cacagacaatttaaaataagcaatgatattagtgtatagctgaaactcatatatttaaaa
tctctccctttttgctttttatataaaagatgtgctatgatggttttcttttgcacttag
GTTGTCGTACTGCTCCGACAGATTTAGTTTTCATCTTAGATGGCTCTTATAGTGTTGGCC
CAGAAAACTTTGAAATAGTGAAAAAGTGGCTTGTCAATATCACAAAAAACTTTGACATAG
GGCCGAAGTTTATTCAAGTTGGAGTGGTTCAATATAGTGACTACCCTGTGCTGGAGATTC
CTCTCGGAAGCTATGATTCAGGAGAACATTTGACGGCAGCAGTGGAATCCATACTCTACT
TAGGAGGAAACACAAAGACAGGGAAGGCCATCCAGTTTGCGCTCGATTACCTTTTTGCCA
AGTCCTCACGATTTCTGACTAAGATAGCAGTGGTACTTACGGATGGCAAATCCCAAGATG
ACGTCAAGGATGCAGCTCAAGCAGCAAGAGATAGTAAGATAACATTATTTGCTATTGGTG
TTGGTTCAGAAACAGAAGATGCCGAACTTAGAGCTATTGCCAACAAGCCTTCGTCTACTT
ATGTGTTTTATGTGGAAGACTATATTGCAATATCCAAAATAAGGGAAGTGATGAAGCAGA
AACTTTGTGAAG
gtaagccttaaaatgccttaatataatttggaagcaattaataattgtgctttttacatt
ttgatataatttcttcattaacactggtgtaaattgttatatttaatgtcaattataatg
ttacaacatttataatgttataaatgttatatttatactgtgagcataaattttttgtgt

 4.03 Intr +  77617  77785  169  2  1   97   91   103 0.995   9.58
cttctacattttctcagaaaatgtattcatatacatttatatactatacatttgtataca
tatgtagattttataattctaatgatagaatactatattgtctagtatttctcccttgat
ttttcttttattgtttgaatagtccatgattaaccaacttttattgcttttgctttatag
AATCTGTCTGTCCAACACGAATTCCAGTGGCAGCTCGTGATGAAAGGGGATTTGATATTC
TTTTAGGTTTAGATGTAAATAAAAAGGTTAAGAAAAGAATACAGCTTTCACCAAAAAAGA
TAAAAGGATATGAAGTAACATCAAAAGTTGATTTATCAGAACTCACAAG
gtatgcattatatgttgacacaacttttttggggggatatgtctgtggacatgtcaagaa
ttctttaagcttacacttgctcttctttttctagcaatgttttcccagaaggtcttcctc
catcatatgtatttgtgtctactcaaagatttaaagtcaagaaaatttgggatttatgga

 4.04 Intr +  77880  78096  217  0  1  105   98    18 0.888   2.08
aaggttaagaaaagaatacagctttcaccaaaaaagataaaaggatatgaagtaacatca
aaagttgatttatcagaactcacaaggtatgcattatatgttgacacaacttttttgggg
ggatatgtctgtggacatgtcaagaattctttaagcttacacttgctcttctttttctag
CAATGTTTTCCCAGAAGGTCTTCCTCCATCATATGTATTTGTGTCTACTCAAAGATTTAA
AGTCAAGAAAATTTGGGATTTATGGAGAATATTAACTATTGATGGAAGGCCACAAATAGC
AGTTACCTTAAATGGTGTGGACAAAATCTTATTATTTACAACAACCAGCGTAATTAATGG
CTCACAAGTGGTTACCTTTGCTAACCCTCAAGTTAAG
gtaaagatgcctgggataataccatgattatgatattcatggggaagcactattgggttt
atgtgtgttggggaaaagagggctataattttaacatgattggaaatatttttactttaa
attttaatgtttctgtgttgaagaaaactaacaaagaaaggaaaattgtttcttgatcaa

 4.05 Intr +  80448  80621  174  2  0   92   76   141 0.999  12.51
aaagaattggtggatagcatatgaggtccaccttggatcagggtgaattaatgtataata
cagtcagtctgtgtgggatgaagtttctcagcaatggttaggaacaagggagtaagaaca
aagaaaataaaatattgttaggggctttatttatgaatcttccacactttctttttgtag
ACGTTGTTTGATGAAGGCTGGCACCAAATTCGTCTCTTAGTAACAGAACAAGATGTGACT
TTGTATATTGATGACCAACAAATTGAAAACAAGCCCTTACATCCAGTTTTAGGGATCTTG
ATCAATGGGCAAACCCAAATTGGAAAATATTCTGGAAAAGAAGAAACTGTTCAG
gtagataaataatgatttactctttgaattatatagaatgaaacttttgctgtcctttgt
aatagttttcaccacatttaatcatatttaacatacttatgaattcccttaagttgttca
ccaaaatgtggtcagttcattagtgaaattatgcatatgtatatgtattaaaatgcagaa

 4.06 Intr +  81762  81839   78  2  0   69   78   126 0.992   8.53
gcatcacatctttacagtgtaaagtattaaaattttgtattttcattgttttagctaaat
gctgtgatgtaaaccttacacaattactaaccatagtggatgtttctatgtatctgagtt
gctcttataaaacaattagcttgtgcctcaactttaattctactgggtttatgttcttag
TTTGATGTCCAAAAGTTGCGAATCTACTGTGACCCAGAACAGAACAACCGGGAGACAGCA
TGTGAGATTCCTGGATTT
gtaagtaggagggattgtttttttcccagatgttgctttagtactttcaaagcaataaat
aaaaagcagatactatctgagtattaatttaatatgtagacttaattttattttttaatg
ttagtggaagtgaagttacatgaagcaaaacatattttgaggttataattgaaatgagat

 4.07 Intr +  83923  84005   83  0  2  104   93    -7 0.021  -1.08
agtagtaacatgtatagataggtgactttttaggataaatgcagggaaatattttggttt
ttgttggttttcatacttcatatatctctaatctggatggtgaaatatctgtaaattagg
ctgataatttataaattttatttaaaacattttaaaacacatttgttgtttttctttcag
AATGGAGAGGTAGGCTTGGATACTATTGTTCCCCTTAAGGTAATATTTGTATTGTGGGAC
CACTTAGCTCTTTTCCAACAACT
gtaagtatgtatattagacaaatggaacccatttttatgtaacttcaatgtatttaatat
ttatagatttttgtgatttggaatttcctattgggttgggttagataaaatttgaaagtg
aatgtaagatatttttgccattttacacaaatatataaatgcataaacatacgtgtgcat

 4.08 Intr +  91796  91850   55  2  1   61  103    49 0.002   1.76
gtataataaaatgcattatttattaagtaagcatttaaaatatggctttttttttttact
tttgtttttaacatacaaaaaacctcaaataatggaattggttttgaacttttattgatc
ctgactgcaccaatgtggctggttgttttgtactcaaaagtttgtttgcttcctgcttag
GGTGACCCTGGACTGCCTGGGAACCCTGGCTACCCTGGACAACCTGGTCAAGATG
gtaagcctgtgagtactgaaagcttagtcatctccggtatatctgggattacagtgtcaa
agtaaaagttttgctgagcaaatctaaacagacaaggaaagctttattcatgactgctgc
cataggaaggagagactgaactcaactctgttggaacgaaaggagctagggtgtgtgagc

 4.09 Intr + 106907 106960   54  1  0   54   92   102 0.016   5.46
aatattattttttttctttttaaatttttctttagggatatcagggaattgcagggacac
caggtgttccaggatctccaggaatacaagtatgtgatccacttatatacattttataaa
ttttatttttagtgaactaaaaccgataattaacaaaattttattttctggttaatttag
GGAGCTCGAGGACTACCAGGTTACAAAGGAGAACCAGGGCGAGATGGTGACAAG
gtaaacacacacaaaaatgcaatcaatggtgttagtccctcaaagataaaggatgttagc
tgtgatggtttccattcaatagtctgcgtcttggtgaattctaagatttgtgggctcaga
aatttgtcagtggctattagacaataaagcttatagaaggctttatcactacataaaaga

 4.10 Term + 108913 108936   24  0  0   84   45    48 0.014  -2.65
tattttttaacctatccagactctgtacaaactcattacttgacttttctgggcttaaga
aataaaatgtcataattatatctagggtattattggaagaattatagattttattttctt
tgttagtacattcaacttttaagtggtcccttcaaagcctcactttcccattgtcctcag
CATCCAGACCGGAGCACCATGTGA
tgggtaagacttccctacctgaataaagttccttacctctgggcctccaacatcgaaaaa
ctaagtggttttacagtgatttctgttatagagtcagtcataaccaaggaactccaatat
atattttgagagaacaggggtaaaaaagctaaaaaatgttagagaatacatgttaaaaca

 5.03 PlyA - 109988 109983    6                               1.05
 5.02 Term - 114853 114332  522  1  0    9   38   242 0.324   4.59
 5.01 Init - 129930 129739  192  0  0   50   58   107 0.243   2.91
 5.00 Prom - 133894 133855   40                              -3.65

 6.01 Init + 153420 153527  108  2  0   57   53    81 0.282   1.77
ggagccctacttccctacttaaaacttttgactggaagcagttagtgagctctgtcacct
ctagtaacaactaaagtgagagtggtcagagttgggagggggagagtgggacggatttga
aatgaactaaacaggtactagcagggcttgaggatccattagatgcgggtaagataagag
ATGACTCTTCAAAAGTCTTACTGCATGGATGGATACAGAGGAACACCACACAGTAAACAG
GGAATAGAACACAAAGAACCAGTTTTGGCTAGTGCAAGTGATCCTAAA
gtatgtttaaatggaacatatctaaataataacaaaggcatttaaagagaaggtctatat
tttgggataattagaaaataataggcttgtaaaaatagaaattaataaaatttcaataaa
aagttgtgggtcagatccaaggaaattttagatgaatttctgtaaatactagtggtagta

 6.02 Intr + 157162 157248   87  0  0    3  105    94 0.199   1.85
tagtttccactgctgctttgtcatagctatttttgtcctggtgctcaatcctgatggcat
gttgtatttggtgttaacattttcatcaggcaatctaaatcatttgctttctagttctct
gctcaccagctagccccattgtgtacagggagccttatggctcacagtgaaaatttgtag
GCAGGGACTGGGTTCTACTGTGAGCTGAGATCCCTGGAGCTCCATGAAAAGGAGAAAAAG
AATGCCGTGTTTCCTGGATCTATGGAG
gtgagtgcatatttcttaatgaaggatggccttagcagttttattttggaaatgtttgct
gtctcatttttccaggaataaagacatggggatcactgtagtgtagttgaaacactggct
catagaggcttttattgtttcctttcctcatgcctttcaaattcttgcttaaccacatgt

 6.03 Intr + 171172 171216   45  0  0   99  115    29 0.097   4.39
aatgctatatctcctaagttgtcttttccatattggattattacaaatagcaatattata
atatgtatacatttgaaaatatgttatttaccagttaaaattccaattgtgactgtttct
tctttaatgataaagtcttcaattttttataagttaaaaatctattttatttgtttttag
GGAATCCCAGGATTTCCTGGAAACCGAGGATTAATGGGCCAAAAG
gtaagtattcatgagagttagctttgggcctggatctgctcatttaatgcattgttgtct
acaataaaatacagttttacatttgtggtaacagttaatttttcaaatattatataattt
tagaagacgttgttttggctttacaaatttgtatatattgttttgtggttgttttatata

 6.04 Intr + 176203 176259   57  0  0   73   76    48 0.087   0.26
aagtctctgttgtaactactcaattttatcattatagtgcaaaattggccacaggcaata
cctaatcaaatgggtatggggtgtggctatgttctggttaaactttaagaacttgcattg
ggctggatttaacccatggatcatagtgtactgacctctatattcgtttctttctgctag
TTTTGTCAGCTTATGTTTGTGGCTTGTGCTGTCAATATCACTGATAGAAGTTCTAGG
gtgagacaaaaacgtattcagtagggcagagataaggctgaaactgaggcagatctttag
aaaacctctaatttatattataatacttaaaaatagctgcagaaacatttataagcctat
ttaactatactatgttttggttttaaaaaaatctgccctttactcggtatgtatccaaag

 6.05 Intr + 179628 179699   72  2  0   70   91    63 0.907   3.48
atacaagaaattttactgggattctagtaaacattttattctttactatttctgtagtag
taactgtcaatacatttttttaaccattcattttaaaattgagatatgtagagataaaaa
cagtggtgcttttcataagcagtagatctgtgatctttctggaatttctgtgttacatag
GGAGAACCAGGAGCAACGGGTTCCCCAGGAGAACCAGGATACATGGGTTTACCCGGGATT
CAAGGAAAAAAG
gtatgcattggttaggagatacagttcgcttttaaccagttacttgcaaacaagtttttc
ttttgtgaaattcttaaagtaggacttgttattaatatatttttaatgataaagtaccct
atatattcgatgtatgtataatatgttcagccccatgctaatagctgtggcatcttttat

 6.06 Intr + 187708 187854  147  0  0   51   52   190 0.726  11.21
cagtttaatatgacatgaaatttcccttctggtcaatgacaatatttccggctattcctt
acataccttacatatttacatatgtatacatgcatattcacatccttaacgagcttcatg
atgcaattatacctcctgaaatatttaaatagaacttgtaaagatttcttttgcttttag
AGAGGTGAAAAGGGAGAACCTGGTGTCCGAGGTGCCATTGGATCAAAAGGAGAATCTGGG
GTGGATGGCTTGATGGGGCCCGCAGGTCCTAAGGGGCAACCTGGGGATCCAGGTCCTCAG
GGACCCCCAGGTTTGGATGGGAAGCCC
gtatgtattctgcttctttcacagttattacattttcattgatttttgctcatgttcttt
atgtgcatgttataacccctaacactttgatgcagggaagagagttttcagaacaattta
ttcgacaagtttgcacagatgtaataagaggtaggtatcaaatatagcattttaataact

 6.07 Intr + 187950 188004   55  2  1   43   92    41 0.460  -2.37
ggatggcttgatggggcccgcaggtcctaaggggcaacctggggatccaggtcctcaggg
acccccaggtttggatgggaagcccgtatgtattctgcttctttcacagttattacattt
tcattgatttttgctcatgttctttatgtgcatgttataacccctaacactttgatgcag
GGAAGAGAGTTTTCAGAACAATTTATTCGACAAGTTTGCACAGATGTAATAAGAG
gtaggtatcaaatatagcattttaataacttttctcaaattacaaaagtaatacaaattc
ttaggacatattgtagaggatataagtgaggtgaagaagaaaacagataacatttataag
cctcatctacttttcttcaatgagtatttttataaagatttatcatatatactcttttat

 6.08 Intr + 188629 188727   99  2  0   40   91    75 0.440   2.16
actgaaaaaaattaaaaatataattaacaccaactcaccatttaaacataagggatgggg
tttctttgtttttgaaagcccagctaccagtcttacttcagagtggaagaattagaaatt
gtgatcattgcctgtcccaacatggctccccgggtattcctgggccacctggtccgatag
GCCCAGAGGGTCCCAGAGGATTACCTGGTTTGCCAGGAAGAGATGGTGTTCCTGGATTAG
TGGGTGTCCCTGGACGTCCAGGTGTCAGAGGATTAAAAG
gtatgcagttagtttcaacaagaaaatgaattttaaaaagtctttttttaaaaattcata
ccctatatccatttaatagtcgagttaacttttttcatgataaaaaaatctgtaaatgct
cgtctttaaataatttgccaactgaattaaagagaaattattttcttaatgcaatattct

 6.09 Intr + 189503 189580   78  0  0   56   94    45 0.579   0.50
ccactgatcattttagaaattattgcttcaaaacttgttttccattagtaagaaaaaata
gatggcaagctggtttttaaaagacatttttctttcatgtgtatattaacagctttgaat
gaaacaatctagaaggcagtgattttaagtaaacttactcagatgtttgacaccctgcag
GCCTACCAGGAAGAAATGGGGAAAAAGGGAGCCAAGGGTTTGGGTATCCTGGAGAACAAG
GTCCTCCTGGTCCCCCAG
gtgagaattgctacctgctcataagtgttactgctcattttgctttaagaaaagtcatca
tagatctatgtgaaataaattgaaactgagacatctgttttcttttttgagtgattcaca
tttaacacactgaagtctaacttctggaatattttttcatatattatcctcaatttatga

 6.10 Term + 190901 191088  188  0  2   87   36   169 0.997   8.27
ggttcttttcaaagcagaagacatgtagaattatcaagaaaatgcctctactatataatt
agtgcaaatatataaaatattcaaggttttttttttcagtttaagtttcttgcagaattg
gctatttcattataaaaaactaaagtcctctgtttacgtcttgccaatgtcccatcttag
GTCCAGAGGGCCCTCCTGGAATAAGCAAAGAAGGTCCTCCAGGAGACCCAGGTCTCCCTG
GCAAAGATGGAGACCATGGAAAACCTGGAATCCAAGGGCAACCAGGCCCCCCAGGCATCT
GCGACCCATCACTATGTTTTAGTGTAATTGCCAGAAGAGATCCGTTCAGAAAAGGACCAA
ACTATTAG
tgtctgatgcctcattcagcagcctaggcatggtgctttttctgtggtcttttgcatctc
aggaagataaccaacagtaatcccttgaaaagaaacttaagtacctcggtgtttttattt
tttttttcttatggaaaaaaatataaaagatcacatatactgattttaaaggctcctcag

Predicted peptide sequence(s):


>COL21A1_1|GENSCAN_predicted_peptide_1|328_aa
MSCLVALLHIPHFRIESEEYGHFPSDYNCAITAKTDSLMDPRINTYSHKALPQKLLIELP
LPCHLQQIPFSCILSSLSQVLGLTHNSFKTDLNSKTIHYGTKRALKMNLNECQPAECCAR
GTGMFQAVASPTRARPALKRIGCPPPGVRSPCSGQCRAQRLRNSLSAPWRRSPGDKVRAP
HPPPFLGRRPEGGFWIWILKGELLVSPWWKHSVQILLASENARLRIENEGEGGPGKREER
GKIRDCQESRKGNSVERASTKGGKDLGNTRASPALIEGGLPPLPKKNPPLGRQGTLQRTD
VPCFQPKVTAAPKPEGSSLSNSQVGSDL

>COL21A1_1|GENSCAN_predicted_peptide_2|105_aa
MGRNQCKKAENSKNQNTSSPPKDHNSLAREQNSTENEFDKLTEVGFRRWVITNSFKLKEH
VLTQSKEAKNLEKRLDKLITRITSLEKNISDLMELKNTGRELREA

>COL21A1_1|GENSCAN_predicted_peptide_3|176_aa
MIHNCFNLWQKGNTDEKEFATAYKKSLKAGVTDWKSEESLPRNKHSFIQQFLLSTWGKGS
CGHSFSRLKFPCLTALKRSVDMPAQRSSSAKGRTASSRGSLTPVYPGSPVGTDRHLIEKS
SGWHLAGAPLGQSFPGKGKEQAAIFAVLQTPLVIPRQTGCGMDLQQTPVDLLQTVS

>COL21A1_1|GENSCAN_predicted_peptide_4|497_aa
MAHYITFLCMVLVLLLQNSVLAEDGEVRSSCRTAPTDLVFILDGSYSVGPENFEIVKKWL
VNITKNFDIGPKFIQVGVVQYSDYPVLEIPLGSYDSGEHLTAAVESILYLGGNTKTGKAI
QFALDYLFAKSSRFLTKIAVVLTDGKSQDDVKDAAQAARDSKITLFAIGVGSETEDAELR
AIANKPSSTYVFYVEDYIAISKIREVMKQKLCEESVCPTRIPVAARDERGFDILLGLDVN
KKVKKRIQLSPKKIKGYEVTSKVDLSELTSNVFPEGLPPSYVFVSTQRFKVKKIWDLWRI
LTIDGRPQIAVTLNGVDKILLFTTTSVINGSQVVTFANPQVKTLFDEGWHQIRLLVTEQD
VTLYIDDQQIENKPLHPVLGILINGQTQIGKYSGKEETVQFDVQKLRIYCDPEQNNRETA
CEIPGFNGEVGLDTIVPLKVIFVLWDHLALFQQLVTLDCLGTLATLDNLVKMGARGLPGY
KGEPGRDGDKHPDRSTM

>COL21A1_1|GENSCAN_predicted_peptide_5|237_aa
MTDNHMIISIDADKAFDKIKYLFMIKTLKKVDIEGTYLNIIKAIYDKPTASIILNGDKKI
KAFPTSEDVWKCLDAQAEICCRGRVLVENLCLGSEEGKCGVGAPRVPTGVLPSRAVRRRS
QSSKPQNGISTDSLHHAPGKTTDTQCQTVKAIEREAVPCKATEAELPKTMGTPFLHQHDL
DVRHGVKGEHFGALRFDCTAGFQTCIGPLPPSFWSISPIRNGSIYPMPVPLFYLGNN

>COL21A1_1|GENSCAN_predicted_peptide_6|311_aa
MTLQKSYCMDGYRGTPHSKQGIEHKEPVLASASDPKAGTGFYCELRSLELHEKEKKNAVF
PGSMEGIPGFPGNRGLMGQKFCQLMFVACAVNITDRSSRGEPGATGSPGEPGYMGLPGIQ
GKKRGEKGEPGVRGAIGSKGESGVDGLMGPAGPKGQPGDPGPQGPPGLDGKPGREFSEQF
IRQVCTDVIRGPEGPRGLPGLPGRDGVPGLVGVPGRPGVRGLKGLPGRNGEKGSQGFGYP
GEQGPPGPPGPEGPPGISKEGPPGDPGLPGKDGDHGKPGIQGQPGPPGICDPSLCFSVIA
RRDPFRKGPNY