The polymorphism of Hydra microsatellite sequences provides strain-specific signatures

(1)

Article

Reference

The polymorphism of Hydra microsatellite sequences provides strain-specific signatures

SCHENKELAARS, Quentin, et al.

Abstract

Hydra are freshwater polyps widely studied for their amazing regenerative capacity, adult stem cell populations, low senescence and value as ecotoxicological marker. Many wild-type strains of H. vulgaris have been collected worldwide and maintained effectively under laboratory conditions by asexual reproduction, while stable transgenic lines have been continuously produced since 2006. Efforts are now needed to ensure the genetic characterization of all these strains, which despite similar morphologies, show significant variability in their response to gene expression silencing procedures, pharmacological treatments or environmental conditions. Here, we established a rapid and reliable procedure at the single polyp level to produce via PCR amplification of three distinct microsatellite sequences molecular signatures that clearly distinguish between Hydra strains and species.

The TG-rich region of an uncharacterized gene ( ms-c25145 ) helps to distinguish between Eurasian H. vulgaris strains (Hm-105, Basel1, Basel2 and reg-16), between Eurasian and North American H. vulgaris strains ( H. carnea, AEP ), and between the H. [...]

SCHENKELAARS, Quentin, et al . The polymorphism of Hydra microsatellite sequences provides strain-specific signatures. BioRxiv , 2020

DOI : 10.1101/2020.03.04.977470

Available at:

http://archive-ouverte.unige.ch/unige:132022

Disclaimer: layout of this document may differ from the published version.

(2)

The polymorphism of Hydra microsatellite sequences provides strain-specific signatures

Quentin Schenkelaars#a, Diego Perez-Cortez, Chrystelle Perruchoud and Brigitte Galliot*

Department of Genetics and Evolution, Institute of Genetics and Genomics in Geneva (iGE3), University of Geneva, Geneva, Switzerland

* Corresponding author: [email protected]

#a Current address: Jacques Monod Institute, Paris, France

Supplemental Data ... 2

Table-S1: Sequences of the primers used in this study ... 2

Table-S2: Accession numbers of the 16S ribosomal RNA and Cytochrome C Oxydase I (COI)

sequences ... 2

Table-S3: Accession numbers of the ms-c25145, ms-AIP, ms-DMTF1 microsatellite sequences

... 3

Figure S1: Phylogenetic reconstruction of the Hydra genus based on the analysis of the 16S

ribosomal RNA sequences ... 4

Figure S2: Alignment of the Hydra genomic and transcriptomic ms-c25145 sequences ... 7

Figure S3: Reproducibility of the amplified patterns corresponding to the ms-c25145 region 8

Figure S4: Alignment of the putative Hydra c25145 protein with related gene products

identified in bilaterian species ... 9

Figure S5: Alignment of the Hydra genomic and transcriptomic sequences corresponding to

ms-AIP... 11

Figure S6: Alignment of the Hydra transcriptomic and genomic sequences corresponding to

ms-DMTF1... 15

(3)

Supplemental Data

Gene name Foward primer Reverse Primer

16S TCGACTGTTTACCAAAAACATAGC ACGGAATGAACTCAAATCATGTAA b-actin GCTCTTCCCCATGCCATTAT AGCTTGAAGCAGCAGTTTGC COI AAGTGTATAATTGAATCACACGTTG CTTCAGGGTGACCAAAAAATCA

ms-c25145 GGAAGAGACAGATTCCCAAT AATGCTCTTTCCTCACAGTC

ms-AIP CGAGACAGCGTTTTCAAG CCACTCTTCCATTCTAACCA

ms-DMTF1 ATCGATTTAACTGCTGAAGG AACCAAATCACAGATTTAAAATAA

Table-S1: Sequences of the primers used in this study

Table-S2: Accession numbers of the 16S ribosomal RNA and Cytochrome C Oxydase I (COI) sequences Sequences MN9886xy and MT0242xy are accessible at the URL: www.ncbi.nlm.nih.gov/genbank/

Gene name Species Strain Accession

16S

H. vulgaris

Basel1 MN988641

Basel2 MN988642

Hm-105 MN988634

reg-16 MN988633

H. carnea AEP1 MN988635

AEP2 MN988636

H. oligactis Ho_CR MN988639

Ho_CS MN988640

H. viridissima Nicolet MN988638

COI

H. vulgaris

Basel1 MT024257

Basel2 MT024258

Hm-105 MT024251

reg-16 MT024252

H. carnea AEP1 MT024253

AEP2 MT024254

H. oligactis Ho_CR MT024255

Ho_CS MT024256

H. viridissima Nicolet MT024260

(4)

Species Strain Database Accession number Nb of polyps sequenced

H. vulgaris

Basel1 This study (genomic)

MT024275 3 polyps (8 colonies) MT024277 3 polyps (5 colonies)

MT024278 1 polyp

Basel2 This study (genomic) MT024276 2 polyps (2 colonies)

Hm-105

Hydra 2.0 genome

Sc4wPfr_396.1 -

Sc4wPfr_1246 -

Juliano Trinity

not detected

Compagen

not detected

This study (genomic)

MT024273 5 polyps (24 colonies) MT024274, MT024279 2 distinct polyps

MT024280 5 polyps (10 colonies)

H. carnea

AEP ecto-GFP HydrATLAS c25145_g1_i09 -

AEP Juliano aepLRv2

not detected

Compagen HAEP_T-CDS_v02_11692 -

AEP1 This study (genomic)

MT024265, MT024266,

MT024269, MT024271 4 distinct polyps MT024270 1 polyp (2 colonies) AEP2 This study (genomic) MT024267, MT024268 2 distinct polyps

MT024272 4 polyps (6 colonies)

H. oligactis

Ho_CR

Ho genome draft

CR_jcf7180012595266 -

HydrATLAS R039447c0g1_i05 (MT024261) -

This study (genomic) MT024262 2 polyps (2 colonies)

MT024264 1 polyp

Ho_CS HydrATLAS

not detected

This study (genomic) MT024263 3 polyps (4 colonies)

H. vulgaris

Basel1 This study (genomic) MT024287 1 polyp

Basel2 This study (genomic) MT024292 1 polyp

Hm-105

Hydra 2.0 genome

lcl|Sc4wPfr_417.3 (MT024295) - Juliano Trinity JT_TRINITY_DN8247_c0_g1_i1

(MT024291) -

Compagen

not detected

This study (genomic) MT024289, MT024290,

MT024293, MT024294 4 distinct polyps

reg-16 This study (genomic) MT024288 1 polyp

H. carnea

AEP ecto-GFP HydrATLAS c8134_g1_i01 -

AEP Juliano aepLRv2 lcl|t9630aep -

Compagen HAEP_T-CDS_v02_12771

(MT024285) -

AEP1 This study (genomic) MT024281, MT024283 2 distinct polyps AEP2 This study (genomic) MT024282, MT024284,

MT024286 3 distinct polyps

H. vulgaris Hm-105

Hydra 2.0 genome

lcl|Sc4wPfr_417.3

H. carnea

AEP ecto-GFP HydrATLAS c21737_g1_i04 -

AEP ecto-GFP This study (genomic) MT024299 1 polyp AEP endo-GFP This study (genomic) MT024296 1 polyp

AEP Juliano aepLRv2 lcl|t12151aep -

Compagen HAEP_T-CDS_v02_6413 -

AEP2 This study (genomic) MT024300 1 polyp

AEP2 Q82-203 This study (genomic) MT024297 1 polyp (2 colonies) AEP2 Q82-293 This study (genomic) MT024298 1 polyp (2 colonies)

Table-S3: Accession numbers of the ms-c25145, ms-AIP, ms-DMTF1 microsatellite sequences

The Hydra 2.0 genomic sequences, the Juliano Trinity and Juliano aepLRv2 transcriptomic sequences are available at the NHGRI Hydra web portal https://research.nhgri.nih.gov/hydra/databases.shtml, the AEP ecto-GFP and H. oligactis sequences at HydrATLAS (https://HydrATLAS.unige.ch), the HAEP and Hm-105 transcriptomic sequences at Compagen (http://www.compagen.org/). “AEP” indicates that the strain was not characterized. Sequences MT024xyz from this study are available at: www.ncbi.nlm.nih.gov/genbank/

ms -c2 51 45 ms -AI P ms -DM TF 1

(5)

Figure S1: Phylogenetic reconstruction of the Hydra genus based on the analysis of the 16S ribosomal RNA sequences

The maximum likelihood (ML) tree of the 16S ribosomal RNA sequences was built by adding to the 89

sequence dataset available on Genbank (Martinez et al., 2010) nine sequences obtained in the present

study (written in red, see Table-S2 for accession numbers). The sequences were aligned with ClustalW

(BioEdit) and the tree was built after performing a ML 3.0 analysis using the GTR substitution model. The

robustness of the nodes was deduced from 1’000 bootstraps. This tree confirms the presence of six sub-

group/species in the Hydra vulgaris group, named H. vulgaris 1 to 5 and H. carnea. Note the position of the

AEP sequences within the H. carnea sub-group.

(6)

Hydra ms_c25145

>c25145_Hm105, 274 AAs long, Hm-105_lcl|Sc4wPfr_396.1

,

Hydra C25145_g1_i04

MFYIVHFLNDNTVEYVPKEWLNGNSECMWPKCSMTSLKGMRRKRQIPNKDWERYKIRILSTADCEERALEKLKISEETSDLVSEYEGNSCHRKTTSKRLSPSLFA SQIHGNMSSEDDSDFNMPTSLQQAVISTSTPGSQPLLPIPHHANVFREMQHQGKSSQSFVSLLNDPDEINLPSLYQEFLPIPYTKNSTNTLTPITQSIEYRLSSI ENLLKDLVKSVTSATKEIKHLIERMPIGHTEESLFTKSSSIEELDAVLLQCQDEEMASLFASFT

10 20 30 40 50 60 70 80 90 100 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein M F Y I V H F L N D N T V E Hm-105_lcl|Sc4wPfr_396.1 --- Hm-105_lcl|Sc4wPfr_1246 TTTTTTATAATCTGCACAAATAGTTTACATTATTTATATTTTTTACAGTGTTAAGATATGTTTTATATTGTTCATTTCCTTGACGACAGTACTGTGGAGT AEP_c25145_g1_i09 ---AGTGTAAAGATATGTTTTATATTGTTCATTTCCTTAACGACAATACTGTGGAGT AEP_c25145_g1_i04 ---AGTGTAAAGATATGTTTTATATTGTTCATTTCCTTAACGACAATACTGTGGAGT AEP_HAEP_T-CDS_v02_11692 ---TGTAAAGATATGTTTTATATTGTTCATTTCCTTAACGACAATACTGTGGAGT AEP_c25145_g1_i07 --- AEP_HAEP_T-CDS_v02_7716 -GACGGAAAAAAACACATACTGAAACTTTTTAGTCCCTGTGTAATAAGTGTAAAGATATGTTTTATATTGTTCATTTCCTTAACGACAATACTGTGGAGT Ho_CS_S040478c1g2_i08 ---GCTGTTCTTTTTGAACTCTTCTGTGTAAAGATATGTTTTATATTGTTCATTTCCTTAACGACAATACTGTGGAGT Ho_CS_S040478c1g2_i03 ---GCTGTTCTTTTTGAACTCTTCTGTGTAAAGATATGTTTTATATTGTTCATTTCCTTAACGACAATACTGTGGAGT Ho_CR_R039447c0g1_i0 ---TTTACAGTGTAAAGATATGTTTTATATTGATCATTTCCTTAACGACAATACTGTGGAGT Ho_CR_R039447c0g1_i2 ---TCCATATCCTTTTTCATTTATGCATATAGTGTAAAGATATGTTTTATATTGTTCATTTCCTTAACGACAATACTGTGGAGT

110 120 130 140 150 160 170 180 190 200 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein Y V P K E W L N G N S E C M W P K C S M T S L K G M R R K R Q I P N Hm-105_lcl|Sc4wPfr_396.1 ---AATGGAAACAGCGAGTGTATTTGACCAAAATGTAGCATCACTTCATTAAAAGGAATGCGCTGGAAGAGACAGATTCCCAA Hm-105_lcl|Sc4wPfr_1246 ATGTTCCAAAGAAAGGGTTGAATAGAAACAGCGAGTGTATGTGGGCAAAATGTAGCATCACTTTATTAAAAGGAATGCACCGGAAGAGACAGATTCCCAA AEP_c25145_g1_i09 ATGTTCCAAAGGAATGGCTTAATGGAAACAGCGAGTGTATGTGGCCAAAATGTAGCATGACTTCATTAAAAGGAATGCGCCGGAAGAGACAGATTCCCAA AEP_c25145_g1_i04 ATGTTCCAAAGGAATGGCTTAATGGAAACAGCGAGTGTATGTGGCCAAAATGTAGCATGACTTCATTAAAAGGAATGCGCCGGAAGAGACAGATTCCCAA AEP_HAEP_T-CDS_v02_11692 ATGTTCCAAAGGAATGGCCTAATGGAAACAGCGAGTGTATGTGGCCAAAATGTAGCATGACTTCATTAAAAGGAATGCGCCGGAAGAGACAGATTCCCAA AEP_c25145_g1_i07 ---AATGTAGCATGACTTCATTAAAAGGAATGCGCCGGAAGAGACAGATTCCCAA AEP_HAEP_T-CDS_v02_7716 ATGTTCCAAAGGAATGGCTTAATGGAAACAGCGAGTGTATGTGGCCAAAATGTAGCATGACTTCATTAAAAGGAATGCGCCGGAAGAGACAGATTCCCAA Ho_CS_S040478c1g2_i08 ATGTTCCAAAGGAATGGCTTAATGGAAACAGTGAGTGTATGTGGCCAAATTGTAGCATGACTTCATTAAAAGGAATGCGCCGGAAGAGACAGATTCCCAA Ho_CS_S040478c1g2_i03 ATGTTCCAAAGGAATGGCTTAATGGAAACAGTGAGTGTATGTGGCCAAATTGTAGCATGACTTCATTAAAAGGAATGCGCCGGAAGAGACAGATTCCCAA Ho_CR_R039447c0g1_i05 ATGTTCCAAAGGAATGGCTTAATG----TAGCGAGTGTATGTGGCCAAAATGTAGCATGACTTCATTAAAAGGAATGCGCCGGAAGAGACAGATTCCCAA Ho_CR_R039447c0g1_i02 ATGTTCCAAAGGAATGGCTTAATGGAAACAGTGAGTGTATGTGGCCAAATTGTAGCATGACTTCATTAAAAGGAATGCGCCGGAAGAGACAGATTCCCAA

210 220 230 240 250 260 270 280 290 300 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein K D W E R Y K I R I L S T A

Hm-105_lcl|Sc4wPfr_396.1 TAAAGATTAGGAAAGATAAAAAAATACGAATTTTATCTAATGCAGataaacacacatacatatatatgtatgtgtgtgtgtgtgtgtgtgtgtgtgtgtg Hm-105_lcl|Sc4wPfr_1246 TAAAGATTGGGAAAGATATAAA-ATTAGTA---Gataaacacacacacatatat---gtgtgtctgtgcgtgtgtgcgtgtg AEP_c25145_g1_i09 TAAAGATTGGGAAAGATACAAA-ATACGAATTTTATCTACTGCAGgtaaacacacacatatg---tgtgtgtgtttgtgtgtgtgtttg AEP_c25145_g1_i04 TAAAGATTGGGAAAGATACAAA-ATACGAATTTTATCTACTGCAGgtaaacacacacatatg---tgtgtgtgtttgtgtgtgtgtttg AEP_HAEP_T-CDS_v02_11692 TAAAGATTGGGAAAGATACAAA-ATACGAATTTTATCTACTGCAGgtaaacacacacatatg---tgtgtgtgtttgtgtgtgtgtgtg AEP_c25145_g1_i07 TAAAGATTGGGAAAGATACAAA-ATACGAATTTTATCTACTGCA--- AEP_HAEP_T-CDS_v02_7716 TAAAGATTGGGAAAGATACAAA-ATACGAATTTTATCTACTGCA--- Ho_CS_S040478c1g2_i08 TAAAGATTGG-AAAGATACAAA-ATACGAATTTTATCTACTGCA--- Ho_CS_S040478c1g2_i03 TAAAGATTGG-AAAGATACAAA-ATACGAATTTTATCTACTGCA--- Ho_CR_R039447c0g1_i05 TAAAGATTGGGAAAGATACAAA-ATACGAATTTTATCTACTGCAGgtaaacacacacatatg---tgtgtgtgtttgtgtatgtgtgtg Ho_CR_R039447c0g1_i02 TAAAGATTGG-AAAGATACAAA-ATACGAATTTTATCTACTGCA---

310 320 330 340 350 360 370 380 390 400 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

Hm-105_lcl|Sc4wPfr_396.1 cacgcgcacgcatttaaattatacctggtttattaatattactttaatgcacaatcaaatcaagtttttgttacttctttttg---a Hm-105_lcl|Sc4wPfr_1246 cgca---tttaaattatgcctggtttattaatattactttaatgcataatcaaaccaaatttttgttacttctctttg---a AEP_c25145_g1_i09 cg---tttaagttatacctggtttattaatattactttaatgcacaatcaactcacatttttgttactttgtactactttgactactttgtta AEP_c25145_g1_i04 cg---tttaagttatacctggtttattaatattactttaatgcacaatcaactcacatttttgttactttgtactactttgactactttgtta AEP_HAEP_T-CDS_v02_11692 cg---tttaagttatacctggtttattaatattactttaatgcacaatcaactcacatttttgttactttgtactactttgactactttgtta AEP_c25145_g1_i07 --- AEP_HAEP_T-CDS_v02_7716 --- Ho_CS_S040478c1g2_i08 --- Ho_CS_S040478c1g2_i03 --- Ho_CR_R039447c0g1_i05 cg---tttaagttatacctggtttattaatattactttaatgcacaatcaactcaaatttttgttactttgtactactttgactactttgtta Ho_CR_R039447c0g1_i02 ---

410 420 430 440 450 460 470 480 490 500 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein D C E E R A L E K L K I S E E T S D L V S E Y E G N S C H R K T T Hm-105_lcl|Sc4wPfr_396.1 cagACTGCGAGGAAAGAGCATTAGAAAAGTTAAAAATATCTGAAGAAACAAATGATCTTCCTTCAGTATATGAAGGTGATTCATGCCGTAGGAAAACAAC Hm-105_lcl|Sc4wPfr_1246 cagACTGTGAGGAAAGAGCATTAGAAAAGTTAAAAACATCTGATGAAACAAGTGATCTTGCTTCAGCAAATGAAAGTGATTCATGTCGTAGAAAAACAAC AEP_c25145_g1_i09 cagACTGTGAGGAAAGAGCATTAGAAAAGTTAAAAATATCTGAAGAAACAAGTGATCTTGCTTCAGAATATGAAGGTAATTCATGTCATAGGAAAACAAC AEP_c25145_g1_i04 cagACTGTGAGGAAAGAGCATTAGAAAAGTTAAAAATATCTGAAGAAACAAGTGATCTTGCTTCAGAATATGAAGGTAATTCATGTCATAGGAAAACAAC AEP_HAEP_T-CDS_v02_11692 cagACTGTGAGGAAAGAGCATTAGAAAAGTTAAAAATATCTGAAGAAACAAGTGATCTTGCTTCAGAATATGAAGGTAATTCATGTCATAGGAAACAA-- AEP_c25145_g1_i07 --gACTGTGAGGAAAGAGCATTAGAAAAGTTAAAAATATCTGAAGAAACAAGTGATCTTGCTTCAGAATATGAAGGTAATTCATGTCATAGGAAAACAAC AEP_HAEP_T-CDS_v02_7716 --gACTGTGAGGAAAGAGCATTAGAAAAGTTAAAAATATCTGAAGAAACAAGTGATCTTGTTTCAGAATATGAAGGTAATTCATGTCATAGGAAAACAAC Ho_CS_S040478c1g2_i08 --gACTGTGAGGAAAGAGCATTAGAAAAGTTAAAAATATCTGAAGAAACAAGTGATCTTGCTTCAGAATATGAAGGTAATTCATGTCGTAGGAAAACAAC Ho_CS_S040478c1g2_i03 --gACTGTGAGGAAAGAGCATTAGAAAAGTTAAAAATATCTGAAGAAACAAGTGATCTTGCTTCAGAATATGAAGGTAATTCATGTCGTAGGAAAACAAC Ho_CR_R039447c0g1_i05 cagACTGTGAGGAAAGAGCATTAGAAAAGTTAAAAATATCTGAAGAAACAAGTGATCTTGCTTCAGAATATGAAGGTAATTCATGCCGTATGAAATGAAC Ho_CR_R039447c0g1_i02 --gACTGTGAGGAAAGAGCATTAGAAAAGTTAAAAATATCTGAAGAAACAAGTGATCTTGCTTCAGAATATGAAGGTAATTCATGTCGTAGGAAAACAAC

510 520 530 540 550 560 570 580 590 600 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein S K R L S P S L F A S Q I H G N M S S E D D S D F N M P T S L Q Q Hm-105_lcl|Sc4wPfr_396.1 GTATAAACGATTATCCGTATTCATTATTTGTTTCTGAAACTCATGGCAATATGTATAGTGAAGATGATTTTGATTTCAACATGCCTTCTTCTCTTCAGCC Hm-105_lcl|Sc4wPfr_1246 GTCTAAACGATTATCC-CCTTCATTATTTGCTTCTTAAATTCATAGCAATATGTATAGTGAAGATGGTTCTGATTTCAACATGCCTTCATCTCTTCAGCC AEP_c25145_g1_i09 ATCAAAACGATTATCC-CCTTCATTATTTGCTTCTCAAATTCATGGCAATATGTCTAGTGAAGATGATTCTGATTTCAACATGCCTACATCTCTTCAGCA AEP_c25145_g1_i04 ATCAAAACGATTATCC-CCTTCATTATTTGCTTCTCAAATTCATGGCAATATGTCTAGTGAAGATGATTCTGATTTCAACATGCCTACATCTCTTCAGCA AEP_HAEP_T-CDS_v02_11692 --- AEP_c25145_g1_i07 ATCAAAACGATTATCC-CCTTCATTATTTGCTTCTCAAATTCATGGCAATATGTCTAGTGAAGATGATTCTGATTTCAACATGCCTACATCTCTTCAGCA AEP_HAEP_T-CDS_v02_7716 ATCAAAACGATTATCC-CCTTCATTATTTGCTTCTCAAATTCATGGCAATATGTCTAGTGAAGATGATTCTGATTTCAACATGCCTACATCTCTTCAGCA Ho_CS_S040478c1g2_i08 ATCAAAACGATTATCC-CCTTCATTATTTGCTTCTCAAATTCATGGCAATATGTCTAGTGAAGATGATTCTGATTTCAACATGCCTACATCTCTTCAGAC Ho_CS_S040478c1g2_i03 ATCAAAACGATTATCC-CCTTCATTATTTGCTTCTCAAATTCATGGCAATATGTCTAGTGAAGATGATTCTGATTTCAACATGCCTACATCTCTTCAGAC Ho_CR_R039447c0g1_i05 ---AATTCATGGCA--ATGTCTAGTGAAGATGATTCTGATTTCAACATGCCTACTTCTCTTCAGCA Ho_CR_R039447c0g1_i02 ATCAAAACGATTATCC-CCTTCATTATTTGCTTCTCAAATTCATGGCAATATGTCTAGTGAAGATGATTCTGATTTCAACATGCCTACATCTAATCAGCC

(7)

Hydra ms_c25145

610 620 630 640 650 660 670 680 690 700 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein A V I S Hm-105_lcl|Sc4wPfr_396.1 AGCTGTCATTTCTgtaagcttataaagtgacttcattaaaaacaagtgtaaacaagttaatgaaaaagtttttaaataattgttttaaatgtggaaatga Hm-105_lcl|Sc4wPfr_1246 AGCTGTCATTTCTataagcttataaagtggctttattaaaaataagtgtaaaaaatgttggaaaagcaaacttccatttgcttttccaacatatcctgct AEP_c25145_g1_i09 GGCTGTCATTTCT--- AEP_c25145_g1_i04 GGCTGTCATTTCT--- AEP_HAEP_T-CDS_v02_11692 --- AEP_c25145_g1_i07 GGCTGTCATTTCT--- AEP_HAEP_T-CDS_v02_7716 GGCTGTCATTTCT--- Ho_CS_S040478c1g2_i08 AGCTGTCATTTCT--- Ho_CS_S040478c1g2_i03 AGCTGTCATTTCT--- Ho_CR_R039447c0g1_i05 GGCTGTCATTTCT--- Ho_CR_R039447c0g1_i02 GGCTGTCATTTCT---

Hm-105_lcl|Sc4wPfr_396.1 aaatatttatttaaacatggacttacacttattgattacaatcaaaaaatatatatttttttaaattagttaaaattactactaaaattactagatttta 800 Hm-105_lcl|Sc4wPfr_1246 agtgcaggatatgttggaaaagcaaatggaagaagaagtctttacttgttggggtaccctctccaaatattttctccaaaaaaacttccaaccggtgggg 800

810 820 830 840 850 860 870 880 890 900 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein T S T P G S Q P L L P I P H H A Hm-105_lcl|Sc4wPfr_396.1 ttaattaacataaaattattttagACATCAACACCTAGTAGCCAACCATTACTGCCAATACCACAACATGGTgtaagtattaaacatgatgcttgatagc Hm-105_lcl|Sc4wPfr_1246 aagtttgtcgaagaatttactgga--- AEP_c25145_g1_i09 ---ACATCAACACCAGGTAGCCAACCATTACTGCCAATACCACATCATGCT--- AEP_c25145_g1_i04 ---ACATCAACACCAGGTAGCCAACCATTACTGCCAATACCACACCATGCT--- AEP_HAEP_T-CDS_v02_11692 --- AEP_c25145_g1_i07 ---ACATCAACACCAGGTAGCCAACCATTACTGCCAATACCACATCATGCT--- AEP_HAEP_T-CDS_v02_7716 ---ACATCAACACCAGGTAGCCAACCATTACTGCCAATACCACATCATGCT--- Ho_CS_S040478c1g2_i08 ---ACATCAACACCTAGTAGCCAACCATTACTGCCAATACCACATTATGCT--- Ho_CS_S040478c1g2_i03 ---ACATCAACACCTAGTAGCCAACCATTACTGCCAATACCACATTATGCT--- Ho_CR_R039447c0g1_i05 ---ACATCAACCCCTAGTAGCCAACCATTACTGCCAATACCACATCATGCT--- Ho_CR_R039447c0g1_i02 ---ACATCAACACCTAGTAGCCAACCATTACTGCCAATACCACATCATGCT---

910 920 930 940 950 960 970 980 990 1000 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein N V F R E M Q H Q G K S S Hm-105_lcl|Sc4wPfr_396.1 aatactttaagttaaaatttgttaatgttactattaggtattaaaatttgataaatgattagAATGTTTTTCGAGAGATCCAACACCAAGACAAATCTTG Hm-105_lcl|Sc4wPfr_1246 --- AEP_c25145_g1_i09 ---AATGTTTTTCGAGAGATGCAACACCAAGGAAAATCTAG AEP_c25145_g1_i04 ---ATT--- AEP_HAEP_T-CDS_v02_11692 --- AEP_c25145_g1_i07 ---AATGTTTTTCGAGAGATGCAACACCAAGGAAAATCTAG AEP_HAEP_T-CDS_v02_7716 ---AATGTTTTTCGAGAGATGCAACACCAAGGAAAATCTAG Ho_CS_S040478c1g2_i08 ---AATGTTTTTCGAGAGATGCAACACCAAGGAAAATCTAG Ho_CS_S040478c1g2_i03 ---AATGTTTTTCGAGAGATGCAACACCAAGGAAAATCTAG Ho_CR_R039447c0g1_i05 ---AATGTTTTTCGAGAGATGCAACACCAAGGAAAATCTAG Ho_CR_R039447c0g1_i02 ---AATGTTTTTCGAGAGATGCAACACCAAGGAAAATCTAG 1010 1020 1030 1040 1050 1060 1070 1080 1090 1100 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein Q S F V S L L N D P D E I N L P S Hm-105_lcl|Sc4wPfr_396.1 TCAAAGCTTCGTATCATTACCAAATGATCCTGAAGAAATAAATTTACCTTCAgtaagctttttgtaaattttattttagtaattatatgtttgctgttaa Hm-105_lcl|Sc4wPfr_1246 --- AEP_c25145_g1_i09 TCAAAGCTTTGTGTCATTACTAAATGATCCTGATGAAATAAATTTACCTTCA--- AEP_c25145_g1_i04 --- AEP_HAEP_T-CDS_v02_11692 --- AEP_c25145_g1_i07 TCAAAGCTTTGTGTCATTACTAAATGATCCTGATGAAATAAATTTACCTTCA--- AEP_HAEP_T-CDS_v02_7716 TCAAAGCTTTGTGTCATTACTAAATGATCCTGATGAAATAAATTTACCTTCA--- Ho_CS_S040478c1g2_i08 TCAAAGCTTTGTGTCATTACTAAATGATCCTGATGAAATAAATTTACCTTCA--- Ho_CS_S040478c1g2_i03 TCAAAGCTTTGTGTCATTACTAAATGATCCTGATGAAATAAATTTACCTTCA--- Ho_CR_R039447c0g1_i05 TCAAAGCTTTGTGTCATTACTAAATGATCCTGATGAATCAAATTTACTTTCA--- Ho_CR_R039447c0g1_i02 TCAAAGCTTTGTGTCATTACTAAATGATCCTGATGAATCAAATTTACTTTCA---

Hm-105_lcl|Sc4wPfr_396.1 gtaaaataattataattaacgatcattaaattaaaatatgcatagatgcaaattaaactagaaaattatatcttttaaattgtgtatgttgatattttaa Hm-105_lcl|Sc4wPfr_1246 ---

1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein L Y Q E F L P I P Y T K N S T N T L T P I T Q S Hm-105_lcl|Sc4wPfr_396.1 taatataattatactatattttgttggagTTATCTCAGAAGTTCTTGCCAATCCCTCACACCGAAAACTCCACCTACACCCTTACACCAATCACACAGTC Hm-105_lcl|Sc4wPfr_1246 --- AEP_c25145_g1_i09 --- AEP_c25145_g1_i04 --- AEP_HAEP_T-CDS_v02_11692 --- AEP_c25145_g1_i07 --- AEP_HAEP_T-CDS_v02_7716 ---TTATATCAGGAGTTCTTGCCAATCCCATACACCAAAAATTCCACTAACACCCTTACACCAATCACACAGTC Ho_CS_S040478c1g2_i08 ---GAGTTCTTGCCAATCCCATACACCAAAAATTCCACTAACACCCTTCCACCAATCACACAGTC Ho_CS_S040478c1g2_i03 ---GAGTTCTTGCCAATCCCATACACCAAAAATTCCACTAACACCCTTCCACCAATCACACAGTC Ho_CR_R039447c0g1_i05 ---TTATCTCAGGAGTTCTTGCCAATCCCATACACCAAAAATTCCACTAACACCCTTACACCAATCACACAGTC Ho_CR_R039447c0g1_i02 ---GAGTTCTTGCCAATCCCATACACCAAAAATTCCACTAACACCCTTACACCAATCACACAGTC

1310 1320 1330 1340 1350 1360 1370 1380 1390 1400 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein I E Y R L S S I E N L L K D Hm-105_lcl|Sc4wPfr_396.1 AATTGAATACCGATTTTCTTACATTGAAAACCTACTTAAAGATgaaaaatcttttaaagtacattaatttgtctttcttttttatacttgtaaaagttga Hm-105_lcl|Sc4wPfr_1246 --- AEP_c25145_g1_i09 --- AEP_c25145_g1_i04 --- AEP_HAEP_T-CDS_v02_11692 --- AEP_c25145_g1_i07 --- AEP_HAEP_T-CDS_v02_7716 AATTGAATACCGATTGTCCTCCATTGAAAATTTACTTAAAGAT--- Ho_CS_S040478c1g2_i08 AATTGAATACCGATTGTCCTCCATTGAAAATTTACTTAAAGGTgaaaaatcttttaaagtacatatattaatttgtctatcttttaaatacttataacag Ho_CS_S040478c1g2_i03 AATTGAATACCGATTGTCCTCCATTGAAAATTTACTTAAAGAT--- Ho_CR_R039447c0g1_i05 AATTGAATACCGATTGTCCTCCATTGAAAATTTACTTAAAGAT--- Ho_CR_R039447c0g1_i02 AATTGAATACCGATTGTCCTCCATTGAAAATTTACTTAAAGAT---

(8)

Hydra ms-c25145

1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 ...|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein L V K S V T S A T K E I K H L I

Hm-105_lcl|Sc4wPfr_396.1 tttgattaaat---TTAGTAAAATCTGTAACTTCTGCGACAAAAGAGATTAAGAGCGTATGCCAATTGgtcatactgaagagacagagcgtatgccaa Hm-105_lcl|Sc4wPfr_1246 --- AEP_c25145_g1_i09 --- AEP_c25145_g1_i04 ---TAGTAAAATCTGTAACGTCTGCGACAAAAGAGATTAAACATTTGATAG--- AEP_HAEP_T-CDS_v02_11692 --- AEP_c25145_g1_i07 --- AEP_HAEP_T-CDS_v02_7716 ---TTAGTAAAATCTGTAACGTCTGCGACAAAAGAGATTAAACATTTGATAG--- Ho_CS_S040478c1g2_i08 TTCGATTTGATTAGATTTAGTAAAATCTGTAACGTCTGCGACAAAAGAGATTAAACATTTGATAG--- Ho_CS_S040478c1g2_i03 ---TTAGTAAAATCTGTAACGTCTGCGACAAAAGAGATTAAACATTTGATAG--- Ho_CR_R039447c0g1_i05 ---TTAGTAAAATCTGTAACGTCTGCGACAAAAGAGATTAAACATTTGATAG--- Ho_CR_R039447c0g1_i02 ---TTAGTAAAATCTGTAACGTCTGCGACAAAAGAGATTAAACATTTGATAG---

1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 ...|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein E R M P I G H T E E S L F T K S S S I E E L D A V L L Hm-105_lcl|Sc4wPfr_396.1 ttggtcatactaagagacagAGCGTATGCCAATTGGTCACACTGAAGAAAGTTTATTCAAGAAATCAAGTAACATAAAAGAGTTAGATGCTGTGTTGTTG Hm-105_lcl|Sc4wPfr_1246 --- AEP_c25145_g1_i09 --- AEP_c25145_g1_i04 ---AGCGCATGCCAATTGGTCATACTGATGAAAGTTTATTTAAGAAAGCAAGTAATGTAGAAGAGTTAGATGCCATGTTGTTG AEP_HAEP_T-CDS_v02_11692 --- AEP_c25145_g1_i07 --- AEP_HAEP_T-CDS_v02_7716 ---AGCGTATGCCAATTGGTCATACTGAAGAAAGTTTATTTACGAAAT--- Ho_CS_S040478c1g2_i08 ---AGCGTATGCCAATTGGTCATACTGAAGAAAGTTTATTTACGAAATCAAGCAGCATAGAAGAGTTAGATGCTGTTTTGTTG Ho_CS_S040478c1g2_i03 ---AGCGTATGCCAATTGGTCATACTGAAGAAAGTTTATTTACGAAATCAAGCAGCATAGAAGAGTTAGATGCTGTTTTGTTG Ho_CR_R039447c0g1_i05 ---AGCGTATGCCAATTGGTCATACTGAAGAAAGTTTATTTACGAAATCAAGCAGCATAGAAGAGTTAGATGCTGTTTTGTTG Ho_CR_R039447c0g1_i02 ---AGCGTATGCCAATTGGTCATACTGAAGAAAGTTTATTTACGAAATCAAGCAGCATAGAAGAGTTAGATGCTGTTTTGTTG

1610 1620 1630 1640 1650 1660 1670 1680 1690 1700 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

C25145_g1 protein Q C Q D E E M A S L F A S F T * Hm-105_lcl|Sc4wPfr_396.1 CAATGTCAGGATGAAGAAATGGCCTCAATTTTTGCAAGTTTTATTTAAATATTATTTAAATACTTTTAAATTAAAACTCCGGTTGCATCCATTCAAAATC Hm-105_lcl|Sc4wPfr_1246 --- AEP_c25145_g1_i09 --- AEP_c25145_g1_i04 CAATGTCAGGATGATAAAATGACC--- AEP_HAEP_T-CDS_v02_11692 --- AEP_c25145_g1_i07 --- AEP_HAEP_T-CDS_v02_7716 --- Ho_CS_S040478c1g2_i08 CAATGCCAGGATGAAGAAATGGCCTCACTTTTTATTAACTGGCTAGCAACAGCAGGTGGAAAGTATATATCTGATATGGTACGAAACATTTTGAATGTTT Ho_CS_S040478c1g2_i03 CAATGCCAGGATGAAGAAATGGCCTCACTTTTTATTAACTGGCTAGCAACAGCAGGTGGAAAGTATATATCTGATATGGTACGAAACATTTTGAATGTTT Ho_CR_R039447c0g1_i05 CAATGCCAGGATGAAGAAATGGCCTCACTTTTTGCAAGTTTTACTTAAATATTATTGAAAAACTTTTTAATAAAAACTCCTGTTGCATCCATTGAAAAAT Ho_CR_R039447c0g1_i02 CAATGCCAGGATGAAGAAATGGCCTCAATTATTGGAAGTTTTACTTAAATATTATTGAAAACATTTTTTATAAAAACTCCGGTTGCAATCATTGAAAAAT

Figure S2: Alignment of the Hydra genomic and transcriptomic ms-c25145 sequences

Alignment of the ms_c25145 sequences identified in the AEP transcriptomes with three isoforms in the AEP1 strain (c25145_g1_i04, c25145_g1_i07, c25145_g1_i09) and two in the uncharacterized AEP strain HAEP (HAEP_T-CDS_v02_11692 and HAEP_T-CDS_v02_7716). The ms_c25145 sequences were also identified in H. oligactis transcriptomes with two isoforms in Ho_CS (S0404778c1g2_i08, S0404778c1g2_i06) and two in Ho_CR (R039447c0g1_i05, R039447c0g1_i02). These transcripts were detected in the Hm-105 genome (lcl|Sc4wPfr_396.1, lcl|Sc4wPfr_1246). For details, see Table-S3. Primer sequences used for ms_c25145 amplification are underlined and highlighted in grey. The microsatellite region, highlighted in yellow, is intronic (first intron). Putative intronic sequences are written lowercase.

The c25145_g1_i07 putative protein product (boxed) shows similarities with putative proteins from

bilaterians (see Figure S4).

(9)

Figure S3: Reproducibility of the amplified patterns corresponding to the ms-c25145 region

For each strain, 10 animals were macerated individually and the ms-c25145 region amplified.

(10)

Bilaterian sequences related to the orphan Hydra c25145 gene product

10 20 30 40 50 60 70 80 90 100 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

Hydra C25145_g1 ---MFYIVHFLNDNTVEYVPKEWLNGNSECMWPKC-SMTSLKGMRRKRQIPNKDWERYKIRILST--ADCEERALEKLKISEETSDLVSEYEGNS Crassostrea gigas ---MFAVVHFVDDESVECVPKSWLEGQY-CYWP---HLNAKKKIQKMSLPDKDTWKKYKYRKIGQ-DYEDYDTARKNLKKAEETSNLESEEESRK Danio rerio ---MFHIVEFIESSEVEVVPSSWVQNGA-CAWPSYKSMAKIHKAVTLQDSPNQSWATFRVRIIYT--TDSYEEARLKLPQATVMSDLQTDEDDDR Myripristis murdjan ---MFKIVEFLETNEVELVPGAWVKDNV-CLWPAL-RGKALETAIKQQVSPGPDWMTWNIRVMFT--TDNYQEGRQKVREAERRSDLQSDAEDCS Sinocyclocheilus rhinocerous MSPCEFAGMFHIVSFVETNEVEVVPSSWVHDEQ-CVWPNL-KGESLTKAVKLAMKPRKDWKKFRVKLLYT--TDNYEDARKKLPEAEVFSDIQSDAEGGV Ixodes scapularis XRATPDDKKFGVVKFVGDNTVAVIHLNWVDGAD-CFWPTA-THKNLGALTLEGAQPQPDWKKSRFASLGW--YDTYQKATSKLPTAELTSDLCSDVEMGR Nylanderia fulva ---MSWRVVHFIKDNTVEAGPALWVKDINGCFWPPC-SGLKLKNLIKNCVPPGHDWDLHQSRLIGE-LYGDLNVAKNKAAQAEETSDLASENEGSK Photinus pyralis ----MNSKTWTVVQFLDDLTVEAIPSTWIQGNE-CHWPSF-SMEKLHNAIRKSEPLNTCWPTHKIKIFRNATYGDYLKARNKARIAENTSDINTEPEDVE Sipha flava ---MWSIISFDNENAVEDVPSHWMKNNT-CVWP---KKDVKKHIQRRTNPNKFDFNYFKSRILKK-GIETLHETREKVKLAEDTSDLSN-IENSK

110 120 130 140 150 160 170 180 190 200 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

Hydra C25145_g1 CHRKTTSKRLSPSLFASQIHGN---MSSEDDSDFNMPTSLQQAVISTSTPGSQPLLPIPHHANVFREMQHQGKSSQSFVSLLNDPDEINL Crassostrea gigas RKLPARLISESDNDTDIESDIEGKTLPSLPKNTCSQKEKKRTTPVKKMPTLPSLDSSPLSPSPPASSVPVKKQNLATHSVKRQLLTSTTSIRRSPRSKST Danio rerio PSYTKRKNSDSDEEILSGRKRLG---KKGRMEDLTEIDDAPHIPSPPMTTAESFRTPARCTDTAHPSTPRNIYSPCSTAVGNQERTGCN Myripristis murdjan GRKARRKTPSTRLQDGAHLTDS---EDEAGPQQRNNGLPSAPQVSPPTYATLHPPMISHQSSASQSQNEMRHEVCQSPSSTYWNADQDHR Sinocyclocheilus rhinocerous KKPRRIMKSFRLQNFEVFNYSD---DDDDDDYGQNLRALEPPPHVQPPTFQSVSPLCQPASQPPASQPEGSKPSFYNPASQPPLTHQPSL Ixodes scapularis GRRKKAKRILYSETES---EGEET--- Nylanderia fulva RKIKRKRFTSGSDSESRPITVN---TFTKRKSNIHKDSEESEES--- Photinus pyralis VKRKRIQKILSSSEESIDDTIL---PPPPSISKYKAKKKTSTSTSTFKEVHITPGNDLGNGV--- Sipha flava WKKKTTAINLEP---

210 220 230 240 250 260 270 280 290 300 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

Hydra C25145_g1 PSLYQEFLPIPYTKNSTNT---LTPITQSIEYRLSSIENLLKDLVKSVTSATKEIKHLIERMPIGHTEESLFTKSSSIEELDAVL Crassostrea gigas LSASSAGTATPPRSTPSVSIQLPVAASDVRTSATKTLGESISDLLKQVISKLDKQQQDITAIKNHLISAVDVDLDTIESLLPSGNRLNTSAEVEEFQDSL Danio rerio SSCLS---LLTEVIKAQEVMKQQLDVILKKLHKQNSTLQCEDIPEPSTFDLPLSNLLDLEKLECQIKEQP-- Myripristis murdjan TSVQWHHHFE---SSQGHQKQPYAWTMQNSSKSGSYSEMCARTDAGHPSTLMDGTPQDSTQIQVPLVPQQNNTYH Sinocyclocheilus rhinocerous YQAASQLPSNRPVSDETSLNKPAGRPSLTHQPSLTHQPSHYQPASQPSLTHQPSLYEPASHPPLTHQPSLTHQPSHYQLASQPPVILQSSLFQSAIQPSS Ixodes scapularis --- Nylanderia fulva ---DESDTDNEINVPILKKTTKENSMTAASKIWLIFNLIQMKPTKDR--- Photinus pyralis ---HEATDNSFFENIENMHDDINDNYLEAENNNTCKNCRCKDCLEKDRALDRTNKQLMQ---- Sipha flava ---PQYIEKLHKNKRNDDLDARKILQ---

310 320 330 340 350 360 370 380 390 400 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

Hydra C25145_g1 LQCQDEEMASLFASFT--- Crassostrea gigas DDDSKKKLINAMASLQGGEHAGEICRAVMRSIMTNNCMSQFSGTGQKGKIAFIGTPLYKIILSAVRKASKKTIPFETIKREVLDVLRFAPHLPGGINYAK Danio rerio ---EQMKKLVAYFGIIGGFSTKEAVWRILGKLLANSLAKQINWSGANQKVAFRTLTLRTVVVNAVRTNGHTKSATDKEVEKYITRWLQLAPDRDGGRKER Myripristis murdjan SNPWSQPGPTPAWTPRAALETITSVHP--- Sinocyclocheilus rhinocerous DNSPTLCVSQSHSKEPADSESVFRRNQQFQSMLYNCATLKLKNDGAQFRHRLPVKDMESLLCLEAELKNLDTKSELLPFVCRARNTTN--- Ixodes scapularis --- Nylanderia fulva --- Photinus pyralis --- Sipha flava ---

410 ....|....|....|....

Hydra C25145_g1 --- Crassostrea gigas KKRGKKSNPKEGEFPPDSE Danio rerio QKTNV--- Myripristis murdjan --- Sinocyclocheilus rhinocerous --- Ixodes scapularis --- Nylanderia fulva --- Photinus pyralis --- Sipha flava ---

Figure S4: Alignment of the putative Hydra c25145 protein with related gene products identified in bilaterian species

Protein from Crassostrea gigas (XM_020063127), Danio rerio (XM_001344599.3), Ixodes scapularis

(XM_003920497.1), Myripristis murdjan (XM_030072039.1), Nylanderia fulva (XM_029320748), Photinus

pyralis (XM_031502844.1), Sinocyclocheilus rhinocerous (XM_016559820.1) and Sipha flava

(XM_025570128.1) were aligned with the deduced protein product encoded by the transcript

c25145_g1_i07 from Hydra AEP (HydrATLAS.unige.ch). Amino acids conservation is indicated by grey and

black backgrounds (50% similar and identical, respectively).

(11)

Hydra ms-AIP

10 20 30 40 50 60 70 80 90 100 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

Hm-105_lcl|Sc4wPfr_417.3 GGATACTAACCTTTTCCCCAGCGCATTTAATTTTAAAAACAATTCGTCGAGACAGCGTTTTCAAGATATAACAA-CTTCCAGCAAATTTTATTCTTTATT AEP_c8134_g1_i1 ---TATTCTTTATT AEP_HAEP_T-CDS_v02_12771 ---TTTT-AAAACAATTCGCCGAGACAGCGTTTTCAAGATATAACAAACTTCCAGCAAATTTTATTCTTTATT AEP_HAEP_T-CDS_v02_16467 ---

110 120 130 140 150 160 170 180 190 200 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

Hm-105_lcl|Sc4wPfr_417.3 TATTGTTCATCAAAAAAAATAAAAAATAAAAATATATATATATATATATATATATATATATATATATATATATATATATATATATATCTATAAATATAAA AEP_c8134_g1_i1 TATTGTTCATCAAAAAAAAA---TATATATGTATATATATATTTATTTATATATGTTAAAAAGTTTAAA AEP_HAEP_T-CDS_v02_12771 TATTGTTCATCAAAA---TATATATATATATATATATGTATATATATATTTATTTATATATGTTAAAAAACTTAAA AEP_HAEP_T-CDS_v02_16467 ---

210 220 230 240 250 260 270 280 290 300 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP M E E W L S L P D Hm-105_lcl|Sc4wPfr_417.3 AAACAAAGAAAAAAAGTAAATAAATACTTCGAATAACACATTGCTAGTTACATATTTATAAAAATTGGTTAGAATGGAAGAATGGTTATCATTACCAGAT AEP_c8134_g1_i1 AATTTTTGCAAAAAGGTAAAAAGATACTTCGGATAACACATTGCTAATTACATATTTATAAAAGTTGGTTAGAATGGAAGAGTGGTTATCATTACCAGAT AEP_HAEP_T-CDS_v02_12771 AATTTTTGCAAAAAGGTAAAAAGATACTTCGAATAACACATTGCTAATTACATATTTATAAAAGTTGGTTAGAATGGAAGAGTGGTTATCATTACCAGAT AEP_HAEP_T-CDS_v02_16467 ---

310 320 330 340 350 360 370 380 390 400 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP G V N K I I L A A G H G D I P S F P D G A K V L F H Y R A F S V N Hm-105_lcl|Sc4wPfr_417.3 GGAGTTAATAAGATTATACTTGCTGCTGGTCATGGCGATGTTCCTAGCTTTCCAGATGGAGCAAAAGTTTTATTTCATTATCGAGCATTCAGTGTCAACG AEP_c8134_g1_i1 GGAGTAAATAAGATTATACTTGCTGCTGGTCATGGCGATATTCCTAGCTTTCCAGATGGAGCGAAAGTTTTATTTCATTATCGAGCATTCAGTGTCAACG AEP_HAEP_T-CDS_v02_12771 GGAGTAAATAAGATTATACTTGCTGCTGGTCATGGCGATATTCCTAGCTTTCCAGATGGAGCGAAAGTTTTATTTCATTATCGAGCATTCAGTGTCAACG AEP_HAEP_T-CDS_v02_16467 ---

410 420 430 440 450 460 470 480 490 500 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP D D G E Q K I L D D S R A D N A P F E L L L G K K F K L E I W E A L Hm-105_lcl|Sc4wPfr_417.3 ATGACGGGGAACAAAAGATTTTGGATGATTCAAGAGCTGATAATGCACCATTTGAGTTACTACTCGGTAAGAAGTTTAAATTGGAAATTTGGGAAGCATT AEP_c8134_g1_i1 ATGATGGGGAACAAAAGATTTTAGATGATTCAAGAGCTGATAATGCACCATTTGAGTTACTACTCGGTAAGAAGTTTAAGTTGGAAATTTGGGAAGCATT AEP_HAEP_T-CDS_v02_12771 ATGATGGGGAACAAAAGATTTTAGATGATTCAAGAGCTGATAATGCACCATTTGAGTTACTACTCGGTAAGAAGTTTAAGTTGGAAATTTGGGAAGCATT AEP_HAEP_T-CDS_v02_16467 ---

510 520 530 540 550 560 570 580 590 600 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP I K T M R I N E I A E F H C D I K H V S T Y P V V S K S L R D M K Hm-105_lcl|Sc4wPfr_417.3 AATTAAAACAATGAGAATAAATGAAATTGCTGAATTTCATTGTGATATAAAGCATGTTTCTACTTACCCTGTTGTTTCTAAAAGCTTAAGAGATATGAAG AEP_c8134_g1_i1 AATTAAAACAATGAGAATAAATGAAATTGCCGAATTTCATTGTGATATAAAGCATGTTTCTACATACCCTGTTGTTTCTAAAAGTTTAAGAGACATGAAG AEP_HAEP_T-CDS_v02_12771 AATTAAAACAATGAGAATAAATGAAATTGCCGAATTTCATTGTGATATAAAGCATGTTTCTACATACCCTGTTGTTTCTAAAAGTTTAAGAGACATGAAG AEP_HAEP_T-CDS_v02_16467 ---

610 620 630 640 650 660 670 680 690 700 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP K K A N K H D H D H N H E P G H Q C G F A A L S Q G L G Y S D L D Hm-105_lcl|Sc4wPfr_417.3 AAAAAAGCTAATAAACACGACCATGATCACAATCATGAACCAGGACACCAATGTGGGTTTGCAGCACTTTCACAAGGTTTAGGGTATTCTGATTTAGATG AEP_c8134_g1_i1 AAAAAAGCCAACAAACACGACCATGATCACAATCATGAACCAGGACACCAATGTGGGTTTGCAGCACTTTCACAAGGTTTAGGGTATTCTGATTTAGATG AEP_HAEP_T-CDS_v02_12771 AAAAAAGCCAACAAACACGACCATGATCACAATCATGAACCAGGACACCAATGTGGGTTTGCAGCACTTTCACAAGGTTTAGGGTATTCTGATTTAGATG AEP_HAEP_T-CDS_v02_16467 ---

710 720 730 740 750 760 770 780 790 800 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP E Y Y K D P K P L K F Q I E L L K V D L P G E Y E Q D V W S L T P E Hm-105_lcl|Sc4wPfr_417.3 AATACTACAAAGATCCAAAACCTTTAAAGTTTCAAATTGAATTGCTTAAAGTAGATCTTCCAGGCGAATATGAACAAGATGTTTGGTCTTTAACTCCTGA AEP_c8134_g1_i1 AATACTACAAAGATCCAAAACCTTTAAAGTTCCAAATTGAATTGCTTAAAGTAGATCTACCAGGCGAATATGAACAAGATGTTTGGTCTTTGACTCCTGA AEP_HAEP_T-CDS_v02_12771 AATACTACAAAGATCCAAAACCTTTAAAGTTCCAAATTGAATTGCTTAAAGTAGATCTACCAGGCGAATATGAACAAGATGTTTGGTCTTTGACTCCTGA AEP_HAEP_T-CDS_v02_16467 ---

810 820 830 840 850 860 870 880 890 900 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP Q Q L Q Q I P V W K E E G N T Y F R K G E L D S A S Y K Y S Q A L Hm-105_lcl|Sc4wPfr_417.3 ACAACAACTTCAACAAATACCTGTTTGGAAGGAAGAAGGAAACACATTTTTTCGGAAAGGTGAACTTGACAGTGCAAGCAATAAATATTCTCAAGCTCTT AEP_c8134_g1_i1 ACAGCAACTTCAACAAATACCTGTTTGGAAGGAAGAAGGAAACACATATTTTCGGAAAGGTGAGCTTGACAGTGCTAGCTATAAATATTCTCAAGCTCTT AEP_HAEP_T-CDS_v02_12771 ACAGCAACTTCAACAAATACCTGTTTGGAAGGAAGAAGGAAACACATATTTTCGGAAAGGTGAGCTTGACAGTGCTAGCTATAAATATTCTCA--- AEP_HAEP_T-CDS_v02_16467 ---CTAGCTATAAATATTCTCAAGCTCTT

910 920 930 940 950 960 970 980 990 1000 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP G C L E K L I L R E K P G S E E W I A L D N M K I P L L L N F S Q Hm-105_lcl|Sc4wPfr_417.3 GGTTGTTTAGAAAAACTAATTTTAAGAGAAAAACCAGGTTCAGAAGAATGGATTGTGTTAGACAATATGAAAATTCCTTTACTTTTAAATTACTCTCAGT AEP_c8134_g1_i1 GGTTGTTTGGAAAAGCTAATTTTAAGAGAAAAACCAGGTTCAGAAGAATGGATTGCGTTGGACAATATGAAAATTCCTTTACTTTTAAATTTCTCTCAGT AEP_HAEP_T-CDS_v02_12771 --- AEP_HAEP_T-CDS_v02_16467 GGTTGTTTGGAAAAGCTAATTTTAAGAGAAAAACCAGGTTCAGAAGAATGGATTGCGTTGGACAATATGAAAATTCCTTTACTTTTAAATTTCTCTCAGT

1010 1020 1030 1040 1050 1060 1070 1080 1090 1100 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP C M I A K K E Y Y K A I E H L T T V I E K D K N N V K A L F R R A Q Hm-105_lcl|Sc4wPfr_417.3 GTATGATTGCCAAAAAAGAATATTATAAAGCAATTGAACACTTAACTACTGTTATTGAGAAAGATAAAAATAACGTCAAGGCTCTCTTCAGAAGAGCACA AEP_c8134_g1_i1 GTATGATTGCCAAAAAAGAATATTATAAAGCAATTGAACACTTAACTACTGTTATTGAGAAAGATAAAAATAATGTCAAGGCTCTCTTCAGAAGAGCACA AEP_HAEP_T-CDS_v02_12771 --- AEP_HAEP_T-CDS_v02_16467 GTATGATTGCCAAAAAAGAATATTATAAAGCAATTGAACACTTAACTACTGTTATTGAGAAAGATAAAAATAATGTCAAGGCTCTCTTCAGAAGAGCACA

(12)

Hydra ms_AIP

1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP A Y H A V F S L L E S R Q D Y E A V K K L D S S L L N T V E I E L Hm-105_lcl|Sc4wPfr_417.3 AGCTTATCATGCTGTCTTCAATTTACGCGAATCACGTCAAGATTATGAGGCAGTGAAAAGACTTGATAGCTCATTATTAAATACTGTTGAAATTGAGTTG AEP_c8134_g1_i1 AGCTTATCATGCTGTCTTCAGTTTACTCGAATCACGTCAAGATTATGAGGCAGTGAAAAAACTTGATAGCTCATTATTAAATACTGTTGAAATTGAGTTA AEP_HAEP_T-CDS_v02_12771 --- AEP_HAEP_T-CDS_v02_16467 AGCTTATCATGCTGTCTTCAGTTTACTCGAATCACGTCAAGATTATGAGGCAGTGAAAAAACTTGATAGCTCATTATTAAATACTGTTGAAATTGAGTTA

1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

AIP_AEP K K I S L D E K N K E K E D R E I F K K A F S S * Hm-105_lcl|Sc4wPfr_417.3 AAAAAAATTTCTTTAGATGAAAAAAATAAAGAAAAAGAAGACAGAGAAATCTTTAAAAAAGCATTTTCAAGTTGAAATTTTTAATTTTTTTAAAAAACAG AEP_c8134_g1_i1 AAAAAAATTTCTTTAGATGAAAAAAATAAAGAAAAAGAAGACAGAGAAATCTTTAAAAAAGCATTTTCAAGTTAAGAATTTTATTTAAAAAAAAAAAAAA AEP_HAEP_T-CDS_v02_12771 --- AEP_HAEP_T-CDS_v02_16467 AAAAAAATTTCTTTAGATGAAAAAAATAAAGAAAAAGAAGACAGAGAAATCTTTAAAAAAGCATTTTCAAGTTAAGAATTTTATTTAAAAAAAAAAAAAC

1310 1320 1330 1340 1350 1360 1370 1380 1390 1400 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

Hm-105_lcl|Sc4wPfr_417.3 TATCAGCCAATATTTAAAGTTATAATAAAATTTACATTTTAAACAGTATCAGCCAATATTTATAAAAAAAGTTATGTTTATAAATGTTTAGTTTTTATGT AEP_c8134_g1_i1 CAGTATCAGCCAATATTTAAAGTTATAATAAAATTTACATTTTAAACAGTATCAGCAAATATTTATAATAAAAGTTATGTTTATAAATATTTAGTTTTTA AEP_HAEP_T-CDS_v02_12771 --- AEP_HAEP_T-CDS_v02_16467 AGTATCAGCCAATATTTAAAGTTATAATAAAATTTACATTTTAAACAGTATC---

1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

Hm-105_lcl|Sc4wPfr_417.3 AAGCCTTAAATTATTTTAATAAATAGTATTCAATGTCCACTAGTATTAATTTTAATTTTTTTCTTTGATATATATGGTTAGAGTGGTTACTTAATTATTT AEP_c8134_g1_i1 TGTAAGCCTTAAATTATTTTGATAAATAGTTAGTATTCAATGTCCACTAGTAATAATTTTAATTTTCCCCATTGATATATAGGATTACAGTGG--- AEP_HAEP_T-CDS_v02_12771 --- AEP_HAEP_T-CDS_v02_12771 ---

Figure S5: Alignment of the Hydra genomic and transcriptomic sequences corresponding to ms-AIP

Alignment of the ms-AIP sequences identified in AEP transcriptomes (c8134_g1_i1, HAEP_T-

CDS_v02_12771, HAEP_T-CDS_v02_16467) and Hm-105 genome (lcl|Sc4wPfr_417.3, see Table-S3). The

sequences coding for the predicted AIP protein are boxed. The microsatellite ms-AIP region, located in the

5’ untranslated region (5’UTR), is highlighted in yellow. The sequences of the primers used for ms-AIP

amplification are underlined and highlighted in grey.

(13)

Hydra ms-DMTF1

10 20 30 40 50 60 70 80 90 100 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP M A N F c21737_g1_i4 --- HAEP_T-CDS_v02_6413 GTAGTACGCGGGGACGGAAAAAAACACATACTGAAACTTTTTAGTCCCTGTGTAATAAGTTAATATACAAATAAAATAATATATAAAATGGCTAATTTTG lcl|Sc4wPfr_307 TATTTTATAAAAGTGCATTTGTTTATCTAACATAAAATTTTTTTTTTTTTTTTTTTTAGTTAATATACAAACAAAACAATATAGAAAATGGCTAATATTG 110 120 130 140 150 160 170 180 190 200 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP E N R Q K N T R T R K R R S N S D S E L V L A N Y S E K C F S A S S c21737_g1_i4 --- HAEP_T-CDS_v02_6413 AAAACAGACAAAAAAATACACGTACTAGAAAGCGAAGATCAAATAGTGATAGTGAATTGGTGCTAGCCAACTATTCAGAAAAGTGTTTTTCAGCATCATC lcl|Sc4wPfr_307 AAAACAGACAAAAAAATACACGTACTAGAAAGCGAAGATCAAATAGTGATAGTGAATTGGTGCTAGCCAACTATTCAGAAAAGTGTTTTTCAGCATCATC 210 220 230 240 250 260 270 280 290 300 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP P D Q K Y F F N P S I G I N S Y A I D D I D I S A

c21737_g1_i4 --- HAEP_T-CDS_v02_6413 TCCTGATCAAAAATATTTCTTTAATCCTTCTATTGGAATTAATTCATATGCAATTGATGACATTGACATTTCTGCA--- lcl|Sc4wPfr_307 TCCTGATCAAAAATATTTCTTTAATCCTTCTATTGGAATCAATTCGTATGCAATTGATGACATTGACATTTCTGCAGgtaaaattaagcaatttttattt lcl|sc4wpfr_307 acaagcaaattgtaaataaatcatccaaattatatcttaactaggctatatattttatcgtaactttaacttatcatgtttaaattagcttaaaagtgtt 400 lcl|sc4wpfr_307 tgttgtgtttttattttaattttaaattcaattttaaaagtttattttatcaaattttgataacattcccaatgttatgtgttagtttaagttaattttt 500 lcl|sc4wpfr_307 ctttaaacaaagcatataagtttatatctttgttgcttatacagtgggatggatgtgtcacaaatttattatcttctcttataaaaatataattggtttt 600 lcl|sc4wpfr_307 agagttgagttagatttattgaaatcgtaaaattaatattagttagctatttgtgtagttgatgtgtttctaaatatccgcacaaataattttttttaaa 700 lcl|sc4wpfr_307 catgttaagaaaataagaataaaagaatattggaacttcnnnnnnnnnnnnnnnnnatacatatatatatatatatatatatatatatatatatatatat 800 lcl|sc4wpfr_307 atatatatatatatatatatatatatatatatatatatatatatatatatatatatattaattgtacaaagttgcttaaaaaagtaattgttgttttgat 900 lcl|sc4wpfr_307 ttaataagtaatgagttaattatgttgaaacttttcaaagaacttgagttgcttatcatgttgcacttgttttttttcaaaaataattaatgattctatt 1000 lcl|sc4wpfr_307 agtactggatgtttcccacaaaaattaaaactagctatgataaaacctgttaaatatcaaattgagaaaaatcttgatcataatgaaattattctgatta 1100 lcl|sc4wpfr_307 atcagtttagcatcaaaaagaagtgcaatgcagtacatactaatttaaaaattctcaatatgacaacggactatagaaaccaaaataaaatggttgcatt 1200 lcl|sc4wpfr_307 cattttacttgatataaaaaaagcttttgatacctgagaccattatttacaaaaagctcaaaaaacattgttgccagtgaaaaaaatttaaaacagatat 1300 lcl|sc4wpfr_307 cttcatatttataacatatattaacaaacagaaggtagtcagttgttattggaagttctacatcaaaagaaagagtagtaaagttaggtgttggtcaaga 1400 lcl|sc4wpfr_307 aacatgtatgcccattacttttcaaatttatatttatgatttaccagatgcaacagacttagacactatttgttttgctgttgatacaacaatgatggca 1500 lcl|sc4wpfr_307 attgtttacactattaaaaagttcaggaaatatgttgcaggaaattagaaaaaattaataattggtttttaataaacagatcacttcatcctgaaaaaac 1600 lcl|sc4wpfr_307 aaaaattaacgatttatggtaacgcaaaaaatatagaaatgttacaaaagcttaaggttacccaaagaaatttataaagaaaaaagtgttagcgttcttg 1700 lcl|sc4wpfr_307 gtattctttgggacgacaaaatgaaatggcatcgccaaaaaccatatagtagaaacatgaacaaagataagtaaaggcatctacctacttaaaaagttca 1800 lcl|sc4wpfr_307 ataaactattgcctagtaaatctaaagttgttttatacaatgctttaattagaagccatttaatgtatggtattgatatttaaaattgaaacagtaaatc 1900 lcl|sc4wpfr_307 aaaaaaaattatgcaactcaaatgtttacaaagctcctcagattattggtcctaacaaggtacacacaagaccaatcctaaaaaaattcgttattgttag 2000 lcl|sc4wpfr_307 atcaagaggattaaatggctattagaatccaaacatggaagatatgtgttggatcagcaccatcatctttaaataatgattttatctgggttaacattga 2100 lcl|sc4wpfr_307 aaaatctttgagagttaacagaagaatagctcttcctaactttaagagttgtgtgttggcaaatcaagcccctaacaaaattggaaatgaagctaattga 2200 lcl|sc4wpfr_307 ttgaaagaaaaaacctttgtgctcttaatatggcttcaaaatgtcacaatatctgttgtgctgaatgttaattgtaaaattttgtttgatttttttaaaa 2300 lcl|sc4wpfr_307 caatatatcaaatgtaaaaattaggaaataaagaagacacctttcattaagtattataccctttcagttttcaagttaaatttacctttttattgtaaat 2400 lcl|sc4wpfr_307 ttatataatactgaagaaattatttatatatatatatatatatatatatatatatatatatatatatatatatatatatatatatatatatatatatata 2500 lcl|sc4wpfr_307 tatatattattttatttttatttcaattcacctcctcaatgccgagaaggccactacagacgaggaggctacttatttgtgattataagcctctctcaac 2600 lcl|sc4wpfr_307 tctataactccgaaacatgaaccttgatgaataaggctgctgcgccgagaaacggtttgagtgcggtactaccagggacgtggtggaaatcaaactcgga 2700 lcl|sc4wpfr_307 accactcgtttatgaagcgagcgctctaccactacaccactaccgcatataaggagaacatgcaagggaaaataaggatataaggagaacatgtaaggaa 2800 lcl|sc4wpfr_307 aaagactgatgcaaggggaacaatgcaacatgcacacatatatatacaggagctattctaggaaaaaaatatgggcggcagtacccatgtatatatatgt 2900 lcl|sc4wpfr_307 atatatatatagaatagcccctgatatataaaggccttggcgggaagcgagagctttagctcttgcttcccgttgacactcccctaaattggtttactga 3000

3010 3020 3030 3040 3050 3060 3070 3080 3090 3100 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP D N P F F N A R F T M D P A Q M F M S V K

c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ---GATAATCCATTCTTCAATGCTCGTTTTACAATGGATCCTGCACAGATGTTTATGTCTGTTAAA--- lcl|Sc4wPfr_307 agcaattaNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN

lcl|sc4wpfr_307 nnnnnnnnnnnntacaccatacatatgaggcgggatgggatcactaggatatattttttcgtattcctcttttgaaaaacagtttcttttatttagtttt 3200 lcl|sc4wpfr_307 gaaagacatctacgaattttagctgcgtaatttgcagtagggtcttcacttactatttttgttgggcctatttgttcgcgaattttttccaaggcttttg 3300 lcl|sc4wpfr_307 aatgttcgattcgtacaaaacctgtccctttgtcgaatggatatatgtcaacgtttttttcctcttttatttctctataagctttccattgttcttttgt 3400 lcl|sc4wpfr_307 aagattattatttaatttttttccggtttttagttctcttaaaacatttttccttaggtcttgggcattttcaattttattgttgtattctaattttaac 3500 lcl|sc4wpfr_307 gcagaggattccgtggctgtaataatatccatatatggtatcgactttaaagatggtacaaagtgtggaccgaggtttagaaaattattatgacttactg 3600 lcl|sc4wpfr_307 gaatgtcctagttatttgggaacaaacaaaaacattaaaagtagaaaataaaaaatttgaaagaaaagttagggaagccctagaaatacaaaaaaacatg 3700 lcl|sc4wpfr_307 tgttctgcaaaaaatggcgggattaatctcgatgagggtcaatacgtaaaaactaagttttggacgccattttttaaatttcagcgaaaaagaagccatt 3800 lcl|sc4wpfr_307 caacagctgacgtcaatagcaacgttttaatttaaattataacgattttattaattactgtaacatttaacaagctgaagaagctggtatctaaaatcca 3900 lcl|sc4wpfr_307 gcgaaaatttctataataataaaaaaattataagtgttgagagaaatcgtatttttgatgttttaaaataatatataaatatactctcacacaagatgtt 4000 lcl|sc4wpfr_307 atcctttaaatcatatatatatatatatatattcctcaaattaaaagatcaggatgtgttttttatattatttatagatactataggcaattgtttatta 4100

4110 4120 4130 4140 4150 4160 4170 4180 4190 4200 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP E H D A S L D I S V S S T Q I E N c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ---GAACATGATGCATCATTGGACATTAGTGTATCTTCAACACAAATTGAAAAT lcl|Sc4wPfr_307 atatacactttgttaattaagaaataaaatttatatcttcaaatacaGAACATGATGCATCATTGAACATAAGTGTATCTTCAACACAAATTGAAAAT

4210 4220 4230 4240 4250 4260 4270 4280 4290 4300 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP N P T E L C K N E H E Y M N S E Y L N N V N S Q Q

c21737_g1_i4 --- HAEP_T-CDS_v02_6413 AATCCAACAGAACTTTGCAAAAATGAACATGAATACATGAACTCTGAATACCTAAATAATGTTAATTCTCAGCAG--- lcl|Sc4wPfr_307 AATCCAACAGAACTTTGCAAAAACGAACATGAATTCATGAACTCTGAATACCTAAATAATGTTAATTCTCAGCAGgttggtattttatattgcattgata

lcl|sc4wpfr_307 aaaaattttataaactttaaaacaaaatctgactgggcctgaagatctgattacagcatgtgaagctatatattaattgatcccatgttcaattaattga 4400 lcl|sc4wpfr_307 gcattcagtatttttgaaattgttttattcactctaaatgtatgaaattaattttaaagcttttttgtggtctgttttagtataaattttaagagattca 4500 lcl|sc4wpfr_307 attgtcttttcactaaatactgttatatataaatttaattcataaattctattaaatgtagattttactctaaataaaccaatgtttactttttgtcatt 4600 lcl|sc4wpfr_307 ttattggtttagaaagtttattgaagttcaatttatgatattatacgatcttagtcaagtttaatttatatataagctatgattacatgattatatataa 4700 lcl|sc4wpfr_307 tatgcctaaaacacagttttaagcatagataaaagacacttgtcttttatggcccaaggaccatctcaaaagaaatcataaaaaaaatccctgtcagcca 4800 lcl|sc4wpfr_307 tataatagtagtaagaatgaggtttgatagaattgacttttatgagatttgatagaaatgacttttaagagattttatagaatttcttctctctactttt 4900 lcl|sc4wpfr_307 tgtgagctaatcccaaaatttgctttgtattttaaatggtctctataccaaataaactttctataagaattttatagaaaatctaaatataatgaaatct 5000 lcl|sc4wpfr_307 aagtatttataagttgcagaaaataaatgtgtacaaaatataatttttatacttgcataaataaaagttttatatttattaatttgttttaatatgttgc 5100

5110 5120 5130 5140 5150 5160 5170 5180 5190 5200 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP D F Q T V S I N K D F E M

c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ---GATTTTCAAACTGTTAGCATAAACAAAGACTTTGAAATG--- lcl|Sc4wPfr_307 aacaatattctgaaatgtttttttcttcaGGATTTTCAAACTGTTAGCATAAGCAAAGACTTTGAAATGgtttcttatatacaaaattcaactgaaaaaa

(14)

Hydra ms-DMTF1

5210 5220 5230 5240 5250 5260 5270 5280 5290 5300 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP I P Y I Q N S A E R K D C V N K M W S L M K E D K K N L I E c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ---ATCCCTTATATTCAAAATTCAGCTGAAAGAAAAGATTGTGTTAATAAAATGTGGAGTCTGATGAAGGAAGATAAAAAAAATCTTATTGA lcl|Sc4wPfr_307 aagactttgaaAATCCTTATATTCAAAATTCAGCTGAAAAAAAAGAGTGTGTTAACAAAATGTGGAGTCTAATGAAGGAAGATAAAAAAAATCTTATTGA

5310 5320 5330 5340 5350 5360 5370 5380 5390 5400 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP K

c21737_g1_i4 --- HAEP_T-CDS_v02_6413 GAAAG--- lcl|Sc4wPfr_307 GAAAGgtaaaaacaaaaatttttatatctttaaatgagatgaaatccaatttatctaaagttatttatttatagataaatttaaatataaagtataaaaa

5410 5420 5430 5440 5450 5460 5470 5480 5490 5500 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP G L E W K S G L W S P G E E c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ---GTTTAGAATGGAAAAGTGGGTTATGGAGTCCTGGAGAGGAAA lcl|Sc4wPfr_307 tgtatataaattattaagtggaaaattagtatcaaaatttaaaaatgtattttagGTTTAGAATGGAAAAGTGGGTTATGGAGTCCTGGAGAGGAAA

5510 5520 5530 5540 5550 5560 5570 5580 5590 5600 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP I I L Q S N I T K Y C K

c21737_g1_i4 --- HAEP_T-CDS_v02_6413 TTATTTTACAATCAAACATCACCAAATATTGTAAA--- lcl|Sc4wPfr_307 TCATTTTACAATCTAATATCACCAAATATTGTAAAgtgtgtcattttgagtttcaatagtgtttttgtttttgcacttttttaaataaaaagttctctat

lcl|sc4wpfr_307 aaatttattaaataatcaaactgctatatattactaatataacttgcatttctatatactaacatctcccactaacatcttacatctcccactaatgatc 5700 lcl|sc4wpfr_307 tcaatcttaactttcatttcttctcttttttctctacaaattttttttttaatttttttattttattttgtttttcaacaaaagttaaatgtatgaatgc 5800 lcl|sc4wpfr_307 tatgttttataaataactcagagtaaaatatatagcattacattgtgttttaaaaagtttttatcagcattatcactattgcctaaaaagaaaataatga 5900 lcl|sc4wpfr_307 tagattttaaacaaaggttgaatgtttaggaaaacgtttataaattaacggaaaaataggtaatctaggtattataaatacgtaattgatattataatta 6000 lcl|sc4wpfr_307 ttatgtaccaagttttatttgaaattaaaatttaccttataacttgttaaactaaaaattctttaagtgttaaactttggctcagatgaatatacacgtt 6100 lcl|sc4wpfr_307 actattttaattaaaacaagaaaggttatagtagataacctaaagttatagtagataacctaaagttatagtagataacctaaagttatagtagataatc 6200 lcl|sc4wpfr_307 taaagttatagtagataacctaaagttatagtagataacctaaagttatagtagataacctaaattaaaatttttgtgtttgtacaaaacatttaaaggc 6300 lcl|sc4wpfr_307 acgaaccagattctgttttttacttttgttgtttataataattttcatgctttgaaatcacctttttaaataactttttatttgaaaacttgcaatttcg 6400 lcl|sc4wpfr_307 gaaacaaaactttaattagtctagcagcaatttctttcgttacgggaactatatctttgtctattcaattataatttataataatagatactatttatag 6500 lcl|sc4wpfr_307 gaatagataattttttttgtttttaaagatagatttaatcgtaaaagtttttagaaaagcaaaatttaaaattgttttctatcattttgaaaatattttg 6600 lcl|sc4wpfr_307 accgcataaaaagtttagatttcaactttttttaattacatagtaattaaataatagtagcagtcagcgaaacaataaattgtttttaaaaaactaactt 6700 lcl|sc4wpfr_307 tacaagctttttttttttcaatacttaaatcagcgatcatggttcttttaaataaaaaattttaggactgccacctatgccacctaattcccacctgatt 6800 lcl|sc4wpfr_307 gtagcaattgttcaattcaactcttgattgcaccgcagttgatttattctttaaaatttgttaatcatttaaagaatatagtaaaataatttttttttaa 6900 lcl|sc4wpfr_307 aaggcccttctaatataaaaaagcttaaaacttatgtgagattcccgtatagcctctggggccagcaagcactggaatttcttgtatttgcaatttcgtt 7000 lcl|sc4wpfr_307 tgaaatatatgaaaataaaaatttcaagattgtgtaattacggttagtttattttgattgtattgtaaaattgttagattatttttctaatagtgagtat 7100 lcl|sc4wpfr_307 tttctaaaaaaatattgaaaataaagtgttttattacttattattattttacactcagttttgaaattattcatttaaagatttgtataagttaattttt 7200 lcl|sc4wpfr_307 gaaattttgaagcatcaaaaagtataaaagtttgagattcaagatttcatcaaataattctcttatttgtaaatataaatagtttttgtataatttctat 7300 lcl|sc4wpfr_307 aaaaatattttctgcattcattttacagtttttttatttcgaaatgttaaatcataaaaaagcatttgataggttttaaaagtattcaaaaaattttaat 7400

7410 7420 7430 7440 7450 7460 7470 7480 7490 7500 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP K N G L S D A S I c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ---AAAAATGGTTTATCTGATGCATCCATA lcl|Sc4wPfr_307 ctattttattattcataaaagttaattaaaagtttattgaaaagaattatctaagttataaaaataactttagAAAAATGGTTTATCTGATGCATCCATA

7510 7520 7530 7540 7550 7560 7570 7580 7590 7600 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP M I F S T P R E K R K E F Y R S I

c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ATGATATTTTCAACTCCCAGAGAAAAGAGAAAGGAATTTTATCGATCTATAG--- lcl|Sc4wPfr_307 ATGATATTTTCAACTCCCAGAGAAAAGAGAAAGGAATTTTATCGATCTATAGgttaataaatattaaaaaataaatcatcttttattactagtacaaata

7610 7620 7630 7640 7650 7660 7670 7680 7690 7700 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP A I G L N R P L F T I Y R K V L c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ---CAATTGGTCTTAACCGACCATTATTCACTATTTATCGAAAAGTTTT lcl|Sc4wPfr_307 tcacatataataaaatgatttttaaaattttagcattcaccttttaattttagCAATTGGTCTTAACCGACCATTATTCACTATTTATCGAAAAGTTTT

7710 7720 7730 7740 7750 7760 7770 7780 7790 7800 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP R M C N Q K N Y V G K Y T Q V E V E K L A E L C R I H G N D W A T c21737_g1_i4 --- HAEP_T-CDS_v02_6413 AAGAATGTGCAATCAAAAAAACTATGTTGGAAAGTATACACAGGTTGAAGTTGAAAAACTTGCTGAACTTTGTCGTATTCATGGGAATGATTGGGCTACA lcl|Sc4wPfr_307 AAGAATGTGCAATGAAAAAAACTATGTTGGAAAGTATACACAGGTTGAAGTTGAAAAACTTGCTGAACTTTGTCGTATTCACGGGAATGATTGGGCTACA

7810 7820 7830 7840 7850 7860 7870 7880 7890 7900 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP I G H H L G R S P G S V R D K A R L L K C H K K R

c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ATAGGGCATCATCTTGGAAGAAGTCCTGGATCAGTTAGAGATAAAGCAAGACTTCTTAAATGTCATAAAAAGAGAG--- lcl|Sc4wPfr_307 ATAGGGCATCATCTCGGAAGAAGTCCTGGATCAGTAAGAGATAAAGCAAGACTTCTTAAATGTCATAAAAAGAGAGgtttttaatttttttttacatttc

7910 7920 7930 7940 7950 7960 7970 7980 7990 8000 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP G K W S E D E L K H c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ---GTAAATGGAGTGAAGATGAGTTAAAACA lcl|Sc4wPfr_307 aggggatgtgaattttttttatagcttatacctctaagtgttcaaaagtaaataaagctaaattgtttcagGTAAATGGAGTGAAGATGAGTTAAAACA 8010 8020 8030 8040 8050 8060 8070 8080 8090 8100 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP L S D I V H A Q T N T K K G E S V T V G I N W A K V A E N I E T R c21737_g1_i4 --- HAEP_T-CDS_v02_6413 TTTATCAGATATTGTTCATGCTCAAACAAACACTAAAAAAGGAGAAAGTGTAACTGTTGGAATAAACTGGGCAAAAGTAGCTGAAAATATTGAGACAAGA lcl|Sc4wPfr_307 TTTATCAGACATTGTTCATGCTCAAACAAATACTAAAAAAGGAGAAAGTATAACTGGAGGAATAAACTGGGCAAAAGTAGCTGAAAATATTGAGACAAGA

(15)

Hydra ms-DMTF1

8110 8120 8130 8140 8150 8160 8170 8180 8190 8200 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP T E K Q C R S K W

c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ACTGAAAAACAATGTCGATCAAAATG--- lcl|Sc4wPfr_307 ACTGAAAAACAATGTCGATCAAAATGgtatttattaattaaaagtaaatgtttttctctgtttaataatttgtaattattgtaggcattgtctcatgctc

lcl|sc4wpfr_307 cagatgaagttgcctgttttaataacattaaaattttggtttctcaaggtcaatgcggtagtggtgtagtggtagagcgctcgcttcataaacgagtggc 8300 lcl|sc4wpfr_307 tccaagttcgatccccaccacgtccctggtagtaccgcgctcaactcatttctccgcgcagcggccttgttcgtcaaggttcgtgtttcggagttataga 8400 lcl|sc4wpfr_307 gttgagaaagggttataaccacaaataagtagcctcctcatctgtagtggccttcacggccttgaggaggtgaattaaaacaaaaaaaaaaacaaaaaaa 8500 lcl|sc4wpfr_307 aaatacctgaaaagaacattgagagatgttctttttaggtatttgccccctcctccccctccccatattgcttggtacctgaaattatggttttcaattt 8600 lcl|sc4wpfr_307 gtttcttttagatttgtctaataaagttgtctattagagtttgtgtttctgagagagaagcgtgacaaagaaagtgattaaaaaaattacgataaaaaaa 8700 lcl|sc4wpfr_307 atcttatattgttaaataattaactttgtaaaaaaattatttgtatatttattttttctaaatatttttctgaaaaggagttttgcatgttctacatata 8800 lcl|sc4wpfr_307 tattagtcaatgtagtagcactcctcctatttgttgatgtaaagagtaaaataataaaaattatcatttagaatgtttttattaaaaaaattaaaaaaac 8900 lcl|sc4wpfr_307 attcaagcctataaagtttttaggttttttaaataatgataaaatttaagtttcctcaattaaattaacttttacataaagtgtacttgacgtcgctttt 9000 lcl|sc4wpfr_307 aacgacaaagagttgttaagagttttaccacaaacagtaaattttgtgtgtgtgtgtgtgtgtgtgtgtatttagatatttagatattaagtatgttttt 9100 lcl|sc4wpfr_307 ttcttttttctttaaaaaaaataaagttaaataaaaaataataatgtactttaagtggaaataggttttctgttggttttttttaccttttttcacatac 9200 lcl|sc4wpfr_307 tttttactcctcaactattttttttaacttttttgaaagttttaaaaagagttataaaaatgctaaatttttttgattttcgagctgaaaatagtgaaat 9300 lcl|sc4wpfr_307 ggtaaaatttcaagtttttgcagttgcaatttttgggctaccaatgggaacttggcagtgcacaataaatgttgtgcttgctcagtttctattggatgtc 9400 lcl|sc4wpfr_307 tttaattcaggtttattacctaacactaggcagttaaatagtttttcgtttagagggctaagtactacacatgttaagtcaagttcaccttttttctttt 9500 lcl|sc4wpfr_307 aatcaataatatacttaaaatattaagcattaaagactaacttttaaattaaaattctttaatatttatatactttcaatttttttttaatgatgacata 9600 lcl|sc4wpfr_307 aacctttctgttataataattaacaagtgagctgtaggagataattagcagctgtaggagataattaacagctgtaggagataatgaggagagatcactc 9700 lcl|sc4wpfr_307 tcgagatcagctctccaagtgatcaaaatgtgatgactttttattgagactgaagtatatagttgtgctgtcagcaaataaggaagcgaatacggaattt 9800 lcl|sc4wpfr_307 ataagaaaggttgtcagaaagatcattaatgtagatgaaaatgatacaggattttacattacttttttttaaataatgttaatttattaaatttattctt 9900 lcl|sc4wpfr_307 ttcttcactagagtagtagtaaatatttttatttcaaagacttttctaataatagtaagaaggctcattgacctataaaatttctaaaaataaagtcagt 10000 lcl|sc4wpfr_307 gtttgaacaataagtctgtctgaacaatctccagaatttttaagtcacatattttacagtagggaaaaaaattatttgttaaatattttagaggttaata 10100 lcl|sc4wpfr_307 aaagagagtattaaattgtggacatttatgtgaacattgtgctgtagacatttgtaaaagtgtgacagtggagaacacatttgtaagagtgtaacagtgg 10200 lcl|sc4wpfr_307 ggaaaaatttgtaagattgtgacagtgaaaaacacatttgtaaaagtgtgacagtggagaacttagttgtaagactgtgacagtggagatcacatttgta 10300 lcl|sc4wpfr_307 aaactgtgttatctggaccacaagctgtagaagggtttaggtgagaaataacagaagcaagagtggcgtagatatctagcagtgaattaaagtgaatggg 10400 lcl|sc4wpfr_307 ataataagaagagtcattagattcaagagattaagaggtttaaaataaaagttgtttgcaaatagttctgattgagagattaaatgcttgcttttattaa 10500 lcl|sc4wpfr_307 tgacattgtgtttttttattgctaaaaactgtctgataccaaaaaagtgtcagtttttagcattaataaaaagaaattctctagagagtttcatcttttc 10600 lcl|sc4wpfr_307 ttgtgaaaaagatgaaaaattgctagttagttagaaatagcagctatactagaatgtaaaaaccaagggtagattgagacttgacttgaaacaagaagga 10700 lcl|sc4wpfr_307 ataaaagtaattatgctttaatctagaagattataaaggaggaacaactttttagcacacaaagacattagcccaaatactatagcaatgaaaatcataa 10800 lcl|sc4wpfr_307 aatcctgtgagtcccagtcagctttatgatactaataaaaataggccacagcttctctaaaattttctaaagtcttctttttttaaaaatcttctcttaa 10900 lcl|sc4wpfr_307 ttcctctattttcctctaaaaagttagaaatgtgatcctaatttttctttaacttctcttccaacccccttcttgcatcatttcttgatggtagtaaatt 11000 lcl|sc4wpfr_307 gttaaaaatacccattcttggtcttcaaaactggttaacatcgaaaaggacattgggttgtaaaaaattgctttaacaaatccatgtcattaaacataaa 11100 lcl|sc4wpfr_307 aaatggcattattgacccaaactctacaagtgtggatacatggatgttaaacctatttttttgaaaaaaatcctctaaaatcctctatttttattcaaaa 11200 lcl|sc4wpfr_307 ttttctagttttgcaaaaaaattcttctaaattagatgcaaaatctcctttaaaatcctttaatgtactagtatgaagatttttgaatgcactcatgaat 11300 lcl|sc4wpfr_307 ttttgtgtactctttcgaatgtactcttacaaatttttaatgaaagtttttaatgcacgattataaaagttcttatgaaaattttatgtggccaccctga 11400 lcl|sc4wpfr_307 agaagtgtgacaccaaatgcactaacaggaacaccttccatgctcaacagcactgttatttgatattttatataacttactctgatattttatagctgtt 11500 lcl|sc4wpfr_307 gatagtatcagcagctaaaccatagttttcgagaaatctagctaccagcttcagaaccattaaatttagttttagaccttaccttcattaggagataata 11600 lcl|sc4wpfr_307 aaaagagtttctgctactaacacgcaacaaacagagtcaagaagatctagtgttcatcatcttttgctaccacaagcaacaaatagattcaacaagatct 11700 lcl|sc4wpfr_307 agtgttcatcatcctatacaggaaataaagaataaaaatgaattgtttttaatagaattttactttttaccaagtgcaccaaatcttttaataataattt 11800 lcl|sc4wpfr_307 aagttccatctgttaagtatctgttaagttcgatctttagattaataattattatttgcttattcacaatgattttttatatgcttgacctgtattaaat 11900 lcl|sc4wpfr_307 ttttcatatgcttgacctgtatcaaatctttaatatacttgacctgtatcaaatctttaatatacttgacagtgtatcaaatcttttatatgcttggcct 12000 lcl|sc4wpfr_307 gtatcaaatctttcatatgcttgacctgtattaaatttttcatatgcttgacctgtatcaaatcttctttcaatttattgtaaaatttggtttaaatttt 12100 lcl|sc4wpfr_307 ctgattatcttttatgttcttacacttttaagttactcgctttgttttctttctttttgttatccttgacattcttgtatgctccattttgatgttattt 12200 lcl|sc4wpfr_307 tatatataaatgcttaagttttctttaccatactgttgttggtaatgttaaattactaccataccttatttaatttgaagaaagtaaaatcaaaaatttt 12300 lcl|sc4wpfr_307 ttcttttatgttttattagttactgtctatttgttttttatgtttaattagttactttctatttgtttttttattttttattagttactgtcgatttgtt 12400 lcl|sc4wpfr_307 agcttaaagttgacaatcaatacttaacaataacgtaatgttcacagcacttattaaaaatgcaatttttaacaacttaatctttagctatttactataa 12500 lcl|sc4wpfr_307 atatctcttaaaatagttttatatcctaaaaatagttttaggacaattgtatactgcaaggtttgtgcttaaattaagtaatatgttcccatattttgat 12600 lcl|sc4wpfr_307 gtaatatatttttcatcaaatgatatgttaaagtagatctattcccaaaaatgtcttttccaattttttatacatttcagactaaaatatcccctcctcc 12700 lcl|sc4wpfr_307 taactttaataaactctgggattgtcgtagatcacttttaatattattttaataaacattttttagataattgtaagcatttattttagattattatttt 12800

12810 12820 12830 12840 12850 12860 12870 12880 12890 12900 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP L N F L N W S E T G G K K W N K F C D L E L I c21737_g1_i4 --- HAEP_T-CDS_v02_6413 ---GTTAAATTTTTTGAATTGGTCTGAAACTGGTGGTAAAAAATGGAATAAATTTTGTGATTTAGAGCTTATC lcl|Sc4wPfr_307 tcgtggcatatttttaaacttgtttcatagGTTAAACTTTTTGAATTGGTCTGAAACTGGTGGTAAAAAATGGAATAAATTTTGTGATTTAGAGCTTATC

12910 12920 12930 12940 12950 12960 12970 12980 12990 13000 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP N K

c21737_g1_i4 --- HAEP_T-CDS_v02_6413 AATAA--- lcl|Sc4wPfr_307 AGTAAgtaagtggattatgtttgctctttaactttttaataatctgactgtgagtgaggtaaatatttttatgacctgactgtgaggtacacttaaaata

lcl|sc4wpfr_307 aagaatttaaagaaatatctaaaaaaacatttttttgaacattagtaatatttaaagtcaatttatttacagagttatagtacccacatcagctgtcagt 13100 lcl|sc4wpfr_307 cctgcttagccaccatattagtggagccatgtttatttttacccctgatttaaagtatcatgttgacagcaaatagtttctactctatgatatcaaaaca 13200 lcl|sc4wpfr_307 gagaagtgtgacaagtattttatcaggttgagcaggtttttactttaatcaaaagaaatatccacttctgttactttttgttttttttaattcactatca 13300 lcl|sc4wpfr_307 atgactataccaatattggaataacaaatcatttttcttgcagcgtttgcagcataaatcaaactatatacagaaactaatactatatatactatataaa 13400 lcl|sc4wpfr_307 ctatatactatataaactatatactatataaactatatactatataaactatatactatataaactatatactatatatctaagcataaacatacatatg 13500 lcl|sc4wpfr_307 tttggttcaaaaaatatgtttttttaaacatcttttaaatgttaaaaaatttttttttgcagaccaaatgcaggtgggcatgttaaagagatgtgaagtt 13600 lcl|sc4wpfr_307 ttttacacctaaagtagttttgcatgttttacttcagaatatgatttaaaaactgctgctgttatatgtagaaaactatctattatatgtagaaactgct 13700 lcl|sc4wpfr_307 attatcatactatatctgttatatgtagaaactgctattatcatacgtagtaaactgctgctgttatatgtagaaaactgctgttatcatacgtagtaaa 13800 lcl|sc4wpfr_307 ctgctgctgttatatgtagaaaactagaaattagaaatagtttaggaaattgaaagtcaatttataaaagaatgttttctcaattttttgctctctatga 13900 lcl|sc4wpfr_307 aagagattttcataaaaacattgtatattaacatgaaaagttgtatattttttatacagtttataaatgtttaaattaattgcaacattttgtaaaaaat 14000 lcl|sc4wpfr_307 cttcgaaagttaaaaaaaggtaaatataaaaaaattaacttgatgcaaactgttttgacaactatttgagtatgcgttggatgtaagaatgtaaggatgt 14100 lcl|sc4wpfr_307 tcggatgtttgtaagaggtttgacagatgtctctatgaaaatgcatgccaactgtttaaaagctaaagtttctatgatggctaccagcgctcaaaataag 14200 lcl|sc4wpfr_307 ggtcaatcaacaatcaatgatcggctatttttagggtaatttcgaaaaattcaaggaaatataacctgtttttttgaaaaaattacatttgatcggcaag 14300 lcl|sc4wpfr_307 ctttgaaaaactatttcgagcgctgggctacgattattagagtaataattgtgtaattttaatactttgaaaaattttaaattaatgttaggaagttaat 14400 lcl|sc4wpfr_307 aatgaaatcaccttcttttaagtaatttttttttaaactaataataatagaaatatatttcttatttaaagaaataaatttaccaccccacaatttgttt 14500 lcl|sc4wpfr_307 cttgttattttaagaaataaattttttaaacttttaaacaatggtcttacgattttgctctatattcaagattacaacttttcaattgttcttaattacg 14600 lcl|sc4wpfr_307 tcagtgttaattaaaagagtgggtttgctcaaaacgttttaaacaaatcctcttttttaaaaacattgatgtcagttttttagtatttgttttctattac 14700

14710 14720 14730 14740 14750 14760 14770 14780 14790 14800 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP I G N L N V I N E S K I D W I S L A K D W C

c21737_g1_i4 ---AGTCTGGCTAAAGATTGGTGCAGGTCTAACTAATTTTAGTTTAGTTTAA HAEP_T-CDS_v02_6413 ---AATTGGAAATTTAAATGTTATCAATGAGTCAAAAATTGATTGGATCAGTCTGGCTAAAGATTGGTGC--- lcl|Sc4wPfr_307 attagAATTGGAAATTTAAATGTTATCAATGAGTCAAAAATTGATTGGAGCAATCTGGCTAAAGATTGGTGCAGgtctaactaattttagtttaaagcta

14810 14820 14830 14840 14850 14860 14870 14880 14890 14900 ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|

DMTF1_AEP S V R S P Q W L K H R W c21737_g1_i4 AGCTATTTAATTGTTTTTTTTATTTAAGTCTTTTTTCTCTAAGTTTGCATTAAGGTATTTTTCAGTGTTCGTTCACCACAGTGGTTAAAACACAGATGGC HAEP_T-CDS_v02_6413 ---AGTGTTCGTTCACCACAGTGGTTAAAACACAGATGGC