Abstrakt
Flere nyere undersøgelser har undersøgt funktionen og udviklingen af en Drosophila homolog til den menneskelige brystkræft modtagelighed gen
BRCA2
, opkaldt
dmbrca2
. Vi har tidligere identificeret, hvad syntes at være en nylig ekspansion i RAD51-bindende BRC-repeat array i stamfader til
Drosophila Yakuba
. I denne undersøgelse, vi undersøger mønstre af variation og evolution af
dmbrca2
BRC-repeat vifte inden
D. Yakuba
og dens nære slægtninge. Vi udvikler en model for, hvordan ulige overkrydsning kan have produceret den udvidet form, men vi observerer også korte gentagne former, typisk for andre arter i
D. melanogaster
gruppe, adskillelse inden
D. Yakuba
og
D. santomea
. Disse korte former synes ikke at være identiske-by-afstamning, hvilket tyder på, at historien om
dmbrca2
i
D. melanogaster
undergruppe har involveret gentagelsesenhed sammentrækninger resulterer i homoplasious former. Vi konkluderer, at den evolutionære historie
dmbrca2
i
D. Yakuba
og måske i andre Drosophila arter kan være mere kompliceret end kan udledes gennemgang af de offentliggjorte enkelt genom sekvenser pr arter
Henvisning:. Bennett SM, Mercer JM, Noor MAF (2010) slip- glidende Away: Serial Ændringer og Homoplasy i Gentag nummer i
Drosophila Yakuba
homolog af human Cancer modtagelighed Gene
BRCA2
. PLoS ONE 5 (6): e11006. doi: 10,1371 /journal.pone.0011006
Redaktør: William J. Murphy, Texas A M University, USA
Modtaget: 20. april, 2010; Accepteret: 17. maj 2010; Udgivet: Juni 8, 2010
Copyright: © 2010 Bennett et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Funding var leveret af National Science Foundation uddeler 0509780 og 0.715.484, og National Institutes of Health awards GM076051 og GM086445. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
Den menneskelige brystkræft modtagelighed gen
BRCA2
koder for et protein bredt studeret på grund af dens betydning i DNA-reparation [1] – [3]. Mutationer i human kimlinje
BRCA2
føre til en levetid øget følsomhed over for bryst- og kræft i æggestokkene [4], [5], måske som følge af ineffektiv reparation af DNA dobbelt strengbrud (DSBs) under homolog rekombination [6] – [8]. I funktionelle undersøgelser,
BRCA2
har vist sig at regulere RAD51 rekombinase, en vigtig nukleoprotein filament, der tillægger beskadiget, enkeltstrenget DNA på stedet for DSBs og er afgørende for initiering af reparationsprocessen [9]. BRCA2 binder sig til RAD51 ved association med sekvens motiver, kaldet “BRC gentagelser” [10], [11], som hver består af omkring 30 aminosyrer og findes i et højt konserveret region af
BRCA2
gen. Disse konserverede gentagelser har været nyttige i at identificere
BRCA2
homologer tværs af mange eukaryote arter, herunder,
Arabidopsis thaliana
,
Caenorhabditis elegans
,
Drosophila melanogaster
, og
Trypanosoma brucei
[12], [13]. Forskere stadig kæmper for at bestemme, hvordan
BRCA2
koordinerer sin RAD51 og ssDNA-bindende aktiviteter for at lette overførslen af RAD51 protein på DNA (men se [14]), men Pellegrini og Venkitaraman [9] foreslog, at “primitive organismer huser en enklere version af
BRCA2
protein vil give nyttige modelsystemer. “
en formodet enklere
BRCA2
homolog blev identificeret i modellen organisme
Drosophila melanogaster
hjælp sekvens fingeraftryk, der repræsenterer vigtige rester for
BRCA2-RAD51
interaktioner i locus
CG30169
, senere kaldet “
dmbrca2
” [15]. Funktionelle studier af denne Drosophila gen har vist, at det interagerer med
D. melanogaster RAD51 Hotel (
spnA
), og dens forstyrrelser påvirker satser mitotiske og meiotisk DNA-reparation og homolog rekombination [15] – [17], hvilket Kløvstad
et. al.
[16] for at konkludere, at Drosophila
BRCA2
betegner en funktionel homolog af genet, som kan anvendes til at karakterisere sin menneskelige modstykke. I modsætning til den pattedyr
BRCA, 2
der har otte BRC gentagelser,
D. melanogaster
homolog viste sig at indeholde tre gentagelser [13]. En senere undersøgelse af dette gen på tværs af de offentliggjorte Drosophila genomer viste stor variation i antallet af BRC gentagelser, med
D. melanogaster
og dens undergruppe med tre gentagelser (figur 1), mens andre, mere fjernt beslægtede arter såsom
D. pseudoobscura
og
D. persimilis
bærende op til elleve gentagelser [18]. Denne variation i antallet af BRC gentagelser blev også demonstreret inden for de enkelte arter samt; ti udvalgte stammer af
D. pseudoobscura
viste sig at have syv, ni eller elleve BRC gentagelser, måske indikerer seneste udvikling inden for dette gen [18].
Dette træ præsenteres antallet af “BRC” gentager fra den offentliggjorte genom sekvens for hver arter i slægten Drosophila. Den blå kasse fremhæver melanogaster gruppe, som har et mønster af tilsyneladende stabilitet i gentagelse nummer.
Selv om der er stor variation i gentagelse nummer på tværs af fylogeni af Drosophila, synes denne variation at være fraværende i melanogaster gruppe, hvor de arter, der har udgivet genom sekvenser alt indeholder 3 BRC gentagelser. Undtagelsen til dette mønster i melanogaster gruppe er
D. Yakuba
, hvis offentliggjorte genom sekvens af
dmbrca2
bærer fem BRC gentagelser. Observation af denne alternative gentagelse formular rejser flere spørgsmål: er denne højere gentagelse nummer reel eller et genom mis-samling artefakt [19]? Hvis det er ægte, er denne højere gentagelse nummer formular allestedsnærværende på tværs af alle
D. Yakuba
stammer, eller er en kortere form til stede i naturlige populationer? Kan vi udlede historiske ændring i antallet af gentagelser ved at analysere nukleotidsekvens? Og endelig, hvis der er alternative former, kan vi opdage beviser for tilhørende naturlig udvælgelse i spredningen af det store antal gentagelse formular? I denne undersøgelse undersøger vi sekvensen og udviklingen i antallet af BRC gentager i Drosophila homolog af
BRCA2
i
D. Yakuba
og sin søster arter
D. santomea
og læg det i en evolutionær sammenhæng. Forståelse de mønstre observeret i disse arter kan give os mulighed for bedre kender de genetiske processer der påvirker dette gen, der er vigtigt for den grundlæggende proces for rekombination og menneskers sundhed mere bredt.
Materialer og metoder
Drosophila
Aktier
Drosophila Yakuba
D. santomea Salg beholdninger, som anvendes i den foreliggende undersøgelse blev opnået fra Dr. Jerry Coyne [20]. Fluerne blev bevaret i absolut ethanol, indtil DNA’et blev ekstraheret i vores laboratorium.
DNA Isolation, PCR-amplifikation og sekventering
Genomisk DNA blev isoleret fra voksne
D. Yakuba
og
D. santomea
med en enkelt flue klemme-protokol [21]. Primere til PCR-amplifikation blev designet fra den offentliggjorte
D. Yakuba
genomsekvens samling [22]. De primere designet fra
dmbrca2
region blev anvendt til PCR amplifikation segmenter af genet i 25 pi reaktionsvolumener. Størrelser af PCR-produkter blev bekræftet ved elektroforese på en 1% agarosegel. PCR-produkter blev oprenset ved anvendelse ExoSAP-It (USB Corp.) og sekventeret under anvendelse ABI BigDye ved Duke University IgSP sekventering facilitet. Sekvenser blev deponeret i GenBank /EMBL databaser under accessionsnumre HM146151-HM146174.
Data Analyser
DNA-sekvenser blev tilpasset beregningsmæssigt bruger BioEdit 7.0.9 [23], og derefter modificeret ved manuel justering . DNAsp [24] blev anvendt til at estimere nukleotid mangfoldighed (pi) og Tajima s D [25], for
dmbrca2
region. Vi opnåede værdier Tajima s D for lignende loci i
D. Yakuba
og
D. santomea
fra Llopart
et. al.
[26] til sammenligning.
Vi undersøgte de sekventerede regioner for hver stamme og sammenlignede dem med fuldt samlet sekvens af denne region fra den offentliggjorte
D. Yakuba
genom [22]. I den offentliggjorte genom-regionen, vi kategoriseret de fem særskilte BRC gentager bruger diagnostiske aminosyrer og størrelse forskelle, nummerering dem numerisk 1 til 5 fra 5′-enden [18]. Vi oversatte DNA-sekvensen af exonerne vore stammernes sekvenser og manuelt sammenlignet enkelte gentagelse til de nummererede genom gentagelser under anvendelse af diagnostiske aminosyrer og størrelsesforskelle.
fylogenetisk analyse blev udført med PAUP * 4.0b10 [27 ]. BRCA2 gentagne motiver til
D. melanogaster
(DME),
D. sechellia
(DSE),
D. simulans
(DSI),
D. erecta
(Der), og
D. Yakuba
(dya) blev indhentet fra de FlyBase reference- genomer, og kombineret med
D. santomea
(DSA) og yderligere
D. Yakuba
sekvenser indsamlet til dette arbejde.
D. Yakuba
blev anvendt som en standard for nummerering gentagne motiver: 1-5 fra amino-enden til carboxyl-enden af peptidet.
D. persimilis Salg gentagelse 2 (Dpe2) blev anvendt som en udgruppe. Sekvensopstillinger blev udført i Seaview version 4.0 [28] med yderligere justeringer ved øjet. De sekvensmotiver blev afgrænset af den 35 aminosyrer lange Pfam skjulte Markov model (HMM) for BRCA2 gentagelser [29]. På grund af den korte sekvens længde og beskedne niveauer af sekvensvariation, var nabo-sammenføjning med ukorrigerede p-afstande valgt til træ estimation.
Resultater og Diskussion
Forud fylogenetisk analyse af den offentliggjorte
D. melanogaster
undergruppe genom sekvenser for gentagelserne afslørede to store clader: alle lige nummererede gentagelser og alle ulige gentagelser [18].
D. Yakuba
gentage 3 (Dya3) tilhørte ulige clade men var usædvanligt i ikke clustering med enten første eller tredje gentagelser, men i stedet resterende basal til begge (se figur 2). Visuel undersøgelse af aminosyren og nukleotidsekvenser afslørede, at 3′-enden af Dya3 boring stærk sekvenslighed med Dme1 og der1, medens 5′-enden besad et par diagnostiske aminosyrer, der lignede Dme3 og Der3 (figur 3). Denne observation tyder på, at der kan være forekommet en ulige-crossing løbet begivenhed (figur 4) mellem gentagelse 1 og gentag 3 giver anledning til en gentagelse udvidelse fra en nedarvet af tre BRC gentager til en afledt tilstand af 5 gentagelser historisk i
D . Yakuba
afstamning. Selvom Dya2 og Dya4 gentager klynge fylogenetisk, den 17% aminosyresekvens divergens og 18 aminosyrer hul i den offentliggjorte genom sekvens af Dya4 forhold til Dya2, viser, at en sådan begivenhed, hvis det skete overhovedet ikke forekommer i meget seneste tid.
Sekvenser inkluderet stammer fra
Drosophila melanogaster
(DME),
D. Yakuba
(dya),
D. sechellia
(DSE),
D. erecta
(Der), og
D. simulans
(DSI). Dya3c og Dya3n angive 5 ‘og 3’ regioner gentag 3.
Disse aminosyre oversættelser fra de offentliggjorte genom sekvenser af
Drosophila melanogaster
(DMEL),
D. Yakuba
(dya),
D. sechellia
(DSE),
D. erecta
, og
D. simulans
(DSI) er justeret og farvekodede for at fremhæve lighederne mellem dem. D. Yakuba gentag 3 (Dya3) er opdelt i to halvdele, der synes at gruppen som følger, den 3 ‘ender med 1st gentagelser og 5’-enden med 3. gentagelser.
D. Yakuba
homolog af
dmbrca2
i den offentliggjorte genom sekvens indeholder 5 BRC gentagelser [18]; men når vi visualiserede de amplificerede PCR-produkter af denne gentagne region i 43
D. Yakuba
og 18
D. santomea
stammer, fandt vi to klart forskellige størrelser bands. Det større produkt, observeret i 57 af de 61 stammer, svarede til den forventede størrelse i 5 BRC gentagelser. Derfor er den 5-repeat form, observeret i den offentliggjorte genomsekvens ikke fast inden naturlige populationer. Denne gentagelse nummer variation blev bekræftet ved sekventering 11 af de lange stammer og alle fire af de korte former, der viser, at de lange former besad de forventede 5 distinkte BRC gentagelser, mens de korte stammer besad kun 3.
Vi justeret den forudsagte aminosyresekvenser sammenlignet dem med individuelle offentliggjorte genom repeats (og specifikt aminosyrer, der optrådte “diagnostisk” med hensyn til Dya2 og Dya4), og opdagede hvad der synes at være flere korte former.
D. Yakuba
stammen Cascade 21 og
D. santomea
stammen LAGO 1482 har hver 3 af total gentagelser, som omfatter 1
st og 3
rd gentagelser, der ligner den fulde 1
st og 5
th gentagelser af den offentliggjorte
D . Yakuba
genomsekvens. Deres 2
nd repeat imidlertid begynder ved ligner 2
nd genom repeat-baseret på en diagnostisk aminosyre og tilstedeværelsen af en 18 aminosyre region specifik for Dya2-men skifter midtvejs at ligne Dya4 baseret på 4 diagnostiske aminosyrer (se figur 5).
D. Yakuba
stammen Cascade 24 og
D. santomea
stamme STO 7 har også kun 3 gentagelser, men meget mere af deres anden gentagelse ligner Dya4, herunder 18 aminosyrer trunkering (figur 5). Denne forskel tyder på, at mindst en trunkering begivenhed førte til fremkomsten af en ny form med tre BRC repeats- og disse korte former kan være uafhængige sletninger fra en lang, 5 gentag formular.
Disse aminosyre oversættelser er fra Dya2, Dya4,
D. Yakuba
stammer Cascade24 og Cascade 21,
D. santomea
stammer STO7 og LAGO1482, Der og DME. Stjernerne over alignment indikerer steder, der har forskelle mellem de offentliggjorte genomsekvenserne Dya2 og Dya4, men er ikke fastsat blandt de sekventerede 5-repeat stammer af
D. Yakuba
(tyder de ikke er “diagnostisk”).
Denne observation af homoplasious 3 repeat allel former rejser spørgsmålet om, hvorvidt den tilsyneladende stabilitet denne formular i
D. melanogaster
gruppe modsiger skjulte udvidelser og sammentrækninger i gentagelse nummer. For at teste denne hypotese, vi nøje undersøgt den offentliggjorte
dmbrca2
sekvens af
D. erecta
(som desværre ikke har andre stammer til rådighed til direkte sekventering).
D. erecta
2
nd BRC repeat aminosyresekvens lignede dele af
D. Yakuba
2
nd og 4
th BRC gentager i overensstemmelse med det er afledt af en sletning af en fem-repeat formular (se figur 5). Specifikt den bærer de 18 aminosyrer, der er til stede i Dya2 men ikke Dya4, men har tre aminosyrer diagnostiske af Dya4 på dens 3′-ende. Derfor, i modsætning til det fylogenetiske hypotese i figur 4,
D. erecta
3-repeat formen kan have opstået sekundært fra en nedarvet 5-repeat formular.
dmbrca2
sekvens af
D. melanogaster
viser også en potentielt lignende mønster (figur 5), men konklusionerne er mere vanskelig på grund af langt større sekvens divergens og eventuelle flere evolutionære ændringer i rækkefølge pr aminosyre.
For at teste for undertegnelsen af naturlige udvælgelse på den rigelige 5-repeat form vi beregnet Tajima s D i
D. Yakuba Hotel (D = -,68518) og
D. santomea Hotel (D = -,27805). Vi var ikke i stand til at beregne Tajima s for den korte formular på grund af sin meget lav frekvens blandt vores prøver (og at nogle af de korte alleler er heller ikke identiske-by-afstamning). Men vi sammenlignede 5-repeat formularens Tajima s D værdier til offentliggjorte Tajima s D værdier fra
D. Yakuba
og
D. santomea
for andre loci ligger på samme måde i områder af reduceret passage over [26], på grund af placeringen af
dmbrca2
nær telomer af kromosom 2 og de kendte virkninger af lave rekombinationshastighederne på stedet frekvens spektre [ ,,,0],30]. De observerede værdier for
dmbrca2
var godt inden for området af disse andre publicerede værdier (
D Yakuba
:.. Middelværdi = -0,34, rækkevidde -1.03-1.05;
D santomea
: gennemsnit = -0,29, rækkevidde -1.27-1.03), dermed giver os mulighed for at udelukke atypiske valg pres på dette locus
Vi konkluderer, at den evolutionære historie
dmbrca2
i
D. Yakuba
, og måske i andre
Drosophila melanogaster
undergruppe arter, er mere kompliceret end kan antages fra gennemgangen af de enkelte publicerede genom sekvenser pr art, og vi advarer imod at karakterisere hele arter eller evolutionære processer fra en sådan begrænsede data (f.eks [13]). Vi præsenterer en model for en gammel ekspansion i
dmbrca2
BRC gentagelse nummer i
D. Yakuba
(se figur 4) og foreslå, at observerede kortere alleler inden
D. Yakuba
,
D. santomea
, og måske
D. erecta
og andre arter opstod fra sammentrækninger af en nedarvet lange form, der producerer homoplasious alleler. Sådanne udvidelser og sammentrækninger ville være i overensstemmelse med modeller af udviklingen i tandem repeat sekvenser, såsom mikrosatellitter (fx [31]). Vores konklusion er foreløbig, men da vi ikke er i stand til at vurdere, hvilken rolle mulige intragenisk gen konvertering blandt gentagelser (dvs. konvergent evolution) komplicerer vores slutninger – disse processer er vanskelige at fuldt Adskille (f.eks [32])
.
Selvom teste for den præcise mekanisme af de foreslåede historiske stigninger og fald i BRC gentagelse nummer er uden for rammerne af dette papir, vi argumentere for, at resultaterne fra befolkningen genetiske og fylogenetiske analyser af Drosophila arter [18], løse et interessant fænomen omgiver et vigtigt træk af et gen relevant for menneskers sundhed. Mindst en BRC gentagelse er til stede i enhver organisme, hvori det homolog er blevet opdaget, og de synes at være absolut nødvendigt for mæglingen af samspillet med RAD51. Man kunne hypotesen, at naturlig udvælgelse kan begunstige stigninger i antallet af gentagelser, da flere gentagelser ville tillade strammere samspil mellem disse to proteiner er essentielle for DNA dobbelt streng pause reparation; dog kan selektion for længere alleler kun strække sig op til et vist punkt, da Gudmundsdottir og Ashworth [2] fandt, at overekspression en enkelt BRC gentagelse i pattedyrceller faktisk forstyrrer dannelse RAD51 filament og opløser formonterede filamenter derved skabe en BRCA2-deficient fænotype. Den vedvarende flere kortere former for
dmbrca2
i populationer af
D. Yakuba
og
D. santomea
argumentere imod konsekvent og stærk retningsbestemt udvælgelse til længere alleler. En spændende mulighed for at udforske, er, om variation i
dmbrca2
BRC gentagelse nummer er ledsaget af tilsvarende ændringer i
RAD51
sekvens. Den fortsatte undersøgelse af mønstre af BRC gentage stigning og fald vil gøre det muligt yderligere oplysning af en dårligt forstået mekanisme regulerer kræft modtagelighed, et vigtigt spørgsmål i medicin i dag.
Tak
Forfatterne takker L . Bukovnik (IgSP sekventering center) til teknisk bistand, J. Coyne for Drosophila-stammer, VL Roth og L. Stevison om hjælp med tal, og C. Smukowski, S. McDermott, R. Varney, og to anonyme anmeldere for nyttige kommentarer til manuskriptet.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.