Векторы для экспрессии простатоассоциированных антигенов - RU2650860C2

Код документа: RU2650860C2

Чертежи

Показать все 100 чертежа(ей)

Описание

ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ

В данной заявке заявлен приоритет предварительной заявки США №61/898966, поданной 1 ноября 2013 г., включенной в данное описание посредством ссылки во всей своей полноте.

ССЫЛКА НА ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

Эта заявка подается вместе с перечнем последовательностей в электронном формате. Перечень последовательностей приведен в виде файла в формате .txt с названием "PC72055A_FF_SEQ_LISTING_ST25.txt", созданного 6 октября 2014 года и имеющего размер 429 килобайт. Перечень последовательностей, содержащийся в этом .txt файле, является частью описания и включен в данное описание посредством ссылки во всей своей полноте.

ОБЛАСТЬ ИЗОБРЕТЕНИЯ

Настоящее изобретение в целом относится к иммунотерапии и в частности к вакцинам и способам лечения или предупреждения опухолевых заболеваний.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Рак предстательной железы является вторым чаще всего диагностируемым раковым заболеванием и четвертой главной причиной смерти от рака у мужчин в развитых странах во всем мире. Было показано, что различные простатоассоциированные антигены (РАА), такие как простатоспецифический антиген (PSA), простатоспецифический мембранный антиген (PSMA) и антиген стволовых клеток простаты (PSCA), сверхэкспрессируются раковыми клетками предстательной железы по сравнению с нормальными аналогами. Таким образом, эти антигены представляют собой возможные мишени для вызова специфических иммунных ответов на раковые опухоли, экспрессирующие данные антигены, в результате применения иммунотерапевтического лечения вакцинами (см., например, Marrari, A., M. lero, et al. (2007). "Vaccination therapy in prostate cancer". Cancer Immunol. Immunother., 56(4): 429-45).

PSCA представляет собой состоящий из 123 аминокислот мембранный белок. Нативный полноразмерный PSCA человека состоит из аминокислоты 1 и аминокислот 4-125 в SEQ ID NO: 21 (без остатков аланина и серина во втором и третьем положении, соответственно). PSCA характеризуется высокой тканеспецифичностью и экспрессируется в более чем 85% видов рака предстательной железы, при этом уровни экспрессии повышены при более высоких индексах Глиссона и при андрогенной независимости. Он экспрессируется в 80-100% случаев костного метастаза у пациентов с раком предстательной железы.

PSA представляет собой калликреин-подобную сериновую протеазу, которая продуцируется исключительно клетками цилиндрического эпителия, выстилающими ацинусы и протоки предстательной железы. мРНК PSA транслируется в виде неактивного состоящего из 261 аминокислоты предшественника - preproPSA. PreproPSA имеет 24 дополнительных остатка, которые составляют пре-регион (сигнальный пептид) и пропептид. В результате высвобождения препропептида образуется состоящая из 237 аминокислот зрелая внеклеточная форма, которая является ферментативно активной. Полноразмерная последовательность нативного PSA человека состоит из аминокислот 4-263 с SEQ ID NO: 15. PSA является органоспецифическим антигеном и, таким образом, продуцируется эпителиальными клетками доброкачественной гиперплазированной ткани предстательной железы (ВРН), ткани первичного рака предстательной железы и ткани метастатического рака предстательной железы.

PSMA, также известный как фолатгидролаза 1 (FOLH1), состоит из 750 аминокислот. Аминокислотная последовательность полноразмерного PSMA человека приведена в SEQ ID NO: 1. PSMA включает цитоплазматический домен (аминокислоты 1-19), трансмембранный домен (аминокислоты 20-43) и внеклеточный домен (аминокислоты 44-750). Было обнаружено, что PSMA экспрессируется в раковых клетках предстательной железы с уровнями, в 1000 раз превышающими его уровни в нормальных тканях. Он в изобилии экспрессируется на новообразованных сосудах ряда других солидных опухолей, таких как рак толстой кишки, молочной железы, печени, мочевого пузыря, поджелудочной железы, легкого, почек, а также меланомы и сарком. Таким образом, PSMA рассматривается как мишень, специфичная не только для раковых клеток предстательной железы, а также как универсальная мишень раковых заболеваний (pan-carcinoma target) для других типов рака.

Несмотря на идентификацию большого числа опухолеассоциированных антигенов и то, что многие из этих антигенов исследованы в составе вакцин на основе белков или ДНК для лечения или предупреждения раковых заболеваний, большинство клинических испытаний к настоящему времени завершились неудачно с точки зрения получения терапевтического продукта. Одна из проблем при разработке вакцин против рака заключается в том, что раковые антигены обычно являются аутогенными и вследствие этого слабо иммуногенными, поскольку саморегуляция иммунной системы заключается в том, что она не распознает собственные белки. Соответственно, существует потребность в способе усиления иммуногенности или терапевтического эффекта вакцин против рака.

Изучали многочисленные подходы для усиления иммуногенности или усиления противоопухолевой эффективности вакцин против рака. Один из таких подходов включает применение различных иммуномодуляторов, таких как агонисты TLR (Toll-подобные рецепторы), агонисты TNFR (рецепторов фактора некроза опухоли), ингибиторы CTLA-4 (цитотоксический T-лимфоцитарный антиген 4) и ингибиторы протеинкиназ.

Toll-подобные рецепторы (TLR) представляют собой мембранные рецепторы типа 1, которые экспрессируются на гематопоэтических и не-гематопоэтических клетках. В семействе TLR идентифицировано по меньшей мере 11 членов. Эти рецепторы характеризуются своей способностью распознавать патогенассоциированные молекулярные паттерны (РАМР), экспрессируемые патогенными микроорганизмами. Эти рецепторы в системах врожденного иммунитета осуществляют контроль в отношении направленности последующего приобретенного иммунного ответа. Среди всех TLR интенсивно исследовали TLR9 в отношении его участия в иммунных ответах. Стимуляция рецептора TLR9 направляет антигенпрезентирующие клетки (АРС) в сторону примирования сильных T-клеточных ответов с доминированием TH1 (T-хелперов 1 типа) посредством усиления продуцирования провоспалительных цитокинов и презентирования костимулирующих молекул T-клеткам. Было обнаружено, что CpG-олигонуклеотиды, лиганды к TLR9, представляют собой класс сильнодействующих иммуностимулирующих факторов. CpG-терапия была протестирована в отношении широкого круга опухолевых моделей у мышей, и всякий раз была продемонстрирована стимуляция ингибирования или регрессии опухолей.

Цитотоксический T-лимфоцитарный антиген 4 (CTLA-4) является членом суперсемейства иммунолгобулинов и экспрессируется на поверхности T-хелперов. CTLA-4 представляет собой отрицательный регулятор зависимой от CD28 (cluster of differentiation - кластер дифференцировки) активации T-клеток и действует в качестве контрольной точки ингибирования в отношении адаптивного иммунного ответа. Аналогично костимулирующему T-клетки белку CD28, CTLA-4 связывается с CD80 и CD86 на антигенпрезентирующих клетках. CTLA-4 передает ингибирующий сигнал T-клеткам, в то время как CD28 передает стимулирующий сигнал. Человеческие антитела к CTLA-4 человека описаны в качестве иммуностимулирующих модуляторов в случае разнообразных болезненных состояний, например, для лечения или предупреждения вирусной и бактериальной инфекции и для лечения рака (WO 01/14424 и WO 00/37504). В различных доклинических исследованиях показано, что блокирование CTLA-4 моноклональными антителами усиливает иммунный ответ хозяина на иммуногенные опухоли и даже может приводить к отторжению диагностированных опухолей. Два полностью человеческих моноклональных антитела (mAb) к CTLA-4 человека, ипилимумаб (MDX-010) и тремелимумаб (также известный как СР-675206), были исследованы в клинических испытаниях в отношении лечения солидных опухолей различных типов.

Суперсемейство фактора некроза опухоли (TNF) представляет собой группу цитокинов, которые взаимодействуют со специфическими когнатными рецепторами клеточной поверхности, с суперсемейством рецепторов TNF (TNFR). Члены суперсемейства фактора некроза опухоли действуют посредством лиганд-опосредуемой тримеризации, приводящей к задействованию нескольких внутриклеточных адаптеров, с целью активации многочисленных путей передачи сигнала, таких как апоптоз, путь нуклеарного фактора-кВ (NF-kB; nuclear factor kappa В), путь c-Jun-N-концевой киназы (JNK; c-Jun N-terminal kinase), а также иммунных и воспалительных ответов. Примеры суперсемейства TNF включают лиганды CD40, лиганды ОХ40, лиганды 4-1ВВ, лиганд CD27, лиганд CD30 (CD153), TNF-альфа, TNF-бета, лиганды рецепторов-активаторов NF-kB (RANK; receptor activator of NF-kB), LT-альфа (лимфотоксин-альфа), LT-бета, GITR (лиганды индуцированных клюкокортикоидами TNFR) и LIGHT. Суперсемейство TNFR включает, например, CD40, ОХ40, 4-1ВВ, CD70 (лиганд CD27), CD30, TNFR2, RANK, LT-бета R, HVEM (медиатор проникновения вируса герпеса), GITR, TROY (член 19 суперсемейства TNFR) и RELT (рецептор, экспрессируемый в лимфоидной ткани). Среди членов семейства TNF интенсивное исследование проводили с агонистами CD40, включая различные агонистические антитела к CD40, такие как полностью человеческое агонистическое моноклональное антитело к CD40 СР870893, с точки зрения их применения в терапии.

Протеинкиназы представляют собой семейство ферментов, которые катализируют фосфорилирование специфических остатков в белках. Проводили изучение ряда ингибиторов киназ в клиническом исследовании с целью применения в противораковых терапиях, при этом использовали, например, MK0457, VX-680, ZD6474, MLN8054, AZD2171, SNS-032, PTK787/ZK222584, сорафениб (BAY43-9006), SU5416, SU6668, AMG706, зактима (ZD6474), МР-412, дазатиниб, СЕР-701 (лестауртиниб), XL647, XL999, тайкерб (лапатиниб), MLN518 (прежде известный как СТ53518), PKC412, ST1571, AMN107, АЕЕ 788, OSI-930, OSI-817, сунитиниба малат (сутент; SU11248), ваталаниб (PTK787/ZK 222584), SNS-032, SNS-314 и акситиниб (AG-013736). Гефитиниб и эрлотиниб представляют собой два вводимых перорально ингибитора тирозинкиназ (TKI; tyrosine kinase inhibitor) - рецептора эпидермального фактора роста (EGFR; epidermal growth factor receptor).

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Описание настоящего изобретения относится к векторам, сконструированным из последовательностей генома аденовируса шимпанзе ChAd68, для экспрессии двух или более иммуногенных полипептидов РАА. Вектор содержит (1) последовательность ДНК С68, (2) мультиантигенную конструкцию для экспрессии двух или более иммуногенных полипептидов РАА и (3) регуляторные последовательности, которые контролируют транскрипцию и трансляцию антигенных продуктов (т.е. иммуногенных полипептидов РАА). Последовательность ДНК С68, включенную в вектор, получают из геномной последовательности С68 посредством функциональной делеции одного или более вирусных генов, но ее достаточно для образования инфекционной вирусной частицы. В конкретном воплощении последовательность ДНК С68, используемая в векторе, представляет собой весь геном С68 с функциональными делециями только в участках Е1 и Е3.

Мультиантигенная конструкция, переносимая вектором, содержит нуклеотидные последовательности, кодирующие два или более иммуногенных полипептида РАА, выбранных из иммуногенного полипептида PSMA, иммуногенного полипептида PSA и иммуногенного полипептида PSCA. В некоторых воплощениях мультиантигенная конструкция, переносимая вектором, содержит (1) нуклеотидную последовательность, кодирующую по меньшей мере один иммуногенный полипептид PSMA, (2) нуклеотидную последовательность, кодирующую по меньшей мере один иммуногенный полипептид PSA, и (3) нуклеотидную последовательность, кодирующую по меньшей мере один иммуногенный полипептид PSCA. Мультиантигенные конструкции также могут включать в себя разделяющие последовательности, которые обеспечивают экспрессию отдельных полипептидов РАА, кодируемых данной конструкцией. Примеры разделяющих последовательностей включают последовательности 2А-пептидов и IRES (участки внутренней посадки рибосомы). В некоторых воплощениях вектор содержит мультиантигенную конструкцию, имеющую следующие структуры:

(1) PSA-F2A-PSMA-mIRES-PSCA;

(2) PSA-F2A-PSMA-T2A-PSCA;

(3) PSA-T2A-PSCA-F2A-PSMA и

(4) PSCA-F2A-PSMA-mIRES-PSA.

В некоторых воплощениях нуклеотидная последовательность, кодирующая иммуногенный полипептид PSA, содержит нуклеотиды 1115-1825 из SEQ ID NO: 58 или содержит нуклеотиды 1106-1825 из SEQ ID NO: 58, нуклеотидная последовательность, кодирующая иммуногенный полипептид PSCA, содержит нуклеотиды 1892-2257 из SEQ ID NO: 58 или содержит нуклеотиды 1886-2257 из SEQ ID NO: 58, и нуклеотидная последовательность, кодирующая иммуногенный полипептид PSMA, содержит нуклеотиды 2333-4543 из SEQ ID NO: 58 или содержит нуклеотиды 2324-4543 из SEQ ID NO: 58. В некоторых конкретных воплощениях мультиантигенная конструкция содержит нуклеотидную последовательность, выбранную из группы, состоящей из SEQ ID NO: 33, 34, 35 и 36. В конкретном воплощении мультиантигенная конструкция содержит нуклеотидную последовательность, которая кодирует полипептидную последовательность с SEQ ID NO: 60. В другом конкретном воплощении мультиантигенная конструкция содержит нуклеотидную последовательность с SEQ ID NO: 61.

Согласно описанию настоящего изобретения также предложены композиции, содержащие векторы. В некоторых воплощениях композиция представляет собой иммуногенную композицию, полезную для вызова иммунного ответа на РАА у млекопитающего, такого как мышь, собака, обезьяна или человек. В некоторых воплощениях композиция представляет собой вакцинную композицию, полезную для иммунизации млекопитающего, такого как человек, для ингибирования аномальной пролиферации клеток, для обеспечения защиты от развития ракового заболевания (для использования в качестве профилактического средства) или для лечения расстройств (для использования в качестве терапевтического средства), ассоциированных со сверхэкспрессией РАА, таких как рак, в частности, рак предстательной железы.

Настоящее изобретение также относится к способам применения векторов или композиций для вызова иммунного ответа на РАА или для лечения раковых заболеваний, таких как рак предстательной железы, у млекопитающего, в частности, человека. В некоторых воплощениях векторы или композиции, в том числе вакцинные композиции, вводят млекопитающему, в частности, человеку, в комбинации с одним или более иммунномодуляторами, которые усиливают иммуногенность или влияние векторов или композиций. В некоторых конкретных воплощениях способ включает совместное введение вакцины, предложенной согласно настоящему изобретению, в комбинации по меньшей мере с одним ингибитором супрессорных клеток иммунной системы и по меньшей мере с одним усилителем эффекторных клеток иммунной системы.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

ФИГ. 1. Схематическое представление вектора PJV7563.

ФИГ. 2. Аминокислотное выравнивание пяти вирусных 2А-кассет. «Пропущенные» связи глицин-пролин отмечены звездочками.

ФИГ. 3. Последовательность предпочтительного IRES вируса EMCV (энцефаломиокардита). Сайт инициации трансляции отмечен звездочкой. В минимальном элементе IRES (mIRES) отсутствуют подчеркнутые первые 5 кодонов для L-белка EMCV.

ФИГ. 4. График, показывающий кривые выживаемости Каплана-Мейера для групп мышей из репрезентативного исследования, в котором оценивается влияние малата сунитиниба (сутента) и моноклонального антитела к CTLA-4 мыши (клон 9D9) на противоопухолевую эффективность вакцины против рака (вакцины) у несущих подкожные TUBO-опухоли мышей BALB/neuT.

ФИГ. 5. График, показывающий результаты анализа с использованием IFNγ-ELISPOT (метод иммуноферментных пятен) из репрезентативного исследования, в котором оценивается влияние CpG7909 и антитела к CD40 (Bioxcell, № ВЕ0016-2) на антигенспецифические T-клеточные ответы, индуцированные вакциной против рака (rHER2).

ФИГ. 6. Графики, показывающие результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность CpG7909 с точки зрения качества иммунных ответов, индуцированных вакциной против рака (путем эпидермальной доставки с помощью частиц (particle mediated epidermal delivery; PMED), с использованием анализа методом внутриклеточного окрашивания цитокинов, в котором измеряли цитокин-позитивные CD8 T-клетки (* указывает на Р меньше 0,05 согласно t-критерию Стьюдента).

ФИГ. 7. Графики, показывающие результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность CpG7909 с точки зрения качества иммунных ответов, индуцированных вакциной против рака (PMED), с использованием анализа методом внутриклеточного окрашивания цитокинов, в котором измеряли цитокин-позитивные CD4 T-клетки (ФИГ. 7) (* указывает на Р меньше 0,05 согласно t-критерию Стьюдента).

ФИГ. 8. Графики, показывающие результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность агонистического моноклонального антитела к CD40 мыши с точки зрения качества иммунных ответов, индуцированных вакциной против рака (PMED), с использованием анализа методом внутриклеточного окрашивания цитокинов, в котором измеряли цитокин-позитивные CD8 T-клетки (* указывает на Р меньше 0,05 согласно t-критерию Стьюдента).

ФИГ. 9. Графики, показывающие результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность агонистического моноклонального антитела к CD40 мыши с точки зрения качества иммунных ответов, индуцированных вакциной против рака (PMED), с использованием анализа методом внутриклеточного окрашивания цитокинов, в котором измеряли цитокин-позитивные CD4 T-клетки (* указывает на Р меньше 0,05 согласно t-критерию Стьюдента).

ФИГ. 10. График, показывающий кривые выживаемости Каплана-Мейера для групп мышей из репрезентативного исследования, в котором оценивается влияние сунитиниба малата (сутента) в низких дозах на противоопухолевую эффективность вакцины против рака у мышей BALB/neuT, несущих спонтанные опухоли молочной железы.

ФИГ. 11. График, показывающий организацию генома вектора AdC68-734.

CMV enh/pro обозначает непосредственно ранний энхансер и промотор цитомегаловируса человека; tet op обозначает тетрациклиновый оператор; Т2А обозначает 2А-пептиды вируса Thosea asigna; F2A обозначает 2А-пептиды вируса ящура; SV40 рА обозначает сигнал полиаденилирования обезьяньего вируса 40; LITR обозначает левый инвертированный концевой повтор; RITR обозначает правый инвертированный концевой повтор.

ФИГ. 12. Точечные диаграммы, демонстрирующие посредством проточной цитометрии экспрессию PSMA и PSCA на поверхности клеток А549, трансфицированных векторами AdC68, экспрессирующими тройной антиген.

ФИГ. 13. Результаты вестерн-блоттинга для лизатов клеток А549, инфицированных векторами AdC68.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

А. ОПРЕДЕЛЕНИЯ

Термин «адъювант» относится к веществу, которое способно усиливать, ускорять или пролонгировать иммунный ответ, вызываемый вакцинным иммуногеном.

Термин «агонист» относится к веществу, которое стимулирует (индуцирует, вызывает, усиливает или повышает) активность другой молекулы или другого рецептора. Термин «агонист» охватывает вещества, которые связываются с рецептором (например, антитело, гомолог природного лиганда из другого вида), и вещества, которые стимулируют функцию рецептора без связывания с ним (например, посредством активации ассоциированного белка).

Термин «антагонист» или «ингибитор» относится к веществу, которое частично или полностью блокирует, ингибирует или нейтрализует биологическую активность другой молекулы или другого рецептора.

Термин «совместное введение» относится к введению двух или более агентов одному и тому же субъекту в течение периода лечения. Два или более агентов могут быть включены в единую композицию и потому быть введены одновременно. Альтернативно, два или более агентов могут находиться в физически разделенных композициях и вводиться субъекту по отдельности либо последовательно, либо одновременно. Термин «введенный одновременно» или «одновременное введение» означает, что введение первого агента и введение второго агента совпадает по времени друг с другом, в то время как термин «введенный последовательно» или «последовательное введение» означает, что введение первого агента и введение второго агента не совпадает по времени друг с другом.

Термин «цитозольный» означает, что после того, как нуклеотидная последовательность, кодирующая конкретный полипептид, экспрессируется клеткой хозяина, экспрессированный полипептид остается внутри клетки хозяина.

Термин «вырожденный вариант» относится к нуклеотидной последовательности, в которой выполнены замены оснований по сравнению с референсной нуклеотидной последовательностью, но которая, вследствие вырожденности генетического кода, кодирует ту же аминокислотную последовательность, что и референсная нуклеотидная последовательность.

Термин «эффективное количество» относится к вводимому млекопитающему количеству, которого достаточно, чтобы вызвать желаемый эффект у данного млекопитающего.

Термин «фрагмент» заданного полипептида относится к полипептиду, который является более коротким по сравнению с заданным полипептидом и имеет 100% идентичности с последовательностью заданного полипептида.

Термин «идентичный» или процент «идентичности» в контексте двух или более нуклеотидных или полипептидных последовательностей относится к двум или более последовательностям или подпоследовательностям, которые являются одинаковыми или имеют конкретное процентное содержание аминокислотных остатков или нуклеотидов, являющихся одинаковыми при сравнении и выравнивании для максимального совпадения.

Термин «усилитель эффекторных клеток иммунной системы» или «усилитель IEC» относится к веществу, способному увеличивать или повышать число, качество или усиливать функцию одного или более типов иммунных эффекторных клеток млекопитающего. Примеры иммунных эффекторных клеток включают цитолитические CD8 T-клетки, CD40 T-клетки, NK-клетки и В-клетки.

Термин «иммуномодулятор» относится к веществу, способному изменять (например, ингибировать, ослаблять, повышать, усиливать или стимулировать) действие любого компонента системы врожденного, гуморального или клеточного иммунитета млекопитающего. Таким образом, термин «иммуномодулятор» охватывает термины «усилитель эффекторных клеток иммунной системы», определенный в данном описании, и «ингибитор супрессорных клеток иммунной системы», определенный в данном описании, а также вещество, которое воздействует на другие компоненты иммунной системы млекопитающего.

Термин «иммунный ответ» относится к любому детектируемому ответу на конкретное вещество (такое как антиген или иммуноген), производимому иммунной системой позвоночного животного-хозяина, включая, но не ограничиваясь этим, врожденные иммунные ответы (например, активацию каскада передачи сигнала посредством Toll-подобных рецепторов), клеточно-опосредованные иммунные ответы (например, ответы, опосредуемые T-клетками, такими как антигенспецифические T-клетки и неспецифические клетки иммунной системы) и гуморальные иммунные ответы (например, ответы, опосредуемые В-клетками, такие как образование и секреция антител в плазму крови, лимфу и/или тканевые жидкости). Примеры иммунных ответов включают изменение (например, усиление) активации Toll-подобных рецепторов, экспрессии или секреции лимфокинов (например, цитокинов (например, цитокинов типа Th1, Th2 или Th17) или хемокинов), активацию макрофагов, активацию дендритных клеток, активацию T-клеток (например, CD4+ или CD8+ T-клеток), активацию NK-клеток, активацию В-клеток (например, образование и/или секрецию антител), связывание иммуногена (например, антигена (например, иммуногенного полипептида)) с молекулой МНС (главного комплекса гистосовместимости), индуцирование ответа цитотоксических T-лимфоцитов («CTL»), индуцирование B-клеточного ответа (например, продуцирование антител), распространение (например, рост популяции клеток) клеток иммунной системы (например, T-клеток и В-клеток) и усиление процессинга и презентации антигена антигенпрезентирующими клетками. Термин «иммунный ответ» также охватывает любой детектируемый ответ на конкретное вещество (такое как антиген или иммуноген), производимый одним или более компонентами иммунной системы позвоночного животного in vitro.

Термин «иммуногенный» относится к способности вещества приводить к иммунному ответу, вызывать, стимулировать или индуцировать иммунный ответ либо улучшать, усиливать, повышать или пролонгировать уже имеющийся иммунный ответ на конкретный антиген независимо от того, связано оно или не связано с носителем, в присутствии или в отсутствие адъюванта.

Термин «иммуногенный полипептид PSA» относится к полипептиду, который является иммуногенным в отношении белка PSA человека или в отношении клеток, экспрессирующих белок PSA человека.

Термин «иммуногенный полипептид PSCA» относится к полипептиду, который является иммуногенным в отношении белка PSCA человека или в отношении клеток, экспрессирующих белок PSCA человека.

Термин «иммуногенный полипептид PSMA» относится к полипептиду, который является иммуногенным в отношении белка PSMA человека или в отношении клеток, экспрессирующих белок PSMA человека.

Термин «иммуногенный полипептид РАА» относится к «иммуногенному полипептиду PSA», «иммуногенному полипептиду PSCA» или «иммуногенному полипептиду PSMA», которые определены в данном описании выше.

Термин «ингибитор супрессорных клеток иммунной системы» или «ингибитор ISC» относится к веществу, способному снижать или подавлять количество или функцию супрессорных клеток иммунной системы млекопитающего. Примеры супрессорных клеток иммунной системы включают регуляторные T-клетки («Tper»), миелоидные супрессорные клетки и опухолеассоциированные макрофаги.

Термин «внутрикожкое введение» или «вводимый внутрикожко» в контексте введения вещества, такого как терапевтический агент или иммуномодулятор, млекопитающему, в том числе человеку, относится к доставке вещества в дермальный слой кожи млекопитающего. Кожа млекопитающего состоит из трех слоев - эпидермиса, дермы и подкожного слоя. Эпидермис представляет собой относительно тонкий жесткий наружный слой кожи. Большинство клеток в эпидермисе являются кератиноцитами. Дерма, следующий слой кожи, представляет собой толстый слой волокнистой и эластичной ткани (состоящей в основном из коллагена, эластина и фибриллина), придающий коже упругость и прочность. В дерме находятся нервные окончания, потовые железы и секретирующие кожное сало (сальные) железы, волосяные фолликулы и кровеносные сосуды. Толщина дермы варьирует в зависимости от места расположения кожи. У людей она составляет примерно 0,3 мм на веке и примерно 3,0 мм на спине. Подкожный слой состоит из жировой и соединительной ткани, в которой располагаются более крупные кровеносные сосуды и нервы. Толщина этого слоя варьирует по всему организму и от субъекта к субъекту. Термин «внутрикожкое введение» относится к доставке вещества во внутреннюю часть дермального слоя. В противоположность этому, «подкожное введение» относится к введению вещества в подкожный слой, а «местное введение» относится к нанесению вещества на поверхность кожи.

Термин «локальное введение» или «вводимый локально» охватывает термины «местное введение», «внутрикожкое введение» и «подкожное введение», каждый из которых определен в данном описании выше. Этот термин также охватывает «внутриопухолевое введение», что относится к введению вещества внутрь опухоли. Локальное введение предназначено для обеспечения высоких локальных концентраций вокруг места введения в течение периода времени, пока не будет достигнуно системное биораспределение введенного вещества, в то время как «системное введение» предназначено для всасывания введенного вещества в кровь и быстрого достижения системного воздействия путем распределения через кровеносную систему в органы или ткани по всему организму.

Термин «млекопитающее» относится к животному любого вида из класса млекопитающих. Примеры млекопитающих включают: людей; приматов, не являющихся человеком, таких как обезьяны; лабораторных животных, таких как крысы, мыши, морские свинки; домашних животных, таких как кошки, собаки, кролики, крупный рогатый скот, овцы, козы, лошади и свиньи; и содержащихся в неволе диких животных, таких как львы, тигры, слоны и тому подобное.

Термин «мембраносвязанный» означает, что после того, как нуклеотидная последовательность, кодирующая конкретный полипептид, экспрессируется клеткой хозяина, экспрессированный полипептид связывается, соединяется или иным образом взаимодействует с мембраной клетки.

Термин «опухолевое заболевание» относится к состоянию, при котором клетки пролиферируют с аномально высокой и неконтролируемой скоростью, превышающей таковую и находящейся в несогласованности с таковой в окружающих нормальных тканях. В результате этого обычно образуется твердое разрастание или уплотнение, известное как «опухоль». Этот термин охватывает опухолевые заболевания доброкачественного и злокачественного характера. Термин «опухолевое заболевание злокачественного характера», который в описании настоящего изобретения используется взаимозаменяемо с термином «рак», относится к опухолевому заболеванию, характеризующемуся способностью опухолевых клеток распространяться в другие места в организме (известной как «метастазирование»). Термин «опухолевое заболевание доброкачественного характера» относится к опухолевому заболеванию, при котором у опухолевых клеток отсутствует способность к метастазированию.

Термин «функционально связанный» относится к совместному расположению, в котором описанные таким образом компоненты находятся во взаимосвязи, позволяющей им функционировать предназначенным им способом. Контрольная последовательность, «функционально связанная» с трансгеном, соединена таким образом, что экспрессия данного трансгена осуществляется в условиях, совместимых с экспрессией контрольных последовательностей.

Термин «фармацевтически приемлемый эксципиент» относится к веществу в иммуногенной или вакцинной композиции, не являющемуся активным ингредиентом (таким как антиген, кодирующая антиген нуклеиновая кислота, иммуномодулятор или адъювант), которое совместимо с активными ингредиентами и не вызывает значительного неблагоприятного действия на субъектов, которым его вводят.

Термины «пептид», «полипептид» и «белок» используются в данном описании взаимозаменяемо и относятся к состоящей из аминокислот полимерной форме любой длины, которая может включать кодируемые и некодируемые аминокислоты, химически или биохимически модифицированные аминокислоты либо производные аминокислот и полипептиды с модифицированными полипептидными остовами.

Термин «предупреждение» или «предупреждать» относится к (а) предотвращению возникновения расстройства или (б) задержке начала возникновения расстройства или начала возникновения симптомов расстройства.

Термин «простатоассоциированный антиген» (или РАА) относится к ТАА (определенному в данном описании), который специфически экспрессируется на опухолевых клетках предстательной железы или экспрессируется с более высокой частотой или плотностью опухолевыми клетками по сравнению с неопухолевыми клетками из ткани того же типа. Примеры РАА включают PSA, PSCA и PSMA.

Термин «секретируемый» в контексте полипептида означает, что после того, как нуклеотидная последовательность, кодирующая данный полипептид, экспрессируется клеткой хозяина, экспрессированный полипептид секретируется за пределы клетки хозяина.

Термин «субоптимальная доза», когда его используют для описания количества иммуномодулятора, такого как ингибитор протеинкиназ, относится к дозе иммуномодулятора ниже минимального количества, необходимого для получения желаемого терапевтического эффекта в отношении подвергаемого лечению заболевания, если пациенту вводят только иммуномодулятор.

Термин «лечащий», «лечение» или «лечить» относится к нейтрализации расстройства, снижению тяжести расстройства либо снижению тяжести или частоты возникновения симптома расстройства.

Термин «опухолеассоциированный антиген» или «ТАА» относится к антигену, который специфически экспрессируется опухолевыми клетками или экспрессируется опухолевыми клетками с более высокой частотой или плотностью по сравнению с неопухолевыми клетками из ткани того же типа. Опухолеассоциированными антигенами могут быть антигены, в норме не экспрессируемые хозяином; они могут представлять собой мутированные, укороченные, неправильно свернутые или иные аномальные варианты молекул, обычно экспрессируемых хозяином; они могут быть идентичны обычно экспрессируемым молекулам, но экспрессироваться с аномально высокими уровнями; или они могут экспрессироваться в окружении или среде, которые являются аномальными. Опухолеассоциированными антигенами могут быть, например, белки или фрагменты белков, сложные углеводы, ганглиозиды, гаптены, нуклеиновые кислоты или любая комбинация этих или других биологических молекул.

Термин «вакцина» относится к иммуногенной композиции для введения млекопитающему для вызова иммунного ответа на конкретный антиген.

Термин «вектор» относится к молекуле нуклеиновой кислоты, способной перемещать или переносить молекулу чужеродной нуклеиновой кислоты. Молекула чужеродной нуклеиновой кислоты называется «инсерционным сегментом» или «трансгеном». Обычно вектор состоит из инсерционного сегмента и большей по длине последовательности, которая служит в качестве остова вектора. Термин «вектор» охватывает как экспрессирующие векторы, так и транскрипционные векторы. Термин «экспрессирующий вектор» относится к вектору, способному экспрессировать инсерционный сегмент в целевой клетке. Как правило, он содержит контрольные последовательности, такие как последовательности энхансера, промотора и терминатора, которые управляют экспрессией этого инсерционного сегмента. Термин «транскрипционный вектор» относится к вектору, способному транскрибироваться, но не транслироваться. Транскрипционные векторы используют для амплификации находящегося в них инсерционного сегмента. С учетом структуры или происхождения векторов, основные типы векторов включают плазмидные векторы, космидные векторы, фаговые векторы, например на основе фага лямбда, вирусные векторы, такие как аденовирусные (Ad) векторы, и искусственные хромосомы.

Б. ВЕКТОРЫ, СОДЕРЖАЩИЕ МУЛЬТИАНТИГЕННУЮ КОНСТРУКЦИЮ

Согласно одному из аспектов в описании настоящего изобретения предложен вирусный вектор, сконструированный из генома аденовируса шимпанзе ChAd68, для экспрессии двух или более иммуногенных полипептидов РАА. Аденовирус шимпанзе ChAd68 также обозначается в литературе как обезьяний аденовирус типа 25, С68, Chad68, SAdV25, PanAd9 или Pan9. Для удобства, аденовирус шимпанзе ChAd68 может быть обозначен в этом описании как «С68», и вирусный вектор, сконструированный из генома аденовируса шимпанзе ChAd68, обозначен как «вектор С68». Полноразмерная геномная последовательность С68 имеется в Genbank (номер доступа АС_000011.1) и приведена в SEQ ID NO: 57. Кроме того, полноразмерная геномная последовательность С68 и место расположения аденовирусных генов Е1а, E1b, Е2а, E2b, Е3, Е4, I1, I2, L3, L4 и L5 также приведены в патенте США 6083716.

Вектор С68, предложенный согласно описанию настоящего изобретения, содержит (1) последовательность ДНК С68 и (2) мультиантигенную конструкцию для экспрессии двух или более иммуногенных полипептидов РАА. Вектор также может содержать ненативные регуляторные последовательности, которые контролируют транскрипцию и трансляцию антигенных продуктов. Ненативными регуляторными последовательностями называют последовательности, которые не являются частью генома С68. Последовательность ДНК С68, мультиантигенная конструкция и регуляторные последовательности функционально связаны друг с другом.

Вектор С68 может быть репликационно-компетентным, условно репликационно-компетентным или репликационно-дефектным. Репликационно-компетентный вектор С68 может реплицироваться в типичных клетках хозяина, т.е. клетках, обычно поддающихся инфицированию аденовирусом. Репликационно компетентный вирусный вектор может иметь одну или более мутаций по сравнению с аденовирусом дикого типа (например, одну или более делеций, вставок и/или замен) в аденовирусном геноме, которые не ингибируют репликацию вируса в клетках хозяина. Условно реплицирующийся вектор С68 представляет собой вирусный вектор, который сконструирован таким образом, чтобы реплицироваться в предварительно заданных условиях. Например, существенные для репликации функции генов, например функции, кодируемые ранними участками аденовирусного генома, могут быть функционально связаны с индуцибельной, репрессируемой или тканеспецифичной контролирующей транскрипцию последовательностью, например, промотором. Репликационно-дефектный вектор С68 представляет собой вирусный вектор, для которого требуется комплементарность одной или более чем одной генной функции или участка вирусного генома, которые необходимы для репликации, по причине, например, дефицита в одной или более чем одной существенной для репликации функции гена или участка, вследствие чего вектор не реплицируется в типичных клетках хозяина, в особенности, тех клетках человека, которые будут инфицированы данным вектором.

Такие векторы полезны для клонирования или экспрессии иммуногенных полипептидов РАА или для доставки мультиантигенной конструкции в составе композиции, такой как вакцина, в клетку хозяина или животному-хозяину, такому как человек. В некоторых конкретных воплощениях согласно описанию настоящего изобретения предложен вектор, выбранный из группы, состоящей из (1) вектора, содержащего нуклеотидную последовательность или состоящего из нуклеотидной последовательности SEQ ID NO: 58; (2) вектора, содержащего нуклеотиды или состоящего из нуклеотидов 9-34811 SEQ ID NO: 58; и (3) вектора, содержащего нуклеотидную последовательность или состоящего из нуклеотидной последовательности SEQ ID NO: 63.

Вектор С68, предложенный согласно описанию настоящего изобретения, также охватывает функциональные варианты векторов, конкретно описанные или приведенные в качестве примера в описании настоящего изобретения. «Функциональный вариант» означает вектор, который содержит мутации (например, добавления, делеции или замены) по сравнению с последовательностью вектора («родительского вектора»), конкретно описанного или приведенного в качестве примера в описании настоящего изобретения, но сохраняет функцию или свойство родительского вектора. Например, функциональный вариант может содержать кодон-оптимизированную последовательность, соответствующую родительскому вектору, приведенному в качестве примера в описании настоящего изобретения.

Б1. Последовательность ДНК С68

Термин «последовательность ДНК С68» относится к последовательности ДНК, которая представляет собой часть последовательности генома С68. Последовательность ДНК С68, включенная в вектор, получена из последовательности генома С68 посредством функциональной делеции одного или более генов или участков генома вируса. Термин «функциональная делеция» означает, что удалена или иным образом изменена часть участка гена вируса, например, посредством мутации или модификации, так, чтобы этот участок гена больше был не способен продуцировать при экспрессии гена функциональные продукты или иным образом осуществлять его нормальное функционирование. Зачастую для нарушения существенной для репликации генной функции нет необходимости в делеции всего участка гена. Однако, в целях обеспечения пространства в геноме С68, достаточного для введения одного или более трансгенов, может быть желательно удаление большей части одного или более чем одного участка гена. И хотя делеция генетического материала предпочтительна, мутация генетического материала последством добавления или замены также является целесообразной для нарушения генной функции.

В некоторых воплощениях последовательность ДНК С68 данного вектора получена из последовательности генома С68 посредством функциональной делеции всего или достаточной части аденовирусного предраннего гена Е1а и задержанно раннего гена E1b. В других воплощениях помимо функциональной делеции Е1а и E1b также может быть выполнена функциональная делеция одного или более других генов, таких как задержанно ранний ген Е2а, задержанно ранний ген Е3, Е4, любой из поздних генов от L1 до L5, промежуточные гены IX и IVa2. Таким образом, последовательность ДНК С68 для применения в конструкции вектора по изобретению может содержать делеции только в гене Е1. Альтернативно, делеции генов целиком или их частей, эффективные для разрушения их биологической активности, могут быть использованы в любой комбинации. Например, в одном из типичных векторов последовательность ДНК С68 получена из последовательности генома С68 посредством функциональных делеции генов Е1 и гена Е4, или генов Е1, Е2а и Е3, или генов Е1 и Е3, или генов Е1, Е2а и Е4, с делецией Е3 или без нее, и так далее. Помимо этого, для достижения желаемого результата такие делеции могут быть использованы в комбинации с другими мутациями, такими как температурно-чувствительные мутации. В конкретном воплощении последовательность ДНК С68 представляет собой весь геном С68 с функциональными делециями только в участках Е1 и Е3.

В некоторых конкретных воплощениях функциональную делецию гена Е1 осуществляют посредством делеции нуклеотидов 577-3403 из SEQ ID NO: 57 или посредством делеции нуклеотидов 456-3012 из SEQ ID NO: 57, и функциональную делецию гена Е3 осуществляют посредством делеции нуклеотидов 27125-31831 из SEQ ID NO: 57 или посредством делеции нуклеотидов 27812-31330 из SEQ ID NO: 57. В других конкретных воплощениях последовательность ДНК С68, включенная в вектор, содержит нуклеотиды 3013-27811 из SEQ ID NO: 57. В следующих конкретных воплощениях последовательность ДНК С68, включенная в вектор, содержит нуклеотиды 3013-27811 и 31331-36519 из SEQ ID NO: 57.

Мультиантигенная конструкция может быть встроена в любой делетированный участок аденовирусного генома. Мультиантигенная конструкция также может быть встроена в имеющийся участок гена для нарушения функции этого участка. В некоторых воплощениях мультиантигенная конструкция встроена вместо делетированного гена Е1.

Б2. Мультиантигенные конструкции

Термин «мультиантигенная конструкция» относится к молекуле или последовательности нуклеиновой кислоты, которая кодирует два или более полипептида РАА. В описании настоящего изобретения такие молекулы или последовательности также можно обозначить как «мультиантигенная вакцина» или «мультиантигенная плазмида». Мультиантигенная конструкция может нести две кодирующие нуклеотидные последовательности, причем каждая из кодирующих нуклеотидных последовательностей экспрессирует индивидуальный иммуногенный полипептид РАА. В этом описании такую конструкцию также называют «двойной антигенной конструкцией», «двойной антигенной вакциной» или «двойной антигенной плазмидой». Мультиантигенная конструкция также может нести три кодирующие нуклеотидные последовательности, причем каждая из кодирующих нуклеотидных последовательностей экспрессирует индивидуальный иммуногенный полипептид РАА. В этом описании такую конструкцию также называют «тройной антигенной конструкцией», «тройной антигенной вакциной» или «тройной антигенной плазмидой». Индивидуальные полипептиды РАА, кодируемые мультиантигенной конструкцией, могут быть иммуногенными в отношении одного и того же антигена, такого как PSMA, PSA или PSCA. Например, двойная антигенная конструкция может экспрессировать два разных антигена РАА, оба из которых являются иммуногенными в отношении PSMA. Индивидуальные полипептиды РАА, кодируемые мультиантигенной конструкцией, могут быть иммуногенными в отношении разных антигенов, например, двойная антигенная конструкция может экспрессировать два полипептида РАА, которые являются иммуногенными в отношении PSMA и PSA, соответственно. Предпочтительно, чтобы мультиантигенная конструкция кодировала два или более индивидуальных полипептида РАА, которые являются иммуногенными в отношении разных антигенов.

В некоторых воплощениях мультиантигенная конструкция кодирует по меньшей мере два иммуногенных полипептида РАА в любой из следующих комбинаций:

1) иммуногенный полипептид PSMA и иммуногенный полипептид PSA;

2) иммуногенный полипептид PSMA и иммуногенный полипептид PSCA; и

3) иммуногенный полипептид PSA и иммуногенный полипептид PSCA.

В некоторых конкретных воплощениях мультиантигенная конструкция кодирует по меньшей мере один иммуногенный полипептид PSMA, по меньшей мере один иммуногенный полипептид PSA и по меньшей мере один иммуногенный полипептид PSCA.

Иммуногенный полипептид PSMA, экспрессируемый мультиантигенной конструкцией, может быть цитозольным, секретируемым или мембраносвязанным, но предпочтительно мембраносвязанным. В некоторых воплощениях иммуногенный полипептид PSMA содержит аминокислотную последовательность, выбранную из группы, состоящей из:

1) аминокислотной последовательности с SEQ ID NO: 1,

2) аминокислот 15-750 из SEQ ID NO: 1;

3) аминокислотной последовательности с SEQ ID NO: 3;

4) аминокислотной последовательности с SEQ ID NO: 5;

5) аминокислотной последовательности с SEQ ID NO: 7;

6) аминокислот 4-739 из SEQ ID NO: 3;

7) аминокислот 4-739 из SEQ ID NO: 5;

8) аминокислот 4-739 из SEQ ID NO: 7;

9) аминокислотной последовательности с SEQ ID NO: 9 и

10) аминокислот 4-739 из SEQ ID NO: 9.

Иммуногенный полипептид PSA, экспрессируемый мультиантигенной конструкцией, может быть цитозольным, секретируемым или мембраносвязанным, но предпочтительно цитозольным. В некоторых воплощениях иммуногенный полипептид PSA содержит аминокислотную последовательность, выбранную из группы, состоящей из:

1) аминокислот 27-263 из SEQ ID NO: 15;

2) аминокислотной последовательности с SEQ ID NO: 17 и

3) аминокислот 4-240 из SEQ ID NO: 17.

Иммуногенный полипептид PSCA, экспрессируемый мультиантигенной конструкцией, может представлять собой полноразмерный белок PSCA человека. В некоторых воплощениях иммуногенный полипептид PSCA содержит аминокислотную последовательность, выбранную из группы, состоящей из:

1) аминокислотной последовательности с SEQ ID NO: 21;

2) аминокислот 2-125 из SEQ ID NO: 21 и

3) аминокислот 4-125 из SEQ ID NO: 21.

В некоторых других воплощениях мультиантигенная конструкция кодирует по меньшей мере один иммуногенный полипептид PSA, по меньшей мере один иммуногенный полипептид PSCA и по меньшей мере один иммуногенный полипептид PSMA, при этом иммуногенный полипептид PSA содержит аминокислотную последовательность с SEQ ID NO: 17 или аминокислоты 4-240 из SEQ ID NO: 17, при этом иммуногенный полипептид PSCA содержит аминокислотную последовательность с SEQ ID NO: 21 или аминокислоты 2-125 из SEQ ID NO: 21 и при этом иммуногенный полипептид PSMA содержит аминокислотную последовательность, выбранную из группы, состоящей из:

1) аминокислот 15-750 из SEQ ID NO: 1;

2) аминокислот 4-739 из SEQ ID NO: 9 и

3) аминокислотной последовательности с SEQ ID NO: 9.

В некоторых конкретных воплощениях мультиантигенная конструкция содержит нуклеотидную последовательность, кодирующую аминокислотную последовательность с SEQ ID NO: 60 или 64.

В некоторых конкретных воплощениях мультиантигенная конструкция содержит: (а) нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, (б) нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, и (в) нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, при этом:

(1) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности с SEQ ID NO: 18; (б) нуклеотидной последовательности с SEQ ID NO: 20; (в) нуклеотидной последовательности, содержащей нуклеотиды 10-720 из SEQ ID NO: 18; (г) нуклеотидной последовательности, содержащей нуклеотиды 1115-1825 из SEQ ID NO: 58 или SEQ ID NO: 63; (д) нуклеотидной последовательности, содержащей нуклеотиды 1106-1825 из SEQ ID NO: 58 или SEQ ID NO: 63; и (e) вырожденного варианта любой из этих нуклеотидных последовательностей, приведенных выше в (а)-(д);

(2) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSCA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности с SEQ ID NO: 22; (б) нуклеотидной последовательности, содержащей нуклеотиды 10-375 из SEQ ID NO: 22; (в) нуклеотидной последовательности, содержащей нуклеотиды 1892-2257 из SEQ ID NO: 58 или SEQ ID NO: 63; (г) нуклеотидной последовательности, содержащей нуклеотиды 1886-2257 из SEQ ID NO: 58 или SEQ ID NO: 63; и (д) вырожденного варианта любой из этих нуклеотидных последовательностей, приведенных выше в (а)-(г); и

(3) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSMA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности, содержащей нуклеотиды 43-2250 из SEQ ID NO: 2; (б) нуклеотидной последовательности с SEQ ID NO: 4; (в) нуклеотидной последовательности с SEQ ID NO: 6; (г) нуклеотидной последовательности с SEQ ID NO: 8; (д) нуклеотидной последовательности с SEQ ID NO: 10; (е) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 4; (ж) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 6; (з) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 8; (и) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 10; (к) нуклеотидной последовательности, содержащей нуклеотиды 2333-4543 из SEQ ID NO: 58 или SEQ ID NO: 63; (л) нуклеотидной последовательности, содержащей нуклеотиды 2324-4543 из SEQ ID NO: 58 или SEQ ID NO: 63; и (м) вырожденного варианта любой из этих нуклеотидных последовательностей, приведенный выше в (а)-(л).

В другом конкретном воплощении мультиантигенная конструкция содержит нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, и нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, при этом: нуклеотидная последовательность, кодирующая иммуногенный полипептид PSA, содержит нуклеотиды 1106-1825 из SEQ ID NO: 58 или SEQ ID NO: 63; нуклеотидная последовательность, кодирующая иммуногенный полипептид PSCA, содержит нуклеотиды 1886-2257 из SEQ ID NO: 58 или SEQ ID NO: 63; и нуклеотидная последовательность, кодирующая иммуногенный полипептид PSMA, содержит нуклеотиды 2324-4543 из SEQ ID NO: 58 или SEQ ID NO: 63.

Чтобы обеспечить экспрессию отдельных иммуногенных полипептидов РАА из единой мультиантигенной конструкции, переносимой вектором, между последовательностями, которые кодируют индивидуальные иммуногенные полипептиды РАА (т.е. полипептиды PSA, PSCA и PSMA), вводят промежуточные последовательности. Эти промежуточные последовательности обеспечивают отдельную трансляцию расположенного ниже иммуногенного полипептида РАА. Такая промежуточная последовательность обозначена в данном описании как «разделяющая последовательность». Любые последовательности, которые можно использовать для совместной экспрессии многих полипептидов из одного вектора, могут быть использованы в качестве разделяющих последовательностей в векторе, предложенном согласно описанию настоящего изобретения. Примеры полезных разделяющих последовательностей включают участки внутренней посадки рибосомы (IRES) и последовательности 2А-пептидов.

Последовательности 2А-пептидов и подобные 2А-пептидам, также называемые кассетами для расщепления или цис-активирующими элементами гидролаз (CHYSEL), представляют собой последовательности длиной приблизительно 20 аминокислот с высококонсервативным карбоксиконцевым мотивом D-V/I-EXNPGP (Фиг. 2). Такие последовательности редко встречаются в природе, чаще всего их обнаруживают в таких вирусах, как вирус ящура (FMDV), вирус А, вызывающий ринит у лошадей (ERAV), вирус энцефаломиокардита (EMCV), вирус болезни Тешена у свиней (PTV) и вирус Thosea asigna (TAV) (Luke, G.A., P. de Felipe, et al. (2008). "Occurrence, function and evolutionary origins of '2A-like' sequences in virus genomes". J. Gen. Virol., 89 (Pt 4): 036-1042). Используя основанную на применении 2А-пептидов стратегию мультиантигенной экспрессии, гены, кодирующие несколько целевых антигенов, соединяют друг с другом в одной открытой рамке считывания, с разделением 2А-последовательностями. Всю открытую рамку считывания клонируют в вектор с единственным промотором и терминатором. После доставки конструкций в клетку хозяина мРНК, кодирующая несколько антигенов, транскрибируется и транслируется в виде единого полипептида. В процессе трансляции 2А-последовательностей рибосомы «перепрыгивают» связь между находящимися на С-конце глицином и пролином. «Рибосомное перепрыгивание» (ribosomal skipping) действует по типу котрансляционного аутокаталитического «расщепления», в результате которого осуществляется высвобождение белков, расположенных выше, от белков, расположенных ниже. Общую информацию, касающуюся применения различных последовательностей 2А-пептидов в векторах, коэкспрессирующих несколько полипептидов, можно найти в статье Andrea L. Szymczak & Darrio АА Vignali: Development of 2A peptide-based strategies in the design of multicistronic vectors. Expert Opinion Biol. Ther. (2005), 5(5): 627-638, описание которой включено в данное описание посредством ссылки. Результом встраивания 2А-последовательности между двумя белковыми антигенами является добавление приблизительно 20 аминокислот к С-концу расположенного выше полипептида и 1 аминокислоты (пролина) к N-концу расположенного ниже по течению белка. При адаптации этой методологии, на N-конец 2А-кассеты можно встроить сайты расщепления протеазами таким образом, что присутствующие повсеместно протеазы будут расщеплять кассету, начиная от расположенного выше белка (Fang, J., S. Yi, et al. (2007). "An antibody delivery system for regulated expression of therapeutic levels of monoclonal antibodies in vivo". Mol. Ther., 15(6): 1153-1159).

Примеры конкретных последовательностей 2А-пептидов, которые могут быть использованы в настоящем изобретении, описаны в Andrea L. Szymczak & Darrio АА Vignali: Development of 2A peptide-based strategies in the design of multicistronic vectors. Expert Opinion Biol. Ther., (2005), 5(5): 627-638 и приведены в Таблице 1.

Участки внутренней посадки рибосомы (IRES) представляют собой элементы РНК (Фиг. 3), обнаруженные в 5'-нетранслируемых участках некоторых молекул РНК (Bonnal, S., С. Boutonnet, et al. (2003). "IRESdb: the Internal Ribosome Entry Site database". Nucleic Acids Res., 31(1): 427-428). Они «притягивают» рибосомы эукариот к РНК, способствуя трансляции расположенных ниже открытых рамок считывания. В отличие от обычной кэп-зависимой трансляции в клетках, где кэпом является 7-метилгуанозин, IRES-опосредуемая трансляция может инициироваться в кодонах AUG, удаленных от начала молекулы РНК. Этот высокоэффективный процесс может быть использован в полицистронных экспрессирующих векторах (Bochkov, Y.A. and А.С. Palmenberg (2006). "Translational efficiency of EMCV IRES in bicistronic vectors is dependent upon IRES sequence and gene location". Biotechniques, 41(3): 283-284, 286, 288). Последовательность предпочтительного IRES (pIRES) EMCV приведена на Фиг. 3 и в SEQ ID NO: 59. В минимальном IRES (mIRES) EMCV отсутствуют подчеркнутые первые пять кодонов L белка EMCV, которые показаны на Фиг. 3. Обычно, в вектор встраивают два трансгена между промотором и терминатором транскрипции в качестве двух отдельных открытых рамок считывания, разделенных посредством IRES. После доставки таких конструкций в клетку хозяина будет транскрибироваться единый длинный транскрипт, кодирующий оба трансгена. Первая ORF будет транслироваться традиционным кэп-зависимым образом с терминацией на стоп-кодоне, расположенном выше относительно IRES. Вторая ORF будет транслироваться кэп-независимым образом с использованием IRES. Благодаря этому могут продуцироваться два независимых белка из единой мРНК, транскрибированной с вектора с использованием единой экспрессионной кассеты. В некоторых воплощениях мультиантигенная конструкция содержит IRES из EMCV, содержащий нуклеотиды 1-553 из SEQ ID NO: 59.

Обычно в мультиантигенной конструкции необходима только одна разделяющая последовательность между двумя последовательностями, кодирующими иммуногенные полипептиды РАА. Порядок расположения разделяющих последовательностей и нуклеотидных последовательностей, кодирующих полипептиды РАА в мультиантигенной конструкции, показан в формуле (I):

,

где: (1) каждый РАА1, РАА2 и РАА3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, или нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, при условии, что РАА1, РАА2 и РАА3 кодируют разные полипептиды РАА, и (2) SS1 и SS2 представляют собой разделяющие последовательности и могут быть одинаковыми или разными.

В некоторых воплощениях вектор содержит мультиантигенную конструкцию формулы (I), где:

(1) РАА1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA;

(2) РАА2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA или PSMA (если РАА2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, то РАА3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, или наоборот);

(3) SS1 представляет собой 2А-пептидную последовательность и

(4) SS2 представляет собой 2А-пептидную последовательность или IRES.

В некоторых конкретных воплощениях мультиантигенная конструкция имеет структуру, выбранную из группы, состоящей из:

(1) PSA-F2A-PSMA-mIRES-PSCA;

(2) PSA-F2A-PSMA-T2A-PSCA;

(3) PSA-T2A-PSCA-F2A-PSMA и

(4) PSCA-F2A-PSMA-mIRES-PSA.

В конкретном воплощении вектор содержит мультиантигенную конструкцию, имеющую структуру формулы (I):

,

где:

(1) РАА1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, и содержит нуклеотиды 1115-1825 из SEQ ID NO: 58 или содержит нуклеотиды 1106-1114 из SEQ ID NO: 58 или 63;

(2) РАА2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, и содержит нуклеотиды 1892-2257 из SEQ ID NO: 58 или содержит нуклеотиды 1886-2257 из SEQ ID NO: 58 или 63;

(3) РАА3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, и содержит нуклеотиды 2333-4543 из SEQ ID NO: 58 или содержит нуклеотиды 2324-4543 из SEQ ID NO: 58 или 63;

(4) SS1 представляет собой нуклеотидную последовательность, кодирующую Т2А; и

(5) SS2 представляет собой нуклеотидную последовательность, кодирующую F2A.

Мультиантигенная конструкция также может включать в себя линкерную последовательность, расположенную между нуклеотидной последовательностью, кодирующей иммуногенный полипептид РАА (т.е. иммуногенный полипептид PSA, PSCA или PSMA), и расположенной ниже разделяющей последовательностью. Одним из примеров такой линкерной последовательности является нуклеотидная последовательность, кодирующая глицин-серин.

В некоторых конкретных воплощениях мультиантигенная конструкция содержит нуклеотидную последовательность, которая кодирует аминокислотную последовательность с SEQ ID NO: 60 или кодирует аминокислотную последовательность с SEQ ID NO: 61. В конкретном воплощении мультиантигенная конструкция содержит нуклеотидную последовательность, выбранную из группы, состоящей из нуклеотидной последовательности с SEQ ID NO: 61, нуклеотидной последовательности с SEQ ID NO: 65, нуклеотидной последовательности с SEQ ID NO: 66 и вырожденного варианта любой из этих нуклеотидных последовательностей.

Б3. Регуляторные последовательности

Помимо разделяющих последовательностей и линкерных последовательностей, описанных выше, вектор может содержать другие ненативные регуляторные последовательности для управления эффективной экспрессией кодируемых олипептидов РАА. Примеры регуляторных последовательностей включают (1) последовательности инициации транскрипции, терминации транскрипции, промотора и энхансера; (2) сигналы, управляющие процессингом РНК, такие как сигналы сплайсинга и полиаденилирования; (3) последовательности, которые стабилизируют цитоплазматическую мРНК; (4) последовательности, которые повышают эффективность трансляции (т.е. консенсусную последовательность Козака); (5) последовательности, которые повышают стабильность белков; и (6) последовательности, которые повышают секрецию белков. Примеры систем промоторов, которые можно использовать в векторах, предложенных согласно описанию настоящего изобретения, для эффективного управления экспрессией в клетках млекопитающих, включают промотор SV40, промотор бета-актина цыпленка, промотор фактора элонгации человека, промотор цитомегаловируса (CMV) человека, промотор CMV обезьян, промотор CMV мышей, промотор вируса псевдобешенства, промотор вируса саркомы Рауса, фосфоглицераткиназный промотор, промотор длинных концевых повторов (LTR; long terminal repeats) вируса мышиного лейкоза, промотор LTR вируса лейкоза птиц, промотор LTR вируса опухоли молочной железы мышей, промотор LTR вируса мышиного лейкоза Молони, промотор ингибитора активатора плазминогена, CYR61, главный поздний промотор аденовируса, мышиный металлотионеиновый промотор, промотор фосфоенолпируваткарбоксикиназы мыши, промотор гена бета-лактоглобулина быка, промотор гена пролактина быка, убиквитиновый С промотор и тимидинкиназный промотор вируса простого герпеса. Примеры сигналов терминации транскрипции включают полиаденилирование (polyA) SV40; polyA бычьего гормона роста; polyA кроличьего β-глобина; терминаторы тимидинкиназа HSV, гликопротеин В и гликопротеин D; Е и L папилломавируса человека (HPV) и синтетические терминаторы.

В некоторых воплощениях векторы С68 содержат промотор цитомегаловируса человека (CMV), возможно с энхансером CMV и SV40 polyA.

В. КОМПОЗИЦИИ, СОДЕРЖАЩИЕ ВЕКТОР, НЕСУЩИЙ МУЛЬТИАНТИГЕННУЮ КОНСТРУКЦИЮ (КОМПОЗИЦИИ НА ОСНОВЕ ВЕКТОРОВ)

Согласно описанию настоящего изобретения также предложена композиция, содержащая вектор, предложенный согласно описанию настоящего изобретения (в данном документе «композиция на основе вектора»). Композиции на основе векторов полезны для вызова иммунного ответа на белок РАА in vitro или in vivo у млекопитающего, включая человека. Композиция на основе вектора может содержать только векторы или может дополнительно содержать эксципиент.

В некоторых воплощениях композиция на основе вектора представляет собой фармацевтическую композицию, которая содержит вектор, предложенный согласно описанию настоящего изобретения, и фармацевтически приемлемый эксципиент. Подходящие эксципиенты для фармацевтических композиций известны в данных областях техники. Эксципиенты могут включать водные растворы, неводные растворы, суспензии и эмульсии. Примеры неводных эксципиентов включают пропиленгликоль, полиэтиленгликоль, растительные масла, такие как оливковое масло, и инъекционные органические сложные эфиры, такие как этилолеат. Примеры водного эксципиента включают воду, спиртовой/водный растворы, эмульсии или суспензии, в том числе физиологический раствор и забуференные среды. Подходящие эксципиенты также включают агенты, которые способствуют захвату вектора клеткой.

В некоторых воплощениях фармацевтическая композиция представляет собой вакцинную композицию для введения людям с целью ингибирования аномальной пролиферации клеток, для обеспечения защиты от развития ракового заболевания (для использования в качестве профилактического средства), или для лечения рака (для использования в качестве терапевтического средства), ассоциированного со сверхэкспрессией РАА, или для вызова иммунного ответа на конкретный РАА человека, такой как PSMA, PSA и PSCA. Вакцинная композиция может дополнительно содержать один или более адъювантов. Примеры адъювантов, которые могут быть включены в вакцинные композиции, приведены в данном описании ниже.

Г. ПРИМЕНЕНИЯ ВЕКТОРОВ И КОМПОЗИЦИЙ НА ОСНОВЕ ВЕКТОРОВ

Согласно другим аспектам описания настоящего изобретения предложены способы применения вектора или композиции, содержащей векторы, изложенные в данном описании выше.

Согласно одному из аспектов описания настоящего изобретения предложен способ вызова иммунного ответа на РАА у млекопитающего, в частности, человека, включающий введение млекопитающему эффективного количества (1) вектора, содержащего мультиантигенную конструкцию, или (2) композиции, содержащей такие векторы.

Согласно другому аспекту описания настоящего изобретения предложен способ ингибирования аномальной пролиферации клеток у человека, при этом аномальная пролиферация клеток ассоциирована со сверхэкспрессией РАА. Способ включает введение млекопитающему эффективного количества (1) вектора, содержащего мультиантигенную конструкцию, кодирующую два или более иммуногенных полипептида РАА, или (2) композиции, содержащей такие векторы. В некоторых воплощениях способ предназначен для ингибирования аномальной пролиферации клеток в предстательной железе у человека. В конкретном воплощении согласно описанию настоящего изобретения предложен способ ингибирования аномальной пролиферации клеток в предстательной железе, сверхэкспрессирующей PSMA. В некоторых воплощениях согласно изобретению предложен способ лечения рака предстательной железы у человека, включающий введение человеку эффективного количества (1) вектора, содержащего мультиантигенную конструкцию, или (2) композиции, содержащей такие векторы. В предпочтительном воплощении мультиантигенная конструкция представляет собой тройную антигенную конструкцию, кодирующую иммуногенный полипептид PSMA, иммуногенный полипептид PSA и иммуногенный полипептид PSCA.

Векторы или композиции на основе векторов можно вводить животному, в том числе человеку, рядом способов, известных в данной области техники. Примеры подходящих способов включают: (1) внутримышечное, внутрикожкое, интраэпидермальное, внутривенное, интраартериальное, подкожное или внутрибрюшинное введение, (2) пероральное введение и (3) местное применение (такое как глазное, интраназальное и интравагинальное применение). Один из конкретных способов внутрикожкого или интраэпидермального введения вакцинной композиции на основе нуклеиновой кислоты включает применение технологии доставки с использованием генной пушки, такого как приспособления для эпидермальной доставки с помощью частиц (PMED™), применяемого для доставки вакцин и поставляемого на рынок PowderMed. Другой конкретный способ внутримышечного введения вакцины на основе нуклеиновой кислоты представляет собой инъекцию с последующей электропорацией.

Эффективное количество вектора или композиции на основе вектора, подлежащих введению в данном способе, может быть легко определено специалистом в данной области техники и будет зависеть от ряда факторов. В способе лечения рака, такого как рак предстательной железы, факторы, которые можно учитывать при определении эффективного количества, включают без ограничения: (1) подлежащего лечению субъекта, в том числе иммунный статус и состояние здоровья субъекта, (2) тяжесть или стадию подлежащего лечению рака, (3) специфические экспрессируемые иммуногенные полипептиды РАА, (4) степень желаемой защиты или желаемого лечения, (5) способ и схему введения, (б) используемые композиции и (7) совместное введение других терапевтических агентов (таких как адъюванты или иммуномодуляторы). Например, эффективные количества вектора могут находиться в диапазоне от 2 мкг/доза до 10 мг/доза, если вакцинная композиция на основе нуклеиновой кислоты приготовлена в виде водного раствора и вводится подкожной инъекцией с помощью иглы или инъекцией с помощью пневматического устройства, в то время как может быть необходимо использовать диапазон только от 16 нг/доза до 16 мкг/доза, если препарат на основе нуклеиновой кислоты приготовлен в виде покрытых золотом гранул и доставляется с использованием технологии генной пушки.

Векторы или композиции на основе векторов, в том числе вакцинные композиции, предложенные согласно описанию настоящего изобретения, можно использовать вместе с одним или более адъювантами. Примеры подходящих адъювантов включают: (1) композиции эмульсии типа масло-в-воде (с другими специфическими иммуностимулирующими агентами, такими как мурамилполипептиды или компоненты клеточной стенки бактерий, или без них), такие как MF59™ (содержащая 5% сквалена, 0,5% твина 80 и 0,5% сорбитантриолеата) и SAF (адъювантная композиция Syntex) (содержащая 10% сквалена, 0,4% твина 80, 5% блокированного плуроником полимера L121 и thr-MDP (треонил-мурамилдипептид)); (2) сапониновые адъюванты, такие как QS21, STIMULON™ (Cambridge Bioscience, Worcester, MA), Abisco® (Isconova, Швеция) или Iscomatrix® (Commonwealth Serum Laboratories, Австралия); (3) полный адъювант Фрейнда (CFA) и неполный адъювант Фрейнда (IFA); (4) олигонуклеотиды, содержащие CpG-мотивы, т.е. содержащие по меньшей мере один динуклеотид CG, в котором цитозин является неметилированным (например, Krieg, Vaccine (2000), 19: 618-622; Krieg, Curr. Opin. Mol. Ther. (2001), 3: 15-24; WO 98/40100, WO 98/55495, WO 98/37919 и WO 98/52581); и (5) соли металлов, в том числе соли алюминия (как например, квасцы, фосфат алюминия, гидроксид алюминия); (6) сапонин и эмульсию типа масло-в-воде (например, WO 99/11241).

Векторы или композиции на основе векторов, предложенные согласно описанию настоящего изобретения, могут быть использованы вместе с одним или более чем одним иммунномодулятором. Согласно дополнительному аспекту описания настоящего изобретения предложен способ лечения рака предстательной железы у млекопитающего, в частности, человека, включающий введение млекопитающему: (1) эффективного количества вектора, композиции на основе вектора или вакцины, предложенных согласно настоящему изобретению; (2) эффективного количества по меньшей мере одного ингибитора супрессорных клеток иммунной системы (ингибитора ISC); и (3) эффективного количества по меньшей мере одного усилителя эффекторных клеток иммунной системы (усилителя IEC). В описании настоящего изобретения этот способ также обозначается как «схема иммунотерапевтического лечения вакциной» (или «VBIR»).

Усилители IEC и ингибиторы ISC можно вводить любыми подходящими способами и путями, включая (1) системное введение, такое как внутривенное, внутримышечное или пероральное введение, и (2) локальное введение, такое как внутрикожкое и подкожное введение. Там, где целесообразно или приемлемо, локальное введение обычно является предпочтительным по отношению к системному введению. Локальное введение любого усилителя IEC и ингибитора ISC может быть осуществлено в любом месте тела млекопитающего, которое подходит для локального введения фармацевтических средств; однако, более предпочтительно вводить эти иммуномодуляторы локально в непосредственной близости к дренируемому вакциной лимфатическому узлу.

Два или более специфических усилителей IEC из одного класса усилителей IEC (в качестве примеров, два антагониста CTLA) могут быть введены в комбинации с ингибиторами ISC. Помимо этого можно вводить совместно два или более специфических усилителей IEC из двух или более разных классов усилителей IEC (например, один антагонист CTLA-4 и один агонист TLR или один антагонист CTLA-4 и один антагонист PD-1 (белка 1 программируемой клеточной смерти). Аналогичным образом, в комбинации с усилителями IEC можно вводить два или более специфических ингибиторов ISC из одного класса ингибиторов ISC (в качестве примеров, два или более ингибиторов протеинкиназ). Помимо этого можно вводить совместно два или более специфических ингибиторов ISC из двух или более разных классов ингибиторов ISC (например, один ингибитор протеинкиназ и один ингибитор СОХ-2 (циклооксигеназы-2).

Векторы или композиции на основе векторов можно вводить совместно или последовательно с любыми из используемых иммуномодуляторов или всеми используемыми иммуномодуляторами (т.е. ингибиторами ISC и усилителями IEC). Аналогичным образом, если используют два или более иммуномодулятора, то их можно вводить совместно или последовательно по отношению друг к другу. В некоторых воплощениях вектор или композицию на основе вектора вводят совместно (например, в смеси) по отношению к одному иммуномодулятору, но последовательно по отношению к одному или более чем одному дополнительному иммуномодулятору. Совместное введение вектора или композиции на основе вектора и иммуномодуляторов может включать случаи, когда вакцину и по меньшей мере один иммуномодулятор вводят таким образом, чтобы каждый из них присутствовал в месте введения, таком как дренируемый вакциной лимфатический узел, в одно и то же время, даже если антиген и иммуномодуляторы не вводят совместно. Совместное введение вакцины и иммуномодуляторов также может включать случаи, когда вакцина или иммуномодулятор выведены из места введения, но в месте введения, таком как дренируемый вакциной лимфатический узел, сохраняется по меньшей мере один эффект выведенных вакцины или иммуномодулятора на клетки по меньшей мере до тех пор, пока один или более чем один дополнительный иммуномодулятор не будет доставлен в место введения. В тех случаях, когда вакцину на основе нуклеиновой кислоты вводят в комбинации с CpG, эта вакцина и CpG могут содержаться в одной композиции и вводиться совместно любым подходящим способом. В некоторых воплощениях вакцину на основе нуклеиновой кислоты и CpG в совместной композиции (смеси) вводят путем внутримышечной инъекции в сочетании с электропорацией.

В комбинации с векторами или композициями на основе векторов, предложенных согласно настоящему изобретению, можно использовать любые ингибиторы ISC. Примеры классов ингибиторов ISC включают антагонисты PD-1/PD-L1 (лиганд 1 PD-1), ингибиторы протеинкиназ, ингибиторы циклооксигеназы-2 (СОХ-2), ингибиторы фосфодиэстеразы типа 5 (PDE5) и ДНК-кросслинкеры. Примеры антагонистов PD-1/PD-L1 включают моноклональные антитела к PD-1 и PD-L1. Примеры ингибиторов СОХ-2 включают целекоксиб и рофекоксиб. Примеры ингибиторов PDE5 включают аванафил, лоденафил, мироденафил, силденафил, тадалафил, варденафил, уденафил и запринаст. Примером ДНК-кросслинкеров является циклофосфамид. Примеры специфических ингибиторов протеинкиназ описаны подробно ниже.

Термин «ингибитор протеинкиназ» относится к любому веществу, которое действует в качестве селективного или неселективного ингибитора протеинкиназ. Термин «протеинкиназы» относится к ферментам, которые катализируют перенос концевого фосфата аденозинтрифосфата на остатки тирозина, серина или треонина в белковых субстратах. Протеинкиназы включают рецепторные тирозинкиназы и нерецепторные тирозинкиназы. Примеры рецепторных тирозинкиназ включают EGFR (например, EGFR/HER1/ErbB1, HER2/Neu/ErbB2, HER3/ErbB3, HER4/ErbB4), INSR (инсулиновый рецептор), IGF-IR (рецептор I инсулиноподобного фактора роста), IGF-II1R, IRR (рецептор, родственный инсулиновому рецептору), PDGFR (рецептор фактора роста тромбоцитов) (например, PDGFRA, PDGFRB), с-KIT/SCFR (рецептор фактора стволовых клеток), VEGFR-1 (рецептор 1 сосудистого эндотелиального фактора роста)/FLT-1 (FMS-подобная тирозинкиназа-1), VEGFR-2/FLK-1 (киназа-1 эмбриональной печени)/KDR (рецептор, содержащий домен вставки киназы), VEGFR-3/FLT-4, FLT-3/FLK-2, CSF-1R (рецептор колониестимулирующего фактора-1), FGFR (рецептор фактора роста фибробластов) 1-4, CCK4 (киназа 4 рака толстой кишки), TRK (тирозинкиназа) А-С, MET, RON, ЕРНА 1-8, ЕРНВ 1-6, AXL, MER, TYR03, TIE (тирозинкиназа с гомологичными иммуноглобулин-подобному и эпидермальному фактору роста доменами), ТЕК, RYK, DDR 1-2, RET, c-ROS, LTK (тирозинкиназа лейкоцитов), ALK (киназа анапластической лимфомы), ROR (подобный рецепторной тирозинкиназе орфановый рецептор) 1-2, MuSK (мышечно-специфическая киназа), AATYK (апоптоз-ассоциированная тирозинкиназа) 1-3 и RTK (рецепторная тирозинкиназа) 106. Примеры нерецепторных тирозинкиназ включают BCR-ABL, Src, Frk, Btk (тирозинкиназа Брутона), Csk (киназа С-конца Src-киназы), Abl (тирозинкиназа Абельсона), Zap70, Fes/Fps, Fak (киназа фокальной адгезии), Jak (янус-киназа), Ack (ацетат-киназа) и LIMK. По схеме иммунотерапевтического лечения вакцинами, предложенной согласно описанию настоящего изобретения, ингибиторы протеинкиназ вводят млекопитающему в субоптимальной дозе. Термин «субоптимальная доза» относится к дозе в количестве ниже минимальной эффективной дозы, применяемой при введении ингибитора тирозинкиназ в качестве монотерапии (т.е., если ингибитор протеинкиназ вводят без каких-либо других терапевтических агентов) для целевого опухолевого заболевания.

Примеры конкретных ингибиторов протеинкиназ, подходящих для применения согласно схеме иммунотерапевтического лечения вакцинами, включают лапатиниб, AZD 2171, ET18OCH3, индирубин-3'-оксим, NSC-154020, PD 169316, кверцетин, росковитин, трицирибин, ZD1839, 5-йодотуберцидин, адафостин, алоизин (aloisine), альстерпаулон, аминогенистеин, API-2, апигенин, арктигенин, ARRY-334543, акситиниб, AY-22989, AZD 2171, бисиндолилмалеимид IX, CCI-779, хелеритрин, DMPQ, DRB, эдельфозин, ENMD-981693, аналог эрбстатина, эрлотиниб, фасудил, гефитиниб (ZD1839), Н-7, Н-8, Н-89, НА-100, НА-1004, НА-1077, НА-1100, гидроксифасудил, кенпаулон, KN-62, KY12420, LFM-A13, лютеолин, LY294002, LY-294002, маллотоксин, ML-9, MLN608, NSC-226080, NSC-231634, NSC-664704, NSC-680410, NU6102, оломуцин, оксиндол I, PD 153035, PD 98059, флоридзин, пикеатаннол, пикроподофиллин, PKI, РР1, РР2, PTK787/ZK222584, PTK787/ZK-222584, пурваланол А, рапамун, рапамицин, Ro 31-8220, роттлерин, SB202190, SB203580, сиролимус, SL327, SP600125, стауроспорин, STI-571, SU1498, SU4312, SU5416, семаксаниб, SU6656, SU6668, ингибитор syk (spleen tyrosine kinase; тирозинкиназа селезенки), ТВВ, TCN, тирфостин AG 1024, тирфостин AG 490, тирфостин AG 825, тирфостин AG 957, U0126, W-7, вортманнин, Y-27632, зактима, ZM 252868, гефитиниб, сунитиниба малат, эрлотиниб, лапатиниб, канертиниб, семаксиниб, ваталаниб, сорафениб, иматиниб, дазатиниб, лефлуномид, вандетаниб и нилотиниб.

В некоторых воплощениях ингибитор протеинкиназ преставляет собой мультикиназный ингибитор, который является ингибитором, действующим в отношении более чем одной конкретной киназы. Примеры мультикиназных ингибиторов включают иматиниб, сорафениб, лапатиниб, BIRB-796 и AZD-1152, AMG706, зактима, МР-412, сорафениб, дазатиниб, лестауртиниб, XL647, XL999, лапатиниб, MLN518 (также известный как СТ53518), PKC412, ST1571, АЕЕ 788, OSI-930, OSI-817, сунитиниба малат, эрлотиниб, гефитиниб, акситиниб, босутиниб, темсиролимус и нилотиниб. В некоторых конкретных воплощениях ингибитором тирозинкиназ является сунитиниб, сорафениб либо фармацевтически приемлемые соль или производное (такие как малат или тозилат) сунитиниба или сорафениба.

Сунитиниба малат, поставляемый на рынок Pfizer Inc. под торговым названием СУТЕНТ, описывается химически как (2S)-гидрокси-бутандиовая кислота в соединении с N-[2-(диэтиламино)этил]-5-[(Z)-(5-фтор-1,2-дигидро-2-оксо-3H-индол-3-илидин)метил]-2,4-диметил-1Н-пиррол-3-карбоксамидом (1:1). Соединение, его синтез и конкретные полиморфы описаны в патенте США №6573293, публикациях на патент США №№2003-0229229, 2003-0069298 и 2005-0059824 и в J.M. Manley, M.J. Kalman, B.G. Conway, C.C. Ball, J.L. Havens and R. Vaidyanathan, "Early Amidation Approach to 3-[(4-amido)pyrrol-2-yl]-2-indolinones", J. Org. Chem. 68, 6447-6450 (2003). Композиции на основе сунитиниба и его L-малатной соли описаны в публикации РСТ № WO 2004/024127. В США получено разрешение к применению сунитиниба малата для лечения гастроинтестинальной стромальной опухоли, распространенной почечноклеточной карциномы и прогрессирующих, хорошо дифференцированных нейроэндокринных опухолей поджелудочной железы у пациентов с неоперабельной локально распространенной или метастатической формой заболевания. Рекомендованная доза сунитиниба малата для человека при гастроинтестинальной стромальной опухоли (GIST) и распространенной почечноклеточной карциномы (RCC) составляет 50 мг, которую принимают перорально один раз в сутки, по схеме: прием в течение 4 недель, затем 2 недели отдыха (схема 4/2). Рекомендованная доза сунитиниба малата для нейроэндокринных опухолей поджелудочной железы (pNET) составляет 37,5 мг, которую принимают перорально один раз в сутки.

Согласно схеме иммунотерапевтического лечения вакцинами, сунитиниба малат можно вводить перорально в виде разовой дозы или многократных доз. Обычно, сунитиниба малат принимают в виде двух, трех, четырех или более следующих друг за другом еженедельных доз, затем следует период «отдыха», составляющий примерно 1 или 2 недели либо более, когда никакого сунитиниба малата не принимают. В одном из воплощений, дозы принимают в течение примерно 4 недель, с 2 неделями «отдыха». В другом воплощении сунитиниба малат принимают в течение двух недель, с «отдыхом» в течение 1 недели. Однако, его также можно принимать без периода «отдыха» в течение всего периода лечения. Эффективное количество сунитиниба малата, вводимого перорально человеку согласно схеме иммунотерапевтического лечения вакциной, обычно составляет ниже 40 мг на одного субъекта из расчета на одну дозу. Например, его можно вводить перорально в количестве 37,5; 31,25; 25; 18,75; 12,5; 6,25 мг на одного субъекта в сутки. В некоторых воплощениях сунитиниба малат вводят перорально в диапазоне 1-25 мг на одного субъекта из расчета на одну дозу. В некоторых других воплощениях сунитиниба малат вводят перорально в количестве 6,25; 12,5 или 18,75 мг на одного субъекта из расчета на одну дозу. Предусматриваются другие режимы введения и варианты, и они будут определены путем получения консультации врача.

Сорафениба тозилат, поставляемый на рынок под торговым названием НЕКСАВАР, также представляет собой мультикиназный ингибитор. Его химическое название 4-(4-{3-[4-хлор-3-(трифторметил)фенил]уреидо}фенокси)-N-метилпиридин-2-карбоксамид. В США он одобрен к применению для лечения первичного рака почки (распространенной почечноклеточной карциномы) и распространенного первичного рака печени (гепатоклеточной карциномы). Рекомендованная суточная доза составляет 400 мг, которую принимают перорально два раза в сутки. Согласно схеме иммунотерапевтического лечения вакциной, предложенной согласно описанию настоящего изобретения, эффективное количество сорафениба тозилата, вводимого перорально, обычно составляет ниже 400 мг на одного субъекта в сутки. В некоторых воплощениях эффективное количество сорафениба тозилата, вводимого перорально, находится в диапазоне 10-300 мг на одного субъекта в сутки. В некоторых других воплощениях эффективное количество сорафениба тозилата, вводимого перорально, составляет от 10 до 200 мг на одного субъекта в сутки, как например, 10, 20, 60, 80, 100, 120, 140, 160, 180 или 200 мг на одного субъекта в сутки.

Акситиниб, поставляемый на рынок под торговым названием ИНЛИТА, представляет собой селективный ингибитор рецепторов 1, 2 и 3 VEGF. Его химическое название (N-метил-2-[3-((Е)-2-пиридин-2-ил-винил)-1Н-индазол-6-илсульфанил]-бензамид. Он одобрен к применению для лечения распространенной почечноклеточной карциномы после неудачи при применении одной из предшествующих системных терапий. Начальная доза составляет 5 мг перорально два раза в сутки. Корректировки доз могут быть выполнены с учетом индивидуальной безопасности и переносимости. По схеме иммунотерапевтического лечения вакциной, предложенной согласно описанию настоящего изобретения, эффективное количество акситиниба, вводимого перорально, обычно составляет ниже 5 мг два раза в сутки. В некоторых других воплощениях эффективное количество акситиниба, вводимого перорально, составляет от 1 до 5 мг два раза в сутки. В некоторых других воплощениях эффективное количество акситиниба, вводимого перорально, составляет 1, 2, 3, 4 или 5 мг два раза в сутки.

Согласно схемам иммунотерапевтического лечения вакцинами можно использовать любые усилители IEC. Ими могут быть малые молекулы или большие молекулы (такие как белок, полипептид, ДНК, РНК и антитело). Примеры усилителей IEC, которые могут быть использованы, включают агонисты TNFR, антагонисты CTLA-4, агонисты TLR, антагонисты белка 1 программируемой клеточной смерти (PD-1) (такие как антитело к PD-1 CT-011) и антагонисты лиганда 1 белка 1 программируемой клеточной смерти (PD-L1) (такие как BMS-936559), антагонисты гена 3 активации лимфоцитов (LAG3) и антагонисты молекулы-3, содержащей T-клеточный иммуноглобулиновый и муциновый домены (TIM-3). Примеры конкретных агонистов TNFR, антагонистов CTLA-4 и агонистов TLR приведены подробно в данном описании ниже.

Агонисты TNFR

Примеры агонистов TNFR включают агонисты ОХ40, 4-1ВВ (такие как BMS-663513), GITR (такие как TRX518) и CD40. Примеры конкретных агонистов CD40 описаны подробно в данном описании ниже.

Агонистами CD40 являются вещества, которые связываются с рецептором CD40 на клетке и способны повышать одну или более активностей, ассоциируемых с CD40 или CD40L. Таким образом, термин «агонисты» CD40 охватывает термин «лиганды» CD40.

Примеры агонистов CD40 включают агонистические антитела к CD40, фрагменты агонистических антител к CD40, лиганды CD40 (CD40L) и фрагменты и производные CD40L, такие как олигомерный (например, бивалентный тримерный CD40L), содержащие их слитые белки и их варианты.

Лиганды CD40 для применения в настоящем изобретении включают любой пептид, полипептид или белок либо любую нуклеиновую кислоту, кодирующую пептид, полипептид или белок, которые могут связываться с одним или более рецепторами и активировать один или более рецепторов CD40 на клетке. Подходящие лиганды CD40 описаны, например, в патенте США №6482411, патенте США №6410711, патенте США №6391637 и патенте США №5981724, при этом все патенты и заявка и последовательности CD40L, описанные там, включены в данное описание посредством ссылки во всей своей полноте. Несмотря на то, что лиганды CD40 человека будут предпочтительны для применения при лечении людей, в данном изобретении могут быть использованы лиганды CD40 из любого вида. Для применения на животных другого вида, например, в случае воплощений для ветеринарии, предпочтительным будет лиганд CD40 из вида, соответствующего подлежащему лечению животному. В конкретных воплощениях лигандом CD40 является олигомер белка или пептида gp39, в том числе образующиеся в природе олигомеры пептида, полипептида или белка gp39, а также пептиды, полипептиды, белки (и кодирующие их нуклеиновые кислоты) gp39, которые содержат олигомеризующуюся последовательность. Несмотря на то, что согласно некоторым аспектам изобретения предпочтительными являются такие олигомеры, как димеры, тримеры и тетрамеры, согласно другим аспектам изобретения для применения предусмотрены олигомерные структуры большего размера, при условии, что олигомерная структура сохраняет способность связываться с одним рецептором или несколькими рецепторами CD40 и активировать их.

В некоторых других воплощениях агонистом CD40 является антитело к CD40 или его антигенсвязывающий фрагмент.Антитело может представлять собой человеческое, гуманизированное или частично человеческое химерное антитело к CD40. Примеры конкретных моноклональных антител к CD40 включают моноклональное антитело G28-5, mAb89, ЕА-5 или S2C6 и СР870893. В конкретном воплощении агонистическим антителом к CD40 является СР870893 или дацетузумаб (SGN-40).

СР870893 представляет собой полностью человеческое агонистическое моноклональное антитело (mAb) к CD40, которое было исследовано в клинических условиях в качестве противоопухолевой терапии. Структура и получение СР870893 раскрыты в заявке WO 2003041070 (где антитело определяют по внутреннему идентификационному номеру «21.4.1»). Аминокислотные последовательности тяжелой цепи и легкой цепи СР870893 приведены в SEQ ID NO: 40 и SEQ ID NO: 41, соответственно. В клинических испытаниях СР870893 вводили посредством внутривенной инфузии в дозах, обычно лежащих в диапазонах 0,05-0,25 мг/кг на одну инфузию. В фазе I клинического исследования оцененная максимальная переносимая доза (MTD) СР870893 составляла 0,2 мг/кг, а ограничивающие дозу токсические эффекты включали синдром высвобождения цитокинов (CRS) 3-й степени и крапивницу 3-й степени (Jens Ruter et al.: Immune modulation with weekly dosing of an agonist CD40 antibody in a phase I study of patients with advanced solid tumors. Cancer Biology & Therapy, 10: 10, 983-993; November 15, 2010). По схеме иммунотерапевтического лечения вакциной, предложенной согласно описанию настоящего изобретения, СР870893 можно вводить внутрикожковнутрикожно, подкожно или местно. Предпочтительно, его вводят внутрикожко. Эффективное количество СР870893, подлежащего введению в соответствии с данной схемой, обычно составляет менее 0,2 мг/кг, в типичном случае находится в диапазоне 0,01-0,15 мг/кг или 0,05-0,1 мг/кг.

Дацетузумаб (также известный как SGN-40 или huS2C6; номер в Химической реферативной службе (CAS) 88-486-59-9) представляет собой другое агонистическое антитело к CD40, которое было изучено в клинических испытаниях в отношении вялотекущих лимфом, диффузных крупноклеточных В-клеточных лимфом и множественной миеломы. В клинических испытаниях дацетузумаб вводили внутривенно один раз в неделю в дозах в диапазоне от 2 мг/кг до 16 мг/кг. По схеме иммунотерапевтического лечения вакциной, предложенной согласно описанию настоящего изобретения, дацетузумаб можно вводить внутрикожко, подкожно или местно. Предпочтительно, его вводят внутрикожко. Эффективное количество дацетузумаба, подлежащего введению согласно схеме иммунотерапевтического лечения вакцинами, обычно составляет ниже 16 мг/кг, в типичном случае находится в диапазоне 0,2-14 мг/кг, или 0,5-8 мг/кг, или 1-5 мг/кг.

Ингибиторы CTLA-4

Подходящие антагонистические в отношении CTLA-4 агенты для применения по схеме иммунотерапевтического лечения вакцинами, предложенной согласно описанию настоящего изобретения, включают, без ограничения, антитела к CTLA-4 (такие как человеческие антитела к CTLA-4, мышиные антитела к CTLA-4, антитела млекопитающих к CTLA-4, гуманизированные антитела к CTLA-4, моноклональные антитела к CTLA-4, поликлональные антитела к CTLA-4, химерные антитела к CTLA-4, однодоменные антитела к CTLA-4), фрагменты антител к CTLA-4 (такие как одноцепочечные фрагменты антитела к CTLA-4, фрагменты тяжелой цепи антитела к CTLA-4 и фрагменты легкой цепи антитела к CTLA-4) и ингибиторы CTLA-4, оказывающие агонистическое действие на костимуляторный путь. В некоторых воплощениях ингибитором CTLA-4 является ипилимумаб или тремелимумаб.

Ипилимумаб (также известный как МЕХ-010 или MDX-101), поставляемый на рынок как ЕРВОЙ, представляет собой человеческое антитело к CTLA-4 человека. Ипилимумаб также может быть обозначен по его регистрационному № в CAS 477202-00-9 и описан как антитело 10DI в публикации РСТ № WO 01/14424, включенной в данное описание посредством ссылки во всей своей полноте. Примеры фармацевтической композиции, содержащей ипилимумаб, приведены в публикации РСТ № WO 2007/67959. В США ипилимумаб одобрен к применению для лечения неоперабельной или метастатической меланомы. Рекомендованная доза ипилимумаба в качестве монотерапии составляет 3 мг/кг путем внутривенного введения каждые 3 недели в общей сложности из расчета на 4 дозы. В способах, предложенных согласно настоящему изобретению, ипилимумаб вводят локально, в частности, внутрикожко или подкожно. Эффективное количество ипилимумаба, вводимого локально, обычно находится в диапазоне 5-200 мг/доза на одного субъекта. В некоторых воплощениях эффективное количество ипилимумаба находится в диапазоне 10-150 мг/доза на одного субъекта. В некоторых конкретных воплощениях эффективное количество ипилимумаба составляет примерно 10, 25, 50, 75, 100, 125, 150, 175 или 200 мг/доза на одного субъекта.

Тремелимумаб (также известный как СР-675206) представляет собой полностью человеческое моноклональное антитело IgG2 и имеет номер в CAS 745013-59-6. Тремелимумаб описан как антитело 11.2.1 в патенте США №6682736, включенном в данное описание посредством ссылки во всей своей полноте и для всех назначений. Аминокислотные последовательности тяжелой цепи и легкой цепи тремелимумаба приведены в SEQ ID NO: 42 и 43, соответственно. Тремелимумаб был изучен в клинических испытаниях для лечения различных опухолей, включая меланому и рак молочной железы; при этом тремелимумаб вводили внутривенно либо в виде разовой дозы, либо в виде многократных доз каждые 4 недели или 12 недель в диапазоне доз от 0,01 до 15 мг/кг. По схемам, предложенным согласно настоящему изобретению, тремелимумаб вводят локально, в частности, внутрикожко или подкожно. Эффективное количество тремелимумаба, вводимого внутрикожко или подкожно, обычно находится в диапазоне 5-200 мг/доза на одного субъекта. В некоторых воплощениях эффективное количество тремелимумаба находится в диапазоне 10-150 мг/доза на одного субъекта. В некоторых конкретных воплощениях эффективное количество тремелимумаба составляет примерно 10, 25, 37,5, 40, 50, 75, 100, 125, 150, 175 или 200 мг/доза на одного субъекта.

Агонисты Toll-подобного рецептора (TLR)

Термин «агонист Toll-подобного рецептора» или «агонист TLR» относится к соединению, которое действует в качестве агониста Toll-подобного рецептора (TLR). Сюда включены агонисты TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10 и TLR11 или их комбинация. Если не указано иное, ссылка на соединение-агонист TLR может включать соединение в любой фармацевтически приемлемой форме, включая любой изомер (например, диастереомер или энантиомер), соль, сольват, полиморф и тому подобное. В частности, если соединение является оптически активным, то ссылка на соединение может включать каждый из энантиомеров данного соединения, а также рацемические смеси энантиомеров. Кроме того, такое соединение может быть определено как агонист одного или более конкретных TLR (например, агонист TLR7, агонист TLR8 или агонист TLR7/8).

В некоторых воплощениях агонистами TLR являются агонисты TLR9, в частности, CpG-олигонуклеотиды (или CpG.ODN (олигодезоксинуклеотид)). CpG-олигонуклеотид представляет собой короткую молекулу нуклеиновой кислоты, содержащую цитозин, за которым следует гуанин, соединенный фосфатной связью, при этом пиримидиновое кольцо цитозина является неметилированным. CpG-мотив представляет собой паттерн оснований, которые включают неметилированный центральный CpG, окруженный по меньшей мере одним основанием, фланкирующим центральный CpG (по его 3'-и 5'-концам). CpG-олигонуклеотиды включают как D-, так и K-олигонуклеотиды. CpG-олигонуклеотид может быть неметилированным целиком или может быть неметилированным частично. Примеры CpG-олигонуклеотидов, полезных в способах, предложенных согласно описанию настоящего изобретения, включают таковые, описанные в патентах США №№6194388, 6207646, 6214806, 628371, 6239116 и 6339068.

Примеры конкретных CpG-олигонуклеотидов, полезных в способах, предложенных согласно описанию настоящего изобретения, включают:

;

и

.

Было проведено интенсивное исследование CpG7909, синтетического 24-мерного одноцепочечного олигонуклеотида, в отношении лечения рака в качестве монотерапии и в комбинации с химиотерапевтическими агентами, а также в качестве адъюванта для вакцин против раковых и инфекционных заболеваний. Сообщалось, что разовая внутривенная доза CpG 7909 хорошо переносится без каких-либо клинических эффектов и какой-либо значительной токсичности вплоть до 1,05 мг/кг, в то время как для разовой дозы введенного подкожно CpG 7909 получали значение максимальной переносимой дозы (MTD), равное 0,45 мг/кг, с ограничивающим дозу токсическим эффектом в виде миалгии и системными эффектами (см. Zent, Clive S., et al.: Phase I clinical trial of CpG 7909 (PF-03512676) in patients with previously treated chronic lymphocytic leukemia. Leukemia and Lymphoma, 53(2): 211-217(7), (2012)). По схемам, предложенным согласно описанию настоящего изобретения, CpG7909 можно вводить инъекцией в мышцу или любыми другими подходящими методами. Предпочтительно, его вводят локально вблизи от дренируемого вакциной лимфатического узла, в частности, путем внутрикожкого или подкожного введения. Для применения вместе с вакциной на основе нуклеиновой кислоты, такой как ДНК-вакцина, предпочтительно можно приготовить совместную единую композицию на основе CpG и вакцины и вводить путем внутримышечной инъекцией в сочетании с электропорацией. Эффективное количество CpG7909, доставляемого путем внутримышечного, внутрикожкого или подкожного введения, обычно находится в диапазоне от 10 мкг/доза до 10 мг/доза. В некоторых воплощениях эффективное количество CpG7909 находится в диапазоне 0,05-14 мг/доза. В некоторых конкретных воплощениях эффективное количество CpG7909 составляет примерно 0,05; 0,1; 0,2; 0,3; 0,4; 0,5 или 1 мг/доза. Другие CpG-олигонуклеотиды, включая CpG 24555 и CpG 10103, можно вводить аналогичным образом и с аналогичными уровнями доз.

В некоторых конкретных воплощениях согласно описанию настоящего изобретения предложен способ усиления иммуногенности или терапевтического эффекта вакцины для лечения опухолевого заболевания у человека, включающий введение человеку (1) эффективного количества по меньшей мере одного ингибитора ISC и (2) эффективного количества по меньшей мере одного усилителя IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из сорафениба тозилата, сунитиниба малата, акситиниба, эрлотиниба, гефитиниба, босутиниба, темсиролимуса или нилотиниба, и при этом по меньшей мере один усилитель IEC выбран из ингибитора CTLA-4, агониста TLR или агониста CD40. В некоторых предпочтительных воплощениях схема включает введение человеку (1) эффективного количества по меньшей мере одного ингибитора ISC и (2) эффективного количества по меньшей мере одного усилителя IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из акситиниба, сорафениба тозилата или сунитиниба малата, и при этом по меньшей мере один усилитель IEC представляет собой ингибитор CTLA-4, выбранный из ипилимумаба или тремелимумаба. В некоторых других предпочтительных воплощениях схема включает введение человеку (1) эффективного количества по меньшей мере одного ингибитора ISC и (2) эффективного количества по меньшей мере двух усилителей IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из сунитиниба или акситиниба, и при этом по меньшей мере два усилителя IEC представляют собой тремелимумаб и агонист TLR, выбранный из CpG7909, CpG2455 или CpG10103.

В некоторых других воплощениях согласно описанию настоящего изобретения предложен способ лечения рака предстательной железы у человека, включающий введение человеку (1) эффективного количества вакцины, способной вызывать иммунный ответ на РАА человека, (2) эффективного количества по меньшей мере одного ингибитора ISC и (3) эффективного количества по меньшей мере одного усилителя IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из сорафениба тозилата, сунитиниба малата, акситиниба, эрлотиниба, гефитиниба, босутиниба, темсиролимуса или нилотиниба, и при этом по меньшей мере один усилитель IEC выбран из ингибитора CTLA-4, агониста TLR или агониста CD40. В некоторых предпочтительных воплощениях способ включает введение человеку (1) эффективного количества вакцины, способной вызывать иммунный ответ на РАА человека, (2) эффективного количества по меньшей мере одного ингибитора ISC и (3) эффективного количества по меньшей мере одного усилителя IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из сорафениба тозилата, сунитиниба малата или акситиниба, и при этом по меньшей мере один усилитель IEC представляет собой ингибитор CTLA-4, выбранный из ипилимумаба или тремелимумаба.

В некоторых других конкретных воплощениях способ включает введение человеку (1) эффективного количества по меньшей мере одного ингибитора ISC и (2) эффективного количества по меньшей мере двух усилителей IEC, при этом по меньшей мере один ингибитор ISC представляет собой ингибитор протеинкиназ, выбранный из сунитиниба или акситиниба, и при этом по меньшей мере два усилителя IEC представляют собой тремелимумаб и агонист TLR, выбранный из CpG7909, CpG2455 или CpG10103.

Дополнительные терапевтические агенты

Схема иммунотерапевтического лечения вакцинами, предложенная согласно описанию настоящего изобретения, может дополнительно включать дополнительный терапевтический агент. Можно использовать широкий ряд противораковых терапевтических агентов, включая химиотерапевтические агенты и гормонотерапевтические агенты. Термин «химиотерапевтический агент» относится к химическому или биологическому веществу, которое может вызывать гибель раковых клеток или воздействовать на рост, деление, репарацию и/или функцию раковых клеток. Примеры конкретных химиотерапевтических агентов включают: абиратерона ацетат, кабазитаксел, дегареликс, деносумаб, доцетаксел, энзалутамид, лейпролида ацетат, преднизон, сипулейцел-T и дихлорид радия-223. Термин «гормонотерапевтический агент» относится к химическому или биологическому веществу, которое ингибирует или устраняет продуцирование гормона или ингибирует либо нейтрализует влияние гормона на рост и/или выживаемость раковых клеток. Примеры конкретных гормонотерапевтических агентов включают лейпролид, гозерелин, трипторелин, гистрелин, бикалутамид, флутамид и нилутамид. VBIR, предложенную согласно данному описанию, также можно использовать в комбинации с другими терапиями, включая (1) хирургические методы для удаления всех или части органов или желез, которые участвуют в продуцировании гормона, таких как яичники, яички, надпочечник и питуитарная железа, и (2) лучевую терапию, при которой органы или железы пациента подвергают облучению в дозе, достаточной для ингибирования или устранения продуцирования целевого гормона.

Д. ПРИМЕРЫ

Следующие далее примеры приведены для иллюстрации некоторых воплощений изобретения. Их не следует истолковывать как каким-либо образом ограничивающие объем данного изобретения. Из приведенного выше обсуждения и этих примеров специалист в данной области техники может выявить существенные признаки изобретения и без отклонения от его сущности и объема может выполнить различные изменения и модификации изобретения для адаптации его к различным применениям и условиям.

ПРИМЕР 1. АНТИГЕНЫ В ЦИТОЗОЛЬНОМ, СЕКРЕТИРУЕМОМ И МЕМБРАНОСВЯЗАННОМ ФОРМАТАХ, ПРОИСХОДЯЩИЕ ИЗ БЕЛКА PSMA ЧЕЛОВЕКА

1А. Конструирование иммуногенных полипептидов PSMA

Конструкции ДНК, кодирующие иммуногенные полипептиды PSMA в цитозольном, секретируемом и модифицированом форматах, создавали на основе последовательности нативного белка PSMA человека и тестировали в отношении их способности индуцировать обусловленные эффекторными клетками противоопухолевые иммунные ответы. Ниже представлены структура и способ получения каждого из форматов антигена PSMA человека.

1А1. Цитозольный антиген PSMA человека. Конструировали иммуногенный полипептид PSMA в цитозольной форме, чтобы после экспрессии он оставался внутри клетки. Цитоплазматический домен (аминокислоты 1-19) и трансмембранный домен (аминокислоты 20-43) PSMA человека удаляли, получая цитозольный полипептид PSMA, который состоит из аминокислот 44-750 (внеклеточный домен или ECD) PSMA человека с SEQ ID NO: 1. К N-концу данного полипептида можно добавить оптимальную последовательность Козака «MAS» для усиления экспрессии или облегчения клонирования.

1А2. Секретируемый антиген PSMA человека. Конструировали иммуногенный полипептид PSMA в секретируемой форме для осуществления секреции полипептида из клетки при его экспрессии. Этот секретируемый полипептид составлен из аминокислот 44-750 (ECD) PSMA человека с SEQ ID NO: 1, секреторного элемента Ig-каппа, имеющего аминокислотную последовательность ETDTLLLWVLLLWVPGSTGD, и линкера, состоящего из двух аминокислот (АА), на N-конце для максимизации секреции антигена PSMA после его экспрессии.

1А3. Мембраносвязанный антиген PSMA человека. Конструировали иммуногенный мембраносвязанный полипептид PSMA для стабилизирования данного полипептида на клеточной поверхности. Первые 14 аминокислот белка PSMA человека удаляли и получали иммуногенный полипептид, который состоит из аминокислот 15-750 белка PSMA человека с SEQ ID NO: 1. Этот иммуногенный полипептид, состоящий из аминокислот 15-750 нативного белка PSMA человека с SEQ ID NO: 1 и имеющий последовательность, идентичную на 100% последовательности нативного белка PSMA человека, также обозначен как «модифицированный антиген PSMA человека», «модифицированный антиген hPSMA» или «антиген hPSMAmod» в описании настоящего изобретения. Также создавали приведенные далее три иммуногенных полипептида PSMA (называемые «перетасованными модифицированными антигенами PSMA»), которые представляют собой варианты модифицированного антигена PSMA человека (SEQ ID NO: 9):

(1) перетасованный модифицированный антиген 1 PSMA, имеющий аминокислотную последовательность с SEQ ID NO: 3;

(2) перетасованный модифицированный антиген 2 PSMA, имеющий аминокислотную последовательность с SEQ ID NO: 5; и

(3) перетасованный модифицированный антиген 3 PSMA, имеющий аминокислотную последовательность с SEQ ID NO: 7.

Нуклеотидные последовательности, кодирующие перетасованные модифицированные антигены 1, 2 и 3 PSMA, приведены в SEQ ID NO: 4, 6 и 8, соответственно.

1Б. Получение ДНК-плазмид для экспрессии антигенов PSMA

Конструкции ДНК, кодирующие цитозольный, секретируемый и модифицированный антигены PSMA, клонировали по отдельности в вектор PJV7563, подходящий для тестирования in vivo на животных (Фиг. 1). Обе цепи ДНК в векторах PJV7563 секвенировали для подтверждения целостности конструкции.

Крупномасштабный препарат плазмидной ДНК (Qiagen/CsCI) получали из клона с подтвержденной последовательностью. Качество плазмидной ДНК подтверждали высоким значением соотношения 260/280, высоким значением соотношения сверхскрученной/содержащей разрыв ДНК, низкими уровнями эндотоксина (меньше 10 ед./мг ДНК) и отрицательным результатом в отношении бионагрузки.

1В. Экспрессия конструкций PSMA в клетках млекопитающих

Экспрессию цитозольного, секретируемого и модифицированного антигенов PSMA оценивали методом сортировки флуоресцентно-активированных клеток (FACS). Клетки 293 млекопитающих трансфицировали вводимыми путем PMED векторами PJV7563, кодирующими различные иммуногенные полипептиды PSMA. Спустя трое суток клетки 293 окрашивали, используя мышиное антитело к PSMA, с последующей обработкой антимышиным вторичным антителом крысы, конъюгированным с флуоресцентным флуоресцеинизотиоцианатом (FITC). Результаты представлены в Таблице 2. Данные, представленные в виде среднего значения интенсивности флуоресценции (MFI) по отношению к отрицательным контролям, подтвердили, что модифицированный антиген PSMA человека экспрессируется на клеточной поверхности.

ПРИМЕР 2. КОНСТРУИРОВАНИЕ РАЗЛИЧНЫХ ИММУНОГЕННЫХ ПОЛИПЕПТИДОВ PSA

3А. Конструирование иммуногенных полипептидов PSA

Аналогично тому, как было описано в примере 1 для трех разных форм иммуногенного полипептида PSMA (например, цитозольной, мембраносвязанной и секретируемой форм), также создавали конструкции иммуногенных полипептидов PSA в трех формах на основе последовательности PSA человека. Иммуногенный полипептид PSA в цитозольной форме, который состоит из аминокислот 25-261 нативного PSA человека, сконструирован путем делеции сигнала секреции и продомена (аминокислот 1-24). Аминокислотная последовательность этого цитозольного иммуногенного полипептида PSA представлена в SEQ ID NO: 17. Секретируемая форма полипептида PSA представляет собой нативный полноразмерный PSA человека (аминокислоты 1-261). Иммуногенный полипептид PSA в мембраносвязанной форме сконструирован путем присоединения цитозольной формы иммуногенного полипептида PSA (аминокислот 25-261 нативного PSA человека) к трансмембранному домену PSMA человека (аминокислотам 15-54 PSMA человека).

3Б. Иммунные ответы у мышей Pasteur и HLA А24

План исследования. Мышей HLA А2 Pasteur или мышей HLA А24 в возрасте от восьми до 10 недель иммунизировали ДНК, экспрессирующей различные антигены PSA, приведенные в примере 3А, с использованием PMED по схеме первичной/вторичной иммунизации с двухнедельными интервалами между каждыми вакцинациями, как описано в примере 1. Антигенспецифические T- и B-клеточные ответы измеряли через 7 суток по окончании последней иммунизации в анализе интерферон-гамма (IFNγ)-ELISPOT и сэндвич-ELISA (иммуноферментный твердофазный анализ).

Данные ELISpot (метод иммуноферментных пятен), показанные в Таблице 3, указывают на то, что иммуногенные полипептиды PSA, как в цитозольной, так и мембраносвязанной формах, способны индуцировать T-клетки, которые распознают опухолевые клетки человека, трансдуцированные аденовирусом с целью экспрессии цитозольного антигена PSA (SKmel5-Ad-PSA), но не клетки, трансдуцированные аденовирусом с целью экспрессии eGFP (улучшенный зеленый флуоресцентный белок) (SKmel5-Ad-eGFP). Эти два антигена также вызывали ответ на белок PSA. У секретируемого антигена PSA отсутствовала способность индуцировать T-клетки как к белку SKmel5-Ad-PSA, так и к PSA. Количество клеток, образующих «ореол», (SFC) больше 50 считается положительным ответом.

Приведенные в Таблице 4 данные демонстрируют, что иммуногенные полипептиды PSA как в секретируемой, так и в мембраносвязанной формах способны индуцировать антительные ответы на PSA.

ПРИМЕР 3. СОЗДАНИЕ КОНСТРУКЦИЙ МУЛЬТИАНТИГЕННЫХ ВАКЦИН

В этом примере описаны конструкции плазмид, содержащих мультиантигенную конструкцию, созданные с использованием разных стратегией. Эти плазмиды содержат один и тот же общий плазмидный остов, что и pPJV7563. Если не указано иное, гены, включенные в мультиантигенные конструкции, кодируют (1) иммуногенный полипептид PSMA с SEQ ID NO: 9, (2) иммуногенный полипептид PSCA, содержащий аминокислоты 2-125 из SEQ ID NO: 21, и (3) иммуногенный полипептид PSA с SEQ ID NO: 17.

ПРИМЕР ЗА. ПЛАЗМИДЫ, СОДЕРЖАЩИЕ ДВОЙНУЮ АНТИГЕННУЮ КОНСТРУКЦИЮ

3А1. Конструирование плазмиды с использованием нескольких промоторов

Плазмида 460 (двойной промотор PSMA/PSCA). Плазмиду 460 конструировали с использованием методов сайт-специфического мутагенеза, полимеразной цепной реакции (ПЦР) и встраивания рестрикционного фрагмента. Сначала в плазмиду 5259 вводили сайт рестрикции для KpnI выше относительно промотора CMV методом сайт-специфического мутагенеза с использованием праймеров MD5 и MD6 в соответствии с протоколом производителя (набор Quickchange, Agilent Technologies, Santa Clara, CA). Затем проводили ПЦР-амплификацию экспрессионной кассеты, состоящей из минимального промотора CMV, PSMA человека и терминатора транскрипции β-глобулина кролика, с плазмиды 5166, применяя праймеры, несущие сайты рестрикции для KpnI (MD7 и MD8). ПЦР-ампликон рестрицировали с использованием KpnI и встраивали в только что введенный сайт для KpnI плазмиды 5259, обработанной щелочной фосфатазой кишечника теленка (CIP).

3А2. Конструирование двойных антигенных конструкций с использованием 2А-пептидов

Плазмида 451 (PSMA-T2A-PSCA). Плазмиду 451 конструировали с использованием методов ПЦР с перекрывающимися праймерами и замены рестрикционного фрагмента. Сначала проводили ПЦР-амплификацию гена, кодирующего аминокислоты 15-750 PSMA человека, применяя в качестве матрицы плазмиду 5166, с использованием праймеров 119 и 117. ПЦР-амплификацию гена, кодирующего полноразмерный PSCA человека, проводили, применяя в качестве матрицы плазмиду 5259, с использованием праймеров 118 и 120. В результате ПЦР достигали добавления перекрывающихся последовательностей 2А-пептидов TAV (Т2А) на 3'-конце PSMA и 5'-конце PSCA. Эти ампликоны смешивали вместе и проводили ПЦР-амплификацию, используя праймеры 119 и 120. Ампликон PSMA-T2A-PSCA рестрицировали, используя NheI и BgIII, и встраивали в аналогичным образом рестрицированную плазмиду 5166. Чтобы повысить эффективность расщепления, между PSMA и Т2А-кассетой вводили глицин-сериновый линкер.

Плазмида 454 (PSCA-F2A-PSMA). Плазмиду 454 создавали с использованием методов ПЦР и замены рестрикционного фрагмента. Сначала проводили ПЦР-амплификацию гена, кодирующего полноразмерный PSCA человека, применяя в качестве матрицы плазмиду 5259, с использованием праймеров 42 и 132. Этот ампликон рестрицировали, используя BamHI, и встраивали в аналогичным образом рестрицированную плазмиду 5300, обработанную CIP. Чтобы повысить эффективность расщепления, между PSMA и кассетой FMDV 2А (F2A) вводили глицин-сериновый линкер.

Плазмида 5300 (PSA-F2A-PSMA). Плазмиду 5300 конструировали с использованием методов ПЦР с перекрывающимися праймерами и замены рестрикционного фрагмента. Сначала проводили ПЦР-амплификацию гена, кодирующего аминокислоты 25-261 PSA, с плазмиды 5297, используя праймеры MD1 и MD2. ПЦР-амплификацию гена, кодирующего аминокислоты 15-750 PSMA человека, проводили с плазмиды 5166, используя праймеры MD3 и MD4. В результате ПЦР достигали добавления перекрывающихся последовательностей Р2А-пептидов на 3'-конце PSA и 5'-конце PSMA. Эти ампликоны смешивали вместе и выполняли удлинение с использованием ПЦР. Ампликон PSA-F2A-PSMA рестрицировали, используя NheI и BgIII, и встраивали в аналогичным образом рестрицированную плазмиду pPJV7563.

3А3. Двойные антигенные конструкции, в которых использованы участки внутренней посадки рибосомы

Плазмида 449 (PSMA-mIRES-PSCA). Плазмиду 449 конструировали с использованием методов ПЦР с перекрывающимися праймерами и замены рестрикционного фрагмента. Сначала проводили ПЦР-амплификацию гена, кодирующего полноразмерный PSCA человека, с плазмиды 5259, используя праймеры 124 и 123. ПЦР-амплификацию минимального IRES из EMCV проводили с pShuttle-IRES, используя праймеры 101 и 125. Перекрывающиеся ампликоны смешивали вместе и проводили ПЦР-амплификацию с использованием праймеров 101 и 123. Ампликон IRES-PSCA рестрицировали, используя BgIII и BamHI, и встраивали в рестрицированную BgIII, обработанную CIP плазмиду 5166. Чтобы фиксировать спонтанную мутацию в пределах IRES, этот IRES, содержащий последовательность от сайта AvrII до сайта KpnI, заменяли на эквивалентный фрагмент из pShuttle-IRES.

Плазмида 603 (PSCA-pIRES-PSMA). Плазмиду 603 конструировали с использованием методов ПЦР и бесшовного клонирования. Ген, кодирующий полноразмерный PSCA человека, присоединенный на своем 3'-конце к предпочтительному IRES EMCV, амплифицировали с плазмиды 455, используя ПЦР с праймерами SD546 и SD547. Амплификацию гена, кодирующего аминокислоты 15-750 PSMA человека, проводили с помощью ПЦР с плазмиды 5166, используя праймеры SD548 и SD550. Эти два перекрывающихся ПЦР-ампликона встраивали в плазмиду pPJV7563, рестрицированную NheI и BgIII, используя метод бесшовного клонирования в соответствии с инструкциями производителя (Invitrogen, Carlsbad, СА).

Плазмида 455 (PSCA-mIRES-PSA). Плазмиду 455 конструировали с использованием методов ПЦР с перекрывающимися праймерами и замены рестрикционного фрагмента. Сначала проводили ПЦР-амплификацию гена, кодирующего аминокислоты 25-261 PSA человека, с плазмиды 5297, используя праймеры 115 и 114. ПЦР-амплификацию минимального IRES EMCV проводили с pShuttle-IRES, используя праймеры 101 и 116. Перекрывающиеся ампликоны смешивали вместе и проводили ПЦР-амплификацию с использованием праймеров 101 и 114. Ампликон IRES-PSA рестрицировали, используя BgIII и BamHI, и встраивали в рестрицированную BgIII, обработанную CIP плазмиду 5259. Чтобы фиксировать спонтанную мутацию в этом клоне, последовательность от сайта BgIII до сайта BstEII заменяли на эквивалентный фрагмент, полученный в результате проведения еще одной ПЦР с использованием перекрывающихся праймеров.

ПРИМЕР 3Б. ПЛАЗМИДЫ, СОДЕРЖАЩИЕ ТРОЙНУЮ АНТИГЕННУЮ КОНСТРУКЦИЮ

Общая стратегия. Для введения в различных комбинациях в тройные антигенные плазмидные векторы отбирали ряд двойных антигенных плазмид, включая PSA-F2A-PSMA, PSMA-mIRES-PSCA, PSMA-T2A-PSCA, PSA-T2A-PSCA, PSCA-F2A-PSMA, PSCA-pIRES-PSMA и PSMA-mIRES-PSA. Во всех случаях основу для плазмидных векторов составлял остов родительской плазмиды pPJV7563. Для управления экспрессией всех трех антигенов, в четырех плазмидных векторах (плазмидах 456, 457, 458 и 459) использовали один полный промотор CMV с терминатором транскрипции гена β-глобулина кролика. Применение двух других плазмидных векторов (плазмид 846 и 850) для управления экспрессией этих трех антигенов основывалось на стратегии двойного промотора в комбинации либо с IRES, либо 2А-пептидами. Плазмиды с множественными 2А-кассетами конструировали такими, чтобы они несли разные кассеты для сведения к минимуму вероятности рекомбинации между первой и второй кассетами в процессе амплификации плазмиды/вектора. Экспрессию антигенов демонстрировали с использованием проточной цитометрии (Фиг. 7А и 7Б) и вестерн-блоттинга (Фиг. 8А и 8Б).

Плазмида 456 (PSA-F2A-PSMA-mIRES-PSCA). Плазмиду 456 конструировали с использованием метода замены рестрикционного фрагмента. Плазмиду 5300 рестрицировали, используя Nhe I и Нра I, и инсерционный сегмент размером приблизительно 1,8 тысяч пар оснований (т.п.о.) лигировали в аналогичным образом рестрицированную плазмиду 449.

Плазмида 457 (PSA-F2A-PSMA-T2A-PSCA). Плазмиду 457 конструировали с использованием метода замены рестрикционного фрагмента. Плазмиду 5300 рестрицировали, используя Nhe I и Нра I, и инсерционный сегмент размером приблизительно 1,8 т.п.о. лигировали в аналогичным образом рестрицированнуюплазмиду 451.

Плазмида 458 (PSA-T2A-PSCA-F2A-PSMA). Плазмиду 458 конструировали с использованием методов ПЦР и замены рестрикционного фрагмента. Проводили ПЦР-амплификацию гена, кодирующего аминокислоты 25-261 PSA человека, с плазмиды 5297, используя праймеры 119 и 139, что приводило в результате к добавлению последовательности Т2А и сайта рестрикции для Nhe I на 3'-конце. Этот ампликон рестрицировали, используя Nhe I, и встраивали в аналогичным образом рестрицированную плазмиду 454.

Плазмида 459 (PSCA-F2A-PSMA-mIRES-PSA). Плазмиду 459 конструировали с использованием метода замены рестрикционного фрагмента. Плазмиду 454 рестрицировали, используя Nhe I и BgI II, и инсерционный сегмент, содержащий PSCA-F2A-PSMA, лигировали в аналогичным образом рестрицированную плазмиду 455.

Плазмида 846 (CBA-PSA, CMV-PSCA-pIRES-PSMA). Плазмиду 846 конструировали с использованием методов ПЦР и бесшовного клонирования. Сначала синтезировали экспрессионную кассету, которая состояла из 1) промотора и 5'-нетранслируемого участка гена бета-актина цыпленка (CBA), 2) гибрида гена бета-актина цыпленка/интрона гена бета-глобина кролика, 3) гена, кодирующего аминокислоты 25-261 PSA человека, и 4) терминатора гена бычьего гормона роста (BGH). Эту экспрессионную кассету для PSA амплифицировали с помощью ПЦР с плазмиды 796, используя праймеры 3SaIICBA и 5SaIIBGH. Этот ампликон клонировали с использованием сайта SaII плазмиды 603, применяя набор для сборки и бесшовного клонирования (Seamless Cloning and Assembly Kit) GeneArt (Invitrogen, Carlsbad, CA). После доставки этой плазмиды в клетку экспрессия PSA будет управляться промотором СВА, тогда как экспрессия PSCA и PSMA будет управляться промотором CMV.

Плазмида 850 (CBA-PSA, CMV-PSCA-F2A-PSMA). Плазмиду 850 конструировали с использованием методов ПЦР и бесшовного клонирования. Сначала управляемую промотором СВА экспрессионную кассету для PSA амплифицировали с помощью ПЦР с плазмиды 796, используя праймеры 3SaIICBA и 5SaIIBGH. Этот ампликон клонировали с использованием сайта SaII плазмиды 454, применяя набор для бесшовного клонирования GeneArt. После доставки этой плазмиды в клетку экспрессия PSA будет управляться промотором СВА, тогда как экспрессия PSCA и PSMA будет управляться промотором CMV.

Плазмида 916 (PSA-T2A-PSCA-F2A-PSMA). Плазмиду 916 конструировали с использованием методов ПЦР и клонирования по Гибсону. Гены, кодирующие три полипептида РАА, амплифицировали с помощью ПЦР и лигировали с использованием сайтов Nhe I/BgI II в плазмиду pPJV7563 методами клонирования по Гибсону. Полная нуклеотидная последовательность плазмиды 916 приведена в SEQ ID NO: 62. Плазмида 458 и плазмида 916 кодируют одну и ту же аминокислотную последовательность, содержащую эти три иммуногенных полипептида РАА, аминокислотная последовательность которых приведена в SEQ ID NO: 60. Нуклеотидная последовательность плазмиды 916, которая кодирует аминокислотную последовательность, содержащую эти три полипептида РАА, является кодон-оптимизированной и также приведена в SEQ ID NO: 61.

ПРИМЕР 3В. ТРОЙНЫЕ АНТИГЕННЫЕ АДЕНОВИРУСНЫЕ ВЕКТОРЫ

Общая стратегия. Как и в случае с ДНК-плазмидами, для доставки нескольких антигенов рака предстательной железы можно сконструировать вирусные векторы. Чтобы создать тройные антигенные аденовирусные векторы, использовали в различных сочетаниях три стратегии мультиантигенной экспрессии, описанные выше для мультиантигенных конструкций: двойные промоторы, 2А-пептиды и участки внутренней посадки рибосомы. Кратко, мультиантигенные экспрессионные кассеты клонировали с использованием плазмиды pShuttle-CMV, модифицированной так, чтобы нести две копии последовательности тетрациклинового оператора (TetO2). Используя векторную систему AdEasy в соответствии с протоколами производителя (Agilent Technologies, Inc., Santa Clara, CA), создавали рекомбинантные векторы на основе аденовируса серотипа 5. Размножение вирусов осуществляли в клетках почки человеческого эмбриона 293 (HEK293) и очищение проводили путем двукратного центрифугирования в градиенте плотности хлорида цезия в соответствии со стандартными протоколами. Перед началом исследований in vivo, исходные суспензии вирусов подробно охарактеризовывали в отношении концентрации вирусных частиц, титра инфекционности, стерильности, эндотоксина, целостности генома и целостности трансгена, идентичности и экспрессии трансгена.

Аденовирус-733 (PSA-F2A-PSMA-T2A-PSCA). Ad-733 представляет собой вирусный эквивалент плазмиды 457. Экспрессия этих трех антигенов управляется единственным промотором CMV с тетрациклиновым оператором для подавления экспрессии трансгенов в процессе крупномасштабного получения в линии клеток HEK293, экспрессирующих Tet-репрессор. Стратегии мультиантигенной экспресии включают применение двух разных 2А-последовательностей.

Аденовирус-734 (PSA-T2A-PSCA-F2A-PSMA). Ad-734 представляет собой вирусный эквивалент плазмиды 458. Экспрессия этих трех антигенов управляется единственным промотором CMV с тетрациклиновым оператором для подавления экспрессии трансгенов в процессе крупномасштабного получения в линии клеток HEK293, экспрессирующих Tet-репрессор. Стратегии мультиантигенной экспресии включают применение двух разных 2А-последовательностей.

Аденовирус-735 (PSCA-F2A-PSMA-mIRES-PSA). Ad-735 представляет собой вирусный эквивалент плазмиды 459. Экспрессия этих трех антигенов управляется единственным промотором CMV с тетрациклиновым оператором для подавления экспрессии трансгенов в процессе крупномасштабного получения в линии клеток HEK293, экспрессирующих Tet-репрессор. Стратегии мультиантигенной экспресии включают применение 2А-последовательности и IRES.

Аденовирус-796 (CBA-PSA, CMV-PSCA-pIRES-PSMA). Ad-796 представляет собой вирусный эквивалент плазмиды 846. Экспрессия PSA управляется промотором гена бета-актина цыпленка, в то время как экспрессия PSCA и PSMA управляется промотором CMV-TetO2. Стратегии мультиантигенной экспресии включают применение двух промоторов и IRES.

Аденовирус-809 (CBA-PSA, CMV-PSCA-F2A-PSMA). Ad-809 представляет собой вирусный эквивалент плазмиды 850. Экспрессия PSA управляется промотором гена бета-актина цыпленка, в то время как экспрессия PSCA и PSMA управляется промотором CMV-TetO2. Стратегии мультиантигенной экспресии включают применение двух промоторов и 2А-последовательности.

ПРИМЕР 4. ПРОТИВОРАКОВАЯ ЭФФЕКТИВНОСТЬ ВАКЦИНЫ В КОМБИНАЦИИ С СУНИТИНИБОМ И АНТИТЕЛОМ К CTLA-4

Противоопухолевую эффективность вакцины против рака в комбинации с сунитинибом и моноклональным антителом к CTLA-4 (клон 9D9) исследовали на несущих подкожные опухоли TUBO мышах BALB/neuT.

Методика исследования. Кратко, десяти мышам в каждой группе один раз в сутки перорально вводили либо разбавитель, либо малат сунитиниба в дозе 20 мг/кг, начиная с 10-х суток после имплантации опухоли, вплоть до 64-х суток. Вакцинацию конструкциями ДНК, которые либо не кодируют никакого антигена (контрольная вакцина), либо кодируют антиген Her-2 крысы с SEQ ID NO: 54 (вакцина против рака), в виде аденовирусных векторов начинали на 13-е сутки, затем последовательно проводили две иммунизации по одному разу в неделю, две иммунизации по два раза в неделю и семь иммунизации по одному разу в неделю соответствующими антигенами (антигенами HBV (hepatitis В virus; вирус гепатита В) или rHer-2) с использованием ДНК. Группам мышей (закрашенный кружок и незакрашенный треугольник), которых обрабатывали моноклональным антителом к CTLA-4 мыши, вводили внутрибрюшинной инъекцией 250 мкг антитела на 20-е, 27-е, 41-е, 55-е, 62-е, 69-е, 76-е, 83-и, 90-е и 97-е сутки сразу после PMED-инъекций.

Результаты. На Фиг. 4 показана кривая выживаемости Каплана-Мейера для групп мышей из репрезентативного исследования, по которой оценивают противоопухолевую эффективность сунитиниба и моноклонального антитела к CTLA-4 мыши (клон 9D9) в комбинации с вакциной против рака. Увеличение времени выживания наблюдали для мышей, обработанных сутентом вместе с контрольной вакциной (незакрашенный кружок), моноклональным антителом к CTLA-4 мыши (незакрашенный треугольник) или вакциной против рака (закрашенный треугольник). Дальнейшее увеличение выживаемости наблюдали для мышей, обработанных сутентом и вакциной против рака в комбинации с антителом к CTLA-4 мыши (закрашенный кружок). Значения Р рассчитывали, используя логарифмический ранговый критерий.

ПРИМЕР 5. ВЛИЯНИЕ CPG ИЛИ АГОНИСТА CD40 НА ИММУННЫЕ ОТВЕТЫ, ИНДУЦИРОВАННЫЕ ВАКЦИНОЙ ПРОТИВ РАКА

Исследования иммуногенности на мышах BALB/c

Влияние локального введения иммуномодуляторов на величину и качество антигенспецифических иммунных ответов, индуцированных раковым заболеванием, исследовали на мышах BALB/c, иммунный ответ у которых оценивали, измеряя rHER2-специфические T-клеточные ответы с использованием анализа IFNγ-ELISPOT или анализа методом внутриклеточного окрашивания цитокинов. Кратко, от 4 до 6 самок мышей BALB/c на группу (указанных выше) иммунизировали экспрессирующими конструкциями на основе ДНК-плазмид, кодирующими последовательности антигена rHER2 (SEQ ID NO: 54), используя систему доставки PMED. Иммуномодуляторы CpG7909 (PF-03512676) и моноклональное агонистическое антитело к CD40 вводили локально путем внутрикожкой инъекции вблизи от дренируемого вакциной пахового лимфатического узла соответственно после осуществления PMED. Антигенспецифические T-клеточные ответы измеряли с использованием IFNγ-ELISPOT или анализа методом внутриклеточного окрашивания цитокинов в соответствии с методикой, описанной ниже.

Анализ внутриклеточного окрашивания цитокинов (ICS)

rHer2-специфические полифункциональные (мультицитокин-позитивные) T-клеточные иммунные ответы измеряли для спленоцитов или РВМС (мононуклеарные клетки периферической крови), выделенных из отдельных животных в ICS-анализе. Обычно 1×106 спленоцитов инкубировали с брефелдином А в концентрации 1 мкг/мл и стимулирующим пептидом (p66 для rHer2-специфичных CD8, р169 для rHer2-специфичных CD4 или р87 для нерелевантного HBV) в концентрации 10 мкг/мл в течение 5 ч при 37°C в инкубаторе с 5% CO2. После стимуляции спленоциты промывали и блокировали, используя блокатор Fc (антитело к CD16/CD32 мыши) в течение 10 мин при 4°C, после чего в течение 20 мин проводили окрашивание красителем live/dead aqua, конъюгированными сРЕ-Cy7 (фикоэритрин-цианин 7) антителами к CD3e мыши, конъюгированными с красителем Pacific blue антителами к CD8a мыши и конъюгированными с PerCP-Cy5.5 (перидининхлорофилл-А-белок-цианин 5.5) антителами к CD45R/B220 мыши. Клетки промывали, фиксировали 4%-м параформальдегидом в течение ночи при 4°C, подвергали пермеабилизации, используя раствор для фиксации/пермеабилизации (fix/perm) от BD, в течение 30 мин при комнатной температуре (КТ) и инкубировали с конъюгированными с АРС (аллофикоцианин) антителами к IFNγ мыши, конъюгированными с Alexa488 антителами к TNFα мыши и конъюгированными с РЕ антителами к интерлейкину-2 (IL-2) мыши в течение 30 мин при КТ. Клетки промывали и 20000 CD4- или CD8-T-клеток отбирали на анализ посредством проточной цитометрии. Общее число антигенспецифических T-клеток, позитивных в отношение одного, двух или трех типов цитокинов, из расчета на всю массу селезенки каждого животного определяют, вычитая rHer2-специфические ответы на нерелевантный пептид HBV из числа вакциноспецифических ответов и нормируя на общее число спленоцитов, выделенных из селезенки.

Результаты анализа IFNγ-ELISPOT

На Фиг. 5 показаны результаты IFNγ-ELISPOT для групп мышей из репрезентативного исследования, в котором оценивается величина антигенспецифических T-клеточных ответов, индуцированных rHER2-вакциной, вводимой совместно с указанными иммуномодуляторами. Кратко, каждую мышь в обрабатываемой группе (n=4) иммунизировали, используя PMED, экспрессирующими конструкциями на основе ДНК-плазмид, кодирующими последовательности антигена rHER2 (SEQ ID NO: 54), после чего незамедлительно вводили, как указано, либо 100 мкг контрольного моноклонального антитела IgG крысы (Bioxcell, № ВЕ0089: контрольного mAb), либо 50 мкг CpG7909, либо 100 мкг моноклонального антитела к CD40 (Bioxcell, № ВЕ0016-2: a-CD40 mAb). Антиген-специфические иммунные ответы измеряли в анализе IFNγ-ELISPOT для 5×105 спленоцитов, смешанных с контролем или rHer2-специфическими пептидами p66 в концентрации 10 мкг/мл, через 7 суток после инициации PMED. Количество всех секретирующих IFNγ клеток из числа спленоцитов, содержащих 1×105 CD8 T-клеток, рассчитывали на основании результатов ELISPOT для отдельных животных, и на диаграмме указан % числа CD8 T-клеток в спленоцитах и среднее значение, и стандартная ошибка среднего для каждой группы. Показано, что и CpG7909, и моноклональное антитело к CD40 значительно повышали величину антигенспецифических иммунных ответов, индуцированных ДНК rHer-2, по сравнению с мышами, которые получали контрольные антитела.

Результаты анализа внутриклеточного окрашивания цитокинов (ICS). На Фиг. 6 и 7 показаны результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность CpG 7909 с точки зрения качества индуцированных вакциной иммунных ответов, с использованием анализа методом внутриклеточного окрашивания цитокинов. Кратко, каждое животное дважды иммунизировали экспрессирующими конструкциями на основе ДНК-плазмид, кодирующими последовательности антигена rHER2 (SEQ ID NO: 54), доставляемыми путем PMED с интервалом в 4 недели. Мыши в каждой группе (n=5) получали внутрикожные инъекции физиологического раствора забуференного фосфатом (PBS) (группа PMED) или 50 мкг CpG7909 (группа PMED + CpG) близко к правой стороне дренируемого вакциной пахового лимфатического узла сразу же после обеих ДНК-иммунизаций путем PMED. Через семь суток после последней иммунизации путем PMED, проводили анализ ICS на спленоцитах, выделенных из каждой отдельной мыши, с целью обнаружения антигенспецифических полифункциональных CD8 или CD4 T-клеток, которые секретируют IFNγ, TNFα и/или IL-2. Значительное увеличение rHer2-специфических мультицитокин-позитивных CD8 и CD4 T-клеточных ответов обнаруживали у мышей, обработанных путем локальной доставки CpG7909 в сравнении с PBS. Увеличение CD8-популяции, позитивной в отношении цитокинов одного типа, обнаруживали у животных, которым путем локальной доставки вводили CpG7909 в сравнении с PBS.

На Фиг. 8 и 9 показаны результаты репрезентативного исследования, в котором оценивается иммуномодулирующая активность агонистического моноклонального антитела к CD40 с точки зрения качества индуцированных вакциной иммунных ответов, с использованием анализа методом внутриклеточного окрашивания цитокинов. Кратко, каждое животное дважды иммунизировали экспрессирующими конструкциями на основе ДНК-плазмид, кодирующими последовательности антигена rHER2 (SEQ ID NO: 54), доставляемыми путем PMED с интервалом в 4 недели. Мыши в каждой группе (n=6) получали путем внутрикожных инъекций 100 мкг контрольного изотипа IgG (PMED с IgG) или моноклонального антитела к CD40 (PMED с aCD40) близко к правой стороне дренируемого вакциной пахового лимфатического узла через одни сутки после первой иммунизации с введением путем PMED. Через семь суток после последней иммунизации путем PMED, проводили анализ ICS на спленоцитах, выделенных из каждой отдельной мыши, с целью обнаружения rHer2-специфических полифункциональных CD8 или CD4 T-клеток, которые секретируют IFNγ, TNFα и/или IL-2. Значительное увеличение rHer2-специфических CD8 и CD4 T-клеточных ответов, позитивных в отношении цитокинов трех типов, обнаруживали у мышей, обработанных путем локальной доставки моноклонального антитела к CD40 в сравнении с контрольным изотипом IgG. Значительное увеличение числа rHer2-специфических CD4 T-клеток, позитивных в отношении цитокинов одного и двух типов, также обнаруживали под действием локально вводимого моноклонального антитела к CD40.

ПРИМЕР 6. ПРОТИВОРАКОВАЯ ЭФФЕКТИВНОСТЬ ВАКЦИНЫ ПРОТИВ РАКА В КОМБИНАЦИИ СУНИТИНИБОМ В НИЗКОЙ ДОЗЕ

Противоопухолевую эффективность противораковой вакцины в комбинации с сунитинибом в низкой дозе исследовали на мышах BALB/neuT со спонтанными опухолями тела молочной железы.

Обработка животных. Кратко, самки мышей в возрасте 13-14 недель получали перорально малат сунитиниба (сутент) в дозе 5 мг/кг два раза в сутки в течение 112 суток. Контрольную вакцину, с использованием которой не доставляется никакого антигена, и вакцину против рака, которая доставляет антиген Her-2 крысы с SEQ ID NO: 54 (rHer-2), вводили посредством инъекций аденовируса на 3-й сутки в качестве первичной иммунизации, после чего, используя PMED, выполняли 7 введений по два раза в неделю ДНК, доставляющей антигены HBV (контрольная вакцина) или rHer-2 (вакцина против рака), соответственно. Конечную точку выживаемости определяли, когда все десять тел молочной железы становились опухолепозитивными или когда объем любой из опухолей молочной железы достигал 2000 мм3.

Результаты. Результаты представлены на Фиг. 10. По сравнению с ранее опубликованным фармакокинетическим профилем сутента (Mendel, D., Laird, D., et al.: "In vivo antitumor activity of SU11248, a novel tyrosine kinase inhibitor targeting vascular endothelial growth factor and platelet-derived growth factor receptors: determination of a pharmacokinetic/pharmacodynamic relationship". Clinical Cancer Research, 203, 9: 327-337) ожидается, что Cmax для сутента у мышей, которым его вводили два раза в сутки в дозе 5 мг/кг, будет значительно ниже минимальных уровней в крови, необходимых для достижения эффективного противоопухолевого действия у мышей и человека. Эти данные демонстрируют быстрое и временное улучшение выживаемости мышей, обработанных сутентом в низкой дозе в качестве монотерапии. Однако при введении вместе с вакциной против рака наблюдали более долговременное и значительное улучшение выживаемости (Р меньше 0,0001 согласно логарифмическому ранговому критерию).

ПРИМЕР 7. УСИЛЕНИЕ ИНДУЦИРОВАННЫХ ВАКЦИНОЙ ИММУННЫХ ОТВЕТОВ В РЕЗУЛЬТАТЕ ЛОКАЛЬНОГО ВВЕДЕНИЯ CPG

Усиливающее влияние локального введения CpG (PF-03512676) на иммунные ответы, индуцированные нуклеиновой кислотой PSMA человека, предложенной согласно данному изобретению, исследовали на обезьянах, иммунный ответ у которых оценивали, измеряя PSMA-специфические T-клеточные ответы с использованием анализа IFNγ-ELISPOT.

Обработка животных и сбор образцов. Шесть групп китайских яванских макак, по шесть (№№ с 1 по 6) в каждой тестируемой группе, иммунизировали плазмидной ДНК, кодирующей модифицированный антиген PSMA человека (полипептид с SEQ ID NO: 9), доставляемой посредством электропорации. Кратко, все животные в 0-е сутки получали билатерально внутримышечные инъекции по 5 мг плазмидной ДНК с последующей электропорацией (DNA ЕР). Затем, сразу после проведения электропорации группа 2 получала билатерально внутримышечные инъекции по 2 мг CpG в смеси с 1 мг квасцов вблизи от сайтов инъекции ДНК. Группы 3 и 4 получали билатерально внутримышечные инъекции по 2 мг CpG, доставляемые без квасцов, вблизи от сайтов инъекции ДНК, или на 0-е сутки, или на 3-й сутки, соответственно. Группа 5 получала билатерально внутримышечные инъекции по 2 мг CpG вблизи от дренируемых вакциной паховых лимфатических узлов на 3-и сутки. Группа 6 получала билатерально внутримышечные инъекции по 200 мкг CpG в смеси с раствором ДНК, который доставляли путем совместной электропорации в мышцу в 0-е сутки.

Методика анализа IFNγ-ELISPOT. Собирали образцы периферической крови от каждого животного через пятнадцать суток после ДНК-иммунизации. Из образцов крови выделяли мононуклеарные клетки периферической крови (РВМС) и подвергали анализу IFNγ-ELISPOT для измерения PSMA-специфических T-клеточных ответов. Кратко, в планшеты для IFNγ-ELISPOT помещали по 4×105 РВМС от отдельных животных из расчета на одну лунку вместе с пулом PSMA-специфических пептидов или пулом неспецифических контрольных пептидов (пулом пептидов HER2 человека) в концентрации 2 мкг/мл каждый. Состав каждого пула PSMA-специфических пептидов приведен в Таблице 24А. Планшеты инкубировали в течение 16 ч при 37°C и 5% CO2, промывали и обрабатывали после инкубации согласно инструкции производителя. Число клеток, образующих «ореол», (SFC) в анализе с IFNγ подсчитывали посредством ридера от Cellular Technology Limited (CTL). Для каждого из условий выполняли два повтора.

Результаты. В Таблице 6 показан результат репрезентативного анализа IFNγ-ELISPOT, в котором оцениваются и сравниваются IFNγ-T-клеточные ответы, индуцированные вакциной, не содержащей (группа 1) или содержащей CpG (PF-03512676), введенной локально путем внутримышечных (группы 2, 3, 4 и 5) или внутрикожных инъекций (группа 6). Приведенный PSMA-специфический ответ рассчитывали, вычитая среднее число SFC для неспецифических контрольных пептидов (пула пептидов HER2 человека) из среднего числа SFC для пулов пептидов PSMA и нормируя на число SFC, наблюдаемое для 1×106 РВМС. ^ указывает на то, что такое число является приблизительным, поскольку количества пятен были слишком велики для выполнения подсчета. ND указывает на то, что определения не проведено.

PSMA-специфические IFNγ-T-клеточные ответы наблюдали для многих пулов PSMA-специфических пептидов в отсутствие CpG (PF-03512676) для всех шести животных (группа 1). Суммарные измеренные ответы на пептиды PSMA оказались немного выше у незначительного числа животных, которые дополнительно получали CpG (PF-03512676) либо путем внутримышечной (группа 4: 3/6), либо внутрикожкой (группа 5: 2/6) инъекций через 3 суток после введения ДНК посредством электропорации. Однако, когда затем CpG доставляли сразу после электропорации в те же сутки (группы 2 и 3), несколько животных не давали высоких ответов (группа 2: 4/6 и группа 3: 3/6) как в случае смеси с квасцами, так и в отсутствие квасцов. Тем не менее, когда путем совместной электропорации в мышцу вместе с раствором ДНК доставляли десятикратно сниженную дозу CpG (группа 6), у 4/6 животных наблюдали более высокие суммарные ответы со статистически более значимым ответом (Р меньше 0,05) на пул пептидов Н1 и R1 по сравнению с животными, не получавшими CpG (группа 1). Эти данные показывают, что CpG в низкой дозе может эффективно усиливать IFNγ-T-клеточные ответы, индуцированные ДНК-вакциной при введении в мышцу посредством совместной электропорации.

ID обозначает идентификационный номер.

ПРИМЕР 8. УСИЛЕНИЕ ИНДУЦИРОВАННЫХ ВАКЦИНОЙ ИММУННЫХ ОТВЕТОВ В РЕЗУЛЬТАТЕ ЛОКАЛЬНОГО ВВЕДЕНИЯ АНТИТЕЛА К CTLA-4

Влияние подкожного введения моноклонального антитела к CTLA-4 (СР-675206) в низкой дозе на иммунные ответы, идуцированные нуклеиновой кислотой PSMA макаки-резус, исследовали на обезьянах, иммунный ответ у которых оценивали, измеряя PSMA-специфические T-клеточные ответы с использованием анализа IFNγ-ELISPOT. Использованная в этом исследовании нуклеиновая кислота PSMA макаки-резус имеет последовательность, приведенную в SEQ ID NO: 56) и кодирует иммуногенный полипептид PSMA с SEQ ID NO: 55.

Обработка животных и сбор образцов. Пять групп самцов индийских макак-резус, по семь (№№ с 1 по 7) в каждой тестируемой группе, иммунизировали с использованием аденовируса с ДНК, кодирующей модифицированный антиген PSMA макак-резус, доставляемого билатерально путем внутримышечных инъекций (2×5×1010 вирусных частиц (V.P.)). Сразу же после инъекций аденовируса группа 1 получала разбавитель, а группы 2-4 получали билатерально подкожные инъекции антитела к CTLA-4 (СР-675206) в дозах 2×25 мг, 2×16,7 мг и 2×8,4 мг, соответственно, вблизи от дренируемого вакциной лимфатического узла.

Через девять суток после иммунизации из каждого животного выделяли мононуклеарные клетки периферической крови (РВМС) и подвергали анализу IFNγ-ELISPOT для измерения T-клеточных ответов, специфических в отношении PSMA макак-резус. Кратко, в планшеты для IFNγ-ELISPOT помещали по 4×105 РВМС от отдельных животных из расчета на одну лунку вместе с пулом PSMA-специфических пептидов макак-резус (Р1, Р2, Р3 или R1+R2, представленных в Таблице 24А) или пулом неспецифических контрольных пептидов (пулом пептидов HER2 человека) в концентрации 2 мкг/мл каждый. Планшеты инкубировали в течение 16 ч при 37°C и 5% CO2, промывали и обрабатывали после инкубации согласно инструкции производителя. Число клеток, образующих «ореол», (SFC) в анализе с IFNγ подсчитывали посредством ридера от CTL. Для каждого из условий выполняли два повтора. Среднее число SFC из двух повторов с учетом фона для пулов PSMA-специфических пептидов макак-резус нормировали на ответ, полученный для 1×106 РВМС. Индивидуальные и суммарные ответы на пулы пептидов для каждого отдельного животного представлены в Таблице 29.

Методика анализа IFNγ-ELISPOT. Захватывающим антителом, специфичным к IFNγ (BD Bioscience, №51-2525kc), в течение ночи при 4°C покрывают мембрану из поливинилиденфторида (PVDF) в микропланшете. Планшет блокируют сывороткой/белком для предотвращения неспецифического связывания с антителом. По окончании блокирования в лунки добавляют эффекторные клетки (такие как спленоциты, выделенные из иммунизированных мышей, или РВМС, выделенные из макак-резус) и мишени (такие как пептиды PSMA из библиотеки пептидов, клетки-мишени, активированные антигенспецифическими пептидами, или опухолевые клетки, экспрессирующие релевантные антигены) и инкубируют в течение ночи при 37°C в инкубаторе с 5% CO2. Цитокин, секретируемый эффекторными клетками, захватывается антителом, нанесенным на поверхность мембраны из PVDF. После удаления клеток и культуральных сред в каждую из лунок для детекции добавляют по 100 мкл биотинилированного поликлонального антитела к IFNγ человека. «Ореолы» визуализируют путем добавления стрептавидина с пероксидазой хрена и преципитирующего субстрата, 3-амино-9-этилкарбазола (АЕС), получая пятно красного цвета, согласно протоколу производителя (Mabtech). Каждое пятно соответствует одной продуцирующей цитокин T-клетке.

Результаты. В Таблице 7 показаны результаты репрезентативного анализа IFNγ-ELISPOT, в котором сравниваются T-клеточные ответы, индуцированные вакциной в отсутствие (группа 1) или в присутствии (группы 2-4) моноклонального антитела к CTLA-4 (СР-675206), вводимого локально подкожными инъекциями вблизи от дренируемого вакциной лимфатического узла. Вакцина вызывала иммунный ответ (группа 1), который значительно усиливался в результате локального введения антитела к CTLA-4 (СР-675206) в дозе 50 мг (группа 2, Р равно 0,001 согласно t-критерию Стьюдента с использованием заниженных значений). Ответ также значительно усиливался при использовании антитела к CTLA-4 в низких дозах 33,4 мг (группа 3: Р равно 0,004 согласно t-критерию Стьюдента с использованием заниженных значений) и 16,7 мг (группа 4: Р равно 0,05 согласно t-критерию Стьюдента), соответственно. Данные подтверждают, что антитело к CTLA-4 в низких дозах, доставляемое подкожной инъекцией, может значительно усиливать индуцируемые вакциной иммунные ответы.

ПРИМЕР 9. ИММУНОМОДУЛИРОВАНИЕ МИЕЛОИДНЫХ СУПРЕССОРНЫХ КЛЕТОК СУНИТИНИБОМ В НИЗКОЙ ДОЗЕ

Следующий далее пример приведен для иллюстрации иммуномодулирующих эффектов сунитиниба в низкой дозе на миелоидные супрессорные клетки (MDSC) in vivo в мышиной неопухолевой модели.

Методики исследования

Для получения спленоцитов, обогащенных MDSC, клетки TUBO (1×106) имплантировали 5 мышам BALB/neuT по бокам, и мышей оставляли в покое приблизительно в течение 20-30 суток, пока объем опухолей не достигал величины в диапазоне 1000-1500 мм3. Затем мышей умерщвляли, удаляли селезенки и извлекали спленоциты, обогащенные MDSC. Спленоциты метили в течение 10 минут 5 мкМ сукцинимидиловым эфиром карбоксифлуоресцеина (CFSE), промывали PBS и проводили подсчет. Меченые клетки далее ресуспендировали в количестве 5×107 спленоцитов/мл в растворе PBS и адоптивно переносили посредством внутривенной (в.в.) инъекции в хвостовую вену наивных реципиентных мышей BALB/c. Реципиентным мышам за трое суток до адоптивного переноса начинали вводить два раза в сутки разбавитель или малат сунитиниба (сутент) в дозе 5 мг/кг, 10 мг/кг и 20 мг/кг. После адоптивного переноса реципиентные мыши продолжали получать два раза в сутки разбавитель или сунитиниб в течение еще двух суток, после чего мышей умерщвляли, селезенки удаляли, спленоциты извлекали и обрабатывали для проведения фенотипического анализа.

Спленоциты подсчитывали и ресуспендировали в количестве 5×106 клеток/мл в буфере для окрашивания для проведения FACS (PBS, 0,2% (масс./об.) бычьего сывороточного альбумина и 0,02% (масс./об.) азида натрия). С целью окрашивания спленоцитов для проведения проточной цитометрии сначала инкубировали 2,5×106 клеток с антителами к CD16/CD32 в течение 10 минут при 4°C, чтобы блокировать Fc-рецепторы и свести к минимуму неспецифическое связывание. Затем спленоциты окрашивали в течение 20 минут при 4°C, используя конъюгированные с соответствующим флуорофором антитела (Biolegend) к маркерам клеточной поверхности мышиных клеток. Для T-клеток (антитело к CD3 (Pacific Blue), клон 17А2) и для MDSC (антитело к GR-1 (АРС), клон RB6-8C5, и антитело к CD11b (PerCp-Су5.5), клон М1/70). Также использовали окраску живых/мертвых клеток. После инкубации с антителом окрашенные спленоциты промывали 2 мл буфера для FACS, собирали центрифугированием и ресуспендировали в 0,2 мл буфера для FACS, после чего получали данные на проточном цитометре CANTO II от BD. Для мониторинга влияния сунитиниба или разбавителя на выживаемость адоптивно перенесенных MDSC авторы изобретения рассчитывали процентное содержание CFSE+, CD3-, GR1+, CD11b+ в живых клетках; единичный гейт. Затем авторы изобретения определяли число адоптивно перенесенных MDSC на одну селезенку, вычисляя, какому фактическому числу клеток соответствует указанный процент от общего числа спленоцитов. Данные анализировали, используя программное обеспечение FloJo и Graph pad.

Результаты. Данные, приведенные в Таблице 27, представляют среднее число адоптивно перенесенных CSFE+, CD3-, GR1+, CD11b+ клеток, извлеченных из одной селезенки (n=7/группа), через 2 суток после адоптивного переноса из мышей, которым два раза в сутки вводили либо разбавитель, либо сунитиниб в дозе 5 мг/кг, 10 мг/кг и 20 мг/кг. Статистическую значимость определяли посредством ANOVA (однофакторного дисперсионного анализа) с использованием критерия Даннета для множественных сравнений, сравнивая группы, которым вводили сунитиниб, с группой, получавшей 0 мг/кг (разбавитель). Эти данные демонстрируют, что сунитиниб, вводимый два раза в сутки in vivo, оказывает иммуномодулирующий эффект на MDSC даже при введении в дозе всего лишь 5 мг/кг, приводящий к статистически значимому уменьшению количеств извлеченных MDSC по сравнению с обработанной разбавителем контрольной группой.

ПРИМЕР 10. ИММУНОГЕННОСТЬ ТРОЙНЫХ АНТИГЕННЫХ АДЕНОВИРУСНЫХ КОНСТРУКЦИЙ И ДНК-КОНСТРУКЦИЙ

Следующий далее пример приведен для иллюстрации способности тройных антигенных вакцинных конструкций (в форме или аденовирусного вектора, или ДНК-плазмиды), экспрессирующих три антигена PSMA, PSCA и PSA, предложенных согласно данному изобретению, вызывать специфические T-клеточные ответы ко всем трем кодируемым антигенам у не являющихся людьми приматов.

Методики исследования in vivo. T-клеточную иммуногенность пяти аденовирусных векторов, каждый из которых экспрессирует три антигена (PSMA, PSCA и PSA; Ad-733, Ad-734, Ad-735, Ad-796 и Ad-809), предложенных согласно изобретению, сравнивали с иммуногенностью смеси трех аденовирусных векторов, каждый из которых экспрессирует только один антиген (PSMA, PSA или PSCA), через 9 суток после первичной иммунизации. Для демонстрации специфичности оценивали ответ на один аденовирус, экспрессирующий один антиген (группы 1-3). Кратко, индийским макакам-резус (n=6 для групп 1 и 3, n=7 для группы 2, и n=8 для групп 4-9) вводили внутримышечной инъекцией суммарно 1×1011 V.P., после чего в те же сутки путем внутрикожных инъекций вводили антитела к CTLA-4 в дозе 10 мг/кг. Через девять суток после инъекций из каждого животного выделяли мононуклеарные клетки периферической крови (РВМС) и подвергали анализу IFNγ-ELISPOT для измерения PSMA-, PSA- и PSCA-специфических T-клеточных ответов.

Через тринадцать недель после инъекций аденовируса и антител к CTLA-4, когда были получены T-клеточные ответы, обезьяны получали поддерживающие вакцинации ДНК (группа 1: PSMA, плазмида 5166; группа 2: PSA, плазмида 5297; группа 3: PSCA, плазмида 5259; группа 4: смесь PSMA, PSA и PSCA, плазмиды 5166, 5259 и 5297; группа 5: плазмида 457; группа 6: плазмида 458; группа 7: плазмида 459; группа 8: плазмида 796; и группа 9: плазмида 809), доставляемые посредством электропорации. Таким образом, каждое животное получало в целом 5 мг плазмидной ДНК, предложенной согласно изобретению, которая доставляет ту же экспрессионную кассету, что и кодируемая аденовирусом, использованным при первичной иммунизации. Через девять суток после поддерживающей вакцинации из каждого животного выделяли мононуклеарные клетки периферической крови (РВМС) и подвергали анализу IFNγ-ELISPOT.

Анализ IFNγ-ELISPOT. Кратко, в планшеты для IFNγ-ELISPOT помещали по 4×105 РВМС от отдельных животных из расчета на одну лунку вместе с пулами PSMA-специфических пептидов Р1, Р2, Р3 или Н1 и Н2 (Таблица 9А), пулом PSA-специфических пептидов 1 или 2 (Таблица 9В), пулом PSCA-специфических пептидов (Таблица 9В) или пулом неспецифических контрольных пептидов (пулом пептидов HER2 человека) в концентрации 2 мкг/мл каждый. Планшеты инкубировали в течение 16 ч при 37°C и 5% CO2, промывали и обрабатывали после инкубации согласно инструкции производителя. Число клеток, образующих «ореол», (SFC) в анализе с IFNγ подсчитывали посредством ридера от CTL. Для каждого из условий выполняли два повтора. Среднее число SFC из двух повторов с учетом фона для пулов антигенспецифических пептидов нормировали на ответ, полученный для 1×106 РВМС. Антигенспецифические ответы, приведенные в таблицах, представляют собой сумму ответов на соответствующие антигенспецифические пептиды или пулы пептидов.

Результаты. В Таблице 11 представлены результаты исследования на индийских макаках-резус с использованием IFNγ-ELISPOT, в котором оценивается T-клеточная иммуногенность пяти разных аденовирусов, каждый из которых экспрессирует все три антигена, по сравнению со смесью трех аденовирусов, каждый из которых экспрессирует один антиген. У большинства животных, которые получали инъекции только Ad-PSMA (группа 1), индуцировались специфические ответы на PSMA, но не на PSA или PSCA (t-критерий Стьюдента, Р меньше 0,03. Одно животное (№4), у которого индуцировались ответы преимущественно на PSCA, исключали из статистического анализа). У животных, которые получали инъекции только Ad-PSA (группа 2), индуцировались специфические ответы на PSA, но не на PSMA или PSCA (t-критерий Стьюдента, Р меньше 0,02). У животных, которые получали инъекции только Ad-PSCA (группа 3), индуцировались специфические ответы на PSCA, но не на PSMA или PSA (t-критерий Стьюдента, Р меньше 0,03). Все пять экспрессирующих тройной антиген аденовирусных векторов (группы 5-9) индуцировали IFNγ-T-клеточные ответы на все три антигена, величина которых варьировала от животного к животному. Величина ответов на PSCA, индуцированных экспрессирующими тройной антиген аденовирусами, была аналогична таковой для смеси отдельных векторов (группа 4). Однако величина ответов на PSMA, индуцированных с использованием Ad-809 (группа 9), и ответов на PSA, индуцированных с использованием Ad-796 (группа 8), в каждом из этих случаев значительно превосходила таковую для смеси (t-критерий Стьюдента, Р равно 0,04 и Р равно 0,02), соответственно. Эти результаты указывают на то, что вакцинирование аденовирусом, экспрессирующим тройные антигены, может вызывать эквивалентные или превосходящие T-клеточные иммунные ответы по сравнению с вакцинированием смесью отдельных аденовирусов у приматов, не являющихся человеком.

В Таблице 12 показаны результаты исследования, полученные с использованием IFNγ-ELISPOT, в котором оценивается иммуногенность пяти разных экспрессирующих тройной антиген кассет, предложенных согласно изобретению, доставляемых посредством первичной иммунизации аденовирусом в комбинации с антителом к CTLA-4, с последующей поддерживающей иммунизацией соответствующей плазмидной ДНК посредством электропорации. Иммунные ответы сравнимы с таковыми для смеси трех конструкций, экспрессирующих один антиген, доставляемых аналогичным образом посредством первичной иммунизации аденовирусом совместно с антителом к CTLA-4 и поддерживающих ДНК-иммунизаций посредством электропорации.

У всех животных, которые получали только Ad-PSMA вместе с антителом к CTLA-4, с последующими иммунизациями PSMA-плазмидами (группа 1), индуцировались специфические ответы на PSMA, но не на PSA или PSCA. Аналогичным образом, у всех животных, которые получали только Ad-PSA вместе с антителом к CTLA-4, с последующими иммунизациями PSA-плазмидами (группа 2), индуцировались специфические ответы на PSA, но не на PSMA или PSCA, и наконец, у всех животных, которые получали только Ad-PSCA вместе с антителом к CTLA-4, с последующими иммунизациями PSCA-плазмидами (группа 3), индуцировались специфические ответы на PSCA, но не на PSMA или PSA (t-критерий Стьюдента, Р меньше 0,01).

У всех животных, которых иммунизировали либо векторами, экспрессирующими тройной антиген (группы 5-9), либо смесью (группа 4), индуцировались IFNγ-T-клеточные ответы на все три антигена. Частота встречаемости обнаруженных PSCA- или PSA-специфических IFNγ-T-клеток была одинаковой во всех этих группах (группы 4-9), соответственно. Однако группы 7 и 9, получавшие вакцинации конструкциями с экспрессирующим тройной антиген вектором, давали значительно более высокую частоту встречаемости ответов на PSMA, чем в случае использования смеси трех конструкций, экспрессирующих один антиген (группа 4). Эти результаты указывают на то, что аденовирусные и ДНК-вакцины, экспрессирующие тройные антигены в одной кассете, могут вызывать эквивалентные IFNγ-T-клеточные ответы по сравнению со смесью аденовирусов и ДНК, экспрессирующих единичные антигены, у приматов, не являющихся человеком.

ПРИМЕР 11. КОНСТРУИРОВАНИЕ ВЕКТОРОВ С68

11А. Конструирование вектора AdC68-734

AdC68-734 представляет собой репликационно некомпетентный аденовирусный вектор на основе аденовируса С68 шимпанзе, который кодирует три иммуногенных полипептида РАА - иммуногенный полипептид PSA, иммуногенный полипептид PSCA и иммуногенный полипептид PSMA. Последовательность вектора конструировали in silico. Сначала получали исходную полноразмерную последовательность С68 из Genbank (определение: обезьяний аденовирус, тип 25, полный геном; номер доступа АС_000011.1). В эту последовательность вводили пять точечных мутаций, описанных в литературе (Roshorm, Y., М.G. Cottingham, et al. (2012). "Т cells induced by recombinant chimpanzee adenovirus alone and in prime-boost regimens decrease chimeric EcoHIV/NDK challenge virus load". Eur. J. Immunol., 42(12): 3243-3255). Далее удаляли участок 1 транскрипции ранних вирусных генов (Е1) размером 2,6 т.п.н., чтобы сделать вектор репликационно некомпетентным, и удаляли участок 3 транскрипции ранних генов (Е3) размером 3,5 т.п.н., чтобы создать в векторе пространство для трансгенной экспрессионной кассеты (Tatsis, N., L. Tesema, et al. (2006). Chimpanzee-origin adenovirus vectors as vaccine carriers. Gene Ther., 13: 421-429). Затем в участок E1 вводили высокоэффективную эукариотическую экспрессионную кассету. Эта экспрессионная кассета включала следующие компоненты: (А) немедленно ранний энхансер/промотор цитомегаловируса (CMV), (Б) Tet-оператор (сайт связывания для тетрациклинового репрессора), (В) мультиантигенную конструкцию, содержащую (1) нуклеотидную последовательность, кодирующую аминокислоты от 25 до 261 из PSA человека, (2) цис-активирующий элемент гидролазы, кодирующий глицин-сериновый линкер и 2А-пептид из вируса Thosea asigna (Т2А), (3) нуклеотидную последовательность, кодирующую аминокислоты от 2 до 123 из PSCA человека, (4) цис-активирующий элемент гидролазы, кодирующий глицин-сериновый линкер и 2А-пептид из вируса ящура (F2A), и (5) нуклеотидную последовательность, кодирующую аминокислоты от 15 до 750 из PSMA человека, и (Г) сигнал терминации транскрипции polyA SV40. Наконец, вводили сайты рестрикции для PacI на каждом из концов вирусного генома для облегчения высвобождения генома из исходной бакмиды. Нуклеотиды из сайта рестрикции для PacI удаляются в процессе размножения вируса и ввиду этого не встраиваются в геном самого векторного продукта. Нуклеотидная последовательность вектора AdC68-734 целиком, включая сайты рестрикции для PacI, приведена в SEQ ID NO: 58. Мультиантигенная конструкция (PSA-T2A-PSCA-F2A-PSMA), встроенная в вектор AdC68-734 (а также в плазмиду 458), также приведена в SEQ ID NO: 61. Аминокислотная последовательность, кодируемая этой мультиантигенной конструкцией с SEQ ID NO: 61, приведена в SEQ ID NO: 60. Компоненты вектора AdC68-734 приведены в Таблице 13.

После завершения конструирования in silico, последовательность из 34819 пар оснований синтезировали биохимическим способом в ходе многостадийного процесса, используя in vitro синтез олигонуклеотидов и последующую опосредуемую рекомбинацией промежуточную сборку в Е. coli и дрожжах. В конечном итоге вирусный геном встраивали в бактериальную искусственную хромосому (ВАС) (pCC1BAC-LCyeast-TRP Trunc) для размножения. Секвенирование нового поколения (технологию MiSeq) в ходе процесса получения осуществляли за несколько стадий, включая секвенирование конечной партии бакмиды 17.3.3.22, которую использовали для создания исходной суспензии вирусного инокулята. Исходную суспензию вирусного инокулята готовили, рестрицируя бакмиду 17.3.3.22 ферментом PacI для высвобождения генома AdC68-734 из остова ВАС. Эту линеаризованную нуклеиновую кислоту трансфицировали в Е1-комплементарную адгерентную клеточную линию HEK293 и, после появления видимых цитопатических эффектов и образования скоплений аденовируса, культуры собирали, выполняя многократные раунды замораживания/оттаивания для высвобождения вируса из клеток. Вирусы амплифицировали и очищали стандартными методами. Генетическое строение бакмиды 17.3.3.22 приведено на Фиг. 11.

11Б. Конструкции дополнительных векторов С68

Дополнительные несущие тройной антиген векторы С68 конструировали аналогично AdC68-734. Некоторые из дополнительных векторов включают в себя функциональные делеции в геноме С68, которые незначительно отличаются от таковых в векторе AdC68-734, в то время как остальные включают другие мультиантигенные конструкции. Опираясь на эти примеры и остальную часть описания настоящего изобретения, специалист в данной области техники будет способен сконструировать дополнительные векторы на основе С68 для экспрессии различных мультиантигенных конструкций, и все они включены в объем настоящего изобретения.

(1) AdC68X-734 и AdC68W-734

Вектор AdC68X-734 конструировали из С68 путем функциональной делеции участков Е1 и Е3 генома С68 посредством удаления нуклеотидов 577-3403 (участка Е1) и 27125-31831 (участка Е2) генома С68 с SEQ ID NO: 57 и путем вставки тройной антигенной конструкции (PSA-T2A-PSCA-F2A-PSMA) с SEQ ID NO: 61 вместо удаленного участка Е1. Вектор AdC68W-734 идентичен вектору AdC68-734 за исключением того, что AdC68W-734 содержит одну или более мутаций в последовательности ДНК С68.

(2) AdC68X-733 и AdC68X-735

Векторы AdC68X-733 и AdC68X-735 создавали, заменяя тройную антигенную конструкцию, встроенную в вектор AdC68X-734, на тройную антигенную конструкцию с SEQ ID NO: 65 и 66, соответственно. Мультиантигенная конструкция, встроенная в вектор AdC68X-733 (т.е. PSA-F2A-PSMA-T2A-PSCA), представляет собой ту же самую конструкцию, которая встроена в плазмиду 457, а мультиантигенная конструкция, встроенная в вектор AdC68X-735 (т.е. PSCA-F2A-PSMA-mIRES-PSA), представляет собой ту же самую конструкцию, которая встроена в плазмиду 459.

11В. Характеристика продуктивности в условиях научных разработок

Получали различные партии AdC68-734 в условиях научных разработок и тестировали в отношении продуктивности. Бакмиду рестрицировали ферментом PacI для высвобождения генома этого вектора из остова ВАС и линеаризованную нуклеиновую кислоту использовали для трансфекции Е1-комплементарных адгерентных клеточных линий HEK293. После появления обширных видимых цитопатических эффектов и скоплений аденовируса, культуры собирали, выполняя многократные раунды замораживания/оттаивания для высвобождения вируса из клеток. Вирусы из культур этого 0-го пассажа (Р0) амплифицировали, выполняя по меньшей мере один дополнительный пассаж в матрасах для культур тканей, и затем использовали в качестве исходного посевного материала для получения в производственных циклах партий вирусов в масштабе исследований (общее число вирусных частиц в одной партии составляло приблизительно (0,5-3)×1013). В общей сложности проводили 11 производственных циклов (пять с суспензией клеток HEK293 и шесть с адгерентными клетками HEK293). Средняя удельная продуктивность составляла 15000 +/-6000 очищенных вирусных частиц на одну исходную инфицированную клетку, с соотношением вирусная частица : инфекционная единица, составляющим 55. Значения продуктивности в условиях научных разработок суммированы в Таблице 14.

11Г. Экспрессия антигенов

Поверхностную экспрессию PSMA и PSCA измеряли с использованием проточной цитометрии (Фиг. 12), а полную экспрессию PSMA, PSCA и PSA в клетке измеряли в анализе с применением вестерн-блоттинга (Фиг. 13) на клетках А549, инфицированных вектором AdC68 с множественностью заражения (MOI) равным 10000. Ложноинфицированные и AdC68-инфицированные клетки окрашивали антителом к PSCA (конъюгированным с флуоресцеинизотиоцианатом моноклональным антителом 1G8 [1:200]) и антителом к PSMA (конъюгированным с аллофикоцианином моноклональным антителом J591 [1:200]) для проведения проточного цитометрического анализа через 2 суток после инфекции. Для большинства клеток, инфицированных разными экспрессирующими тройной антиген векторами AdC68, обнаруживали различные уровни поверхностной экспрессии PSCA и PSMA. Относительно более высокие уровни экспрессии PSCA и PSMA обнаруживали для AdC68X-809-инфицированных клеток, а более низкие уровни обнаруживали для AdC68X-733-инфицированных клеток. Через двое суток после инфекции суммарные клеточные лизаты приблизительно 1×105 инфицированных клеток загружали каждый на свою дорожку полиакриламидного геля с додецилсульфатом натрия. После гель переносили на мембрану для обнаружения белков PSA, PSMA и PSCA с использованием первичных антител, специфичных к PSA, PSMA и PSCA, в анализе с применением вестерн-блоттинга. В инфицированных клетках наблюдали экспрессию всех трех антигенов в разной степени. В то время как в лизатах после инфицирования посредством AdC68-734 и AdC68X-735 наблюдали относительно схожие уровни PSMA и PSCA, в лизатах после инфицирования посредством AdC68-734 наблюдали более высокие уровни PSA по сравнению с таковыми для AdC68X-735.

11Д. Иммуногенность

Проводили прямое сравнительное исследование CD8 IFNγ-ответов, индуцированных различными векторами AdC68, несущими тройной антиген. Каждую группу мышей (n=5 на одну группу) иммунизировали в четырехглавую мышцу, используя AdC68-734, AdC68X-735, AdC68X-809 или Ad5-734 в количестве 1×109 или 1×1010 вирусных частиц (VP). IFNγ CD8+ T-клеточные ответы у мышей измеряли, собирая селезенки от каждого животного на 13-е сутки после иммунизации. Спленоциты выделяли и подвергали анализу IFNγ-ELISPOT для измерения PSMA-, PSCA- и PSA-специфических T-клеточных ответов. Кратко, (2,5-5)×105 спленоцитов от иммунизированных животных культивировали в присутствии отдельных PSMA-, PSCA- или PSA-специфических пептидов человека в концентрации 10 мкг/мл. Сначала определяли у этих 15-мерных пептидов наличие CD8+ T-клеточных эпитопов к каждому антигену предстательной железы. Спленоциты, культивированные с одной только средой, служили в качестве контроля. Для каждого из условий выполняли три повтора. Планшеты инкубировали в течение 20 ч при 37°C и 5% CO2, промывали и обрабатывали после инкубации согласно инструкциям производителя. Число SFC в анализе с IFNγ подсчитывали посредством ридера от CTL. Результаты показывают среднее число PSMA-, PSCA- и PSA-специфических SFC за вычетом фоновых значений, обусловленных присутствием одной только среды, и нормированы на 1×106 спленоцитов.

Подводя итог, следует отметить, что все экспрессирующие тройной антиген векторы AdC68 индуцировали иммунные ответы на все три антигена, но разной величины. В случае с 1×109 VP, ответ на PSMA с участием векторов AdC68 был аналогичен ответу на Ad5. Ответ на PSCA с участием трех векторов AdC68 был аналогичен ответу или был ниже ответа, индуцированного с участием Ad5, в то время как ответ на PSA был ниже в случае с Ad68-735 по сравнению со всеми протестированными векторами. Однако в случае с 1×1010 VP, AdC68-809 индуцировал аналогичные или улучшенные ответы на все три антигена по сравнению с AdC68-734, AdC68-735 или Ad5. Результаты представлены в Таблице 15.

ОТДЕЛЬНЫЕ ИСХОДНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ

SEQ ID NO: 1. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛНОРАЗМЕРНОГО PSMA ЧЕЛОВЕКА

SEQ ID NO: 2. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ ПОЛНОРАЗМЕРНЫЙ PSMA ЧЕЛОВЕКА С SEQ ID NO: 1

SEQ ID NO: 3. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 1 PSMA

SEQ ID NO: 4. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 1 PSMA С SEQ ID NO: 3

SEQ ID NO: 5. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 2 PSMA

SEQ ID NO: 6. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 2 PSMA С SEQ ID NO: 5

SEQ ID NO: 7. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 3 PSMA

SEQ ID NO: 8. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЕРЕТАСОВАННОГО АНТИГЕНА 3 PSMA С SEQ ID NO: 7

SEQ ID NO: 9. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ МЕМБРАНОСВЯЗАННОГО АНТИГЕНА PSMA

SEQ ID NO: 10. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ МЕМБРАНОСВЯЗАННОГО АНТИГЕНА PSMA С SEQ ID NO: 9

SEQ ID NO: 11. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ЦИТОЗОЛЬНОГО АНТИГЕНА PSMA

SEQ ID NO: 12. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ЦИТОЗОЛЬНОГО АНТИГЕНА PSMA С SEQ ID NO: 11

SEQ ID NO: 13. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ СЕКРЕТИРУЕМОГО АНТИГЕНА PSMA

SEQ ID NO: 14. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ СЕКРЕТИРУЕМОГО АНТИГЕНА PSMA С SEQ ID NO: 13

SEQ ID NO: 15. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛНОРАЗМЕРНОГО PSA ЧЕЛОВЕКА

SEQ ID NO: 16. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛНОРАЗМЕРНОГО PSA ЧЕЛОВЕКА С SEQ ID NO: 15

SEQ ID NO: 17. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ЦИТОЗОЛЬНОГО АНТИГЕНА PSA

SEQ ID NO: 18. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ЦИТОЗОЛЬНОГО АНТИГЕНА PSA С SEQ ID NO: 17

SEQ ID NO: 19. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ МЕМБРАНОСВЯЗАННОГО АНТИГЕНА PSA

SEQ ID NO: 20. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ МЕМБРАНОСВЯЗАННОГО АНТИГЕНА PSA С SEQ ID NO: 19

SEQ ID NO: 21. АМИНОКИСЛОТНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛНОРАЗМЕРНОГО PSCA ЧЕЛОВЕКА

SEQ ID NO: 22. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ, КОДИРУЮЩАЯ АМИНОКИСЛОТНУЮ ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛНОРАЗМЕРНОГО PSCA ЧЕЛОВЕКА С SEQ ID NO: 21

SEQ ID NO: 23. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ 5166

SEQ ID NO: 24. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ 5259

SEQ ID NO: 25. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ MID 5297

SEQ ID NO: 26. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ MID 460

SEQ ID NO: 27. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ ID 451

SEQ ID NO: 28. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ D 454

SEQ ID NO: 29. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ D 5300

SEQ ID NO: 30. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ ID 449

SEQ ID NO: 31. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ MID 603

SEQ ID NO: 32. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ 455

SEQ ID NO: 33. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ ASMID 456

SEQ ID NO: 34. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ MID 457

SEQ ID NO: 35. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ 458

SEQ ID NO: 36. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ПЛАЗМИДЫ 459

SEQ ID NO: 37. НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ PSHUTTLE IRES

SEQ ID NO: 38. Аминокислотная последовательность антигена Her-2:

SEQ ID NO: 39. Нуклеотидная последовательность, кодирующая аминокислотную последовательность антигена Her-2 с SEQ ID NO: 38

SEQ ID NO: 40. Аминокислотная последовательность тяжелой цепи антитела к CD40 СР870893

SEQ ID NO: 41. Аминокислотная последовательность легкой цепи антитела к CD40 СР870893

SEQ ID NO: 42. Аминокислотная последовательность тяжелой цепи антитела к CTLA-4 тремелимумаба

SEQ ID NO: 43. Аминокислотная последовательность легкой цепи антитела к CTLA-4 тремелимумаба

SEQ ID NO: 44. Нуклеотидная последовательность CpG 7909

SEQ ID NO: 45. Нуклеотидная последовательность CpG 24555

SEQ ID NO: 46. Нуклеотидная последовательность CpG 10103

SEQ ID NO: 47. Аминокислотная последовательность eGFP SEQ ID NO: 48. Аминокислотная последовательность корового антигена HBV

SEQ ID NO: 49. Аминокислотная последовательность поверхностного антигена HBV

SEQ ID NO: 50. Аминокислотная последовательность ECD белка PSMA макаки-резус

SEQ ID NO: 51. Аминокислотная последовательность пептида p66 Her-2 крысы (H-2d T-клеточного эпитопа)

SEQ ID NO: 52. Аминокислотная последовательность пептида p169 Her-2 крысы (H-2d T-клеточного эпитопа)

SEQ ID NO: 53. Аминокислотная последовательность пептида p87 корового антигена HBV

SEQ ID NO: 54. Аминокислотная последовательность антигена Her-2 крысы (rHer-2)

SEQ ID NO: 55. Аминокислотная последовательность антигена PSMA макака-резус

SEQ ID NO: 56. Нуклеотидная последовательность, кодирующая антиген PSMA макака-резус с SEQ ID NO: 55

SEQ ID NO: 57. Полный геном обезьяньего аденовируса, типа 25 (С68)

SEQ ID NO: 58. Полная последовательность вектора AdC68-734

SEQ ID NO: 59. Нуклеотидная последовательность предпочтительного IRES (pIRES) из EMCV

(В минимальном IRES (mIRES) из EMCV отсутствуют подчеркнутые 15 нуклеотидов)

SEQ ID NO: 60. Аминокислотная последовательность, содержащая иммуногенные полипептиды PSA, PSCA и PSMA (кодируемая плазмидой 916 и векторами AdC68-734 и AdC68W-734)

SEQ ID NO: 61. Нуклеотидная последовательность, кодирующая аминокислотную последовательность с SEQ ID NO: 60

SEQ ID NO: 62. Нуклеотидная последовательность плазм иды 916

SEQ ID NO: 63. Полная последовательность вектора AdC68W-734

SEQ ID NO: 64. Аминокислотная последовательность, содержащая иммуногенные полипептиды PSA, PSMA и PSCA (кодируемая плазмидой 457 и вектором AdC68X-733)

SEQ ID NO: 65. Нуклеотидная последовательность, кодирующая аминокислотную последовательность с SEQ ID NO: 64

SEQ ID NO: 66. Нуклеотидная последовательность мультиантигенной конструкции (PSCA-F2A-PSMA-mIRES-PSA), встроенной в плазм иду 459 и вектор AdC68X-735

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Пфайзер Инк.

<120> ВЕКТОРЫ ДЛЯ ЭКСПРЕССИИ ПРОСТАТОАССОЦИИРОВАННЫХ АНТИГЕНОВ

<130> PC72055A

<150> US 61/898,966

<151> 2013-11-01

<160> 66

<170> PatentIn version 3.5

<210> 1

<211> 750

<212> ПРТ

<213> Homo sapiens

<400> 1

Met Trp Asn Leu Leu His Glu Thr Asp Ser Ala Val Ala Thr Ala Arg

1 5 10 15

Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val Leu Ala Gly Gly Phe

20 25 30

Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile Lys Ser Ser Asn Glu

35 40 45

Ala Thr Asn Ile Thr Pro Lys His Asn Met Lys Ala Phe Leu Asp Glu

50 55 60

Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu Tyr Asn Phe Thr Gln Ile

65 70 75 80

Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln Leu Ala Lys Gln Ile

85 90 95

Gln Ser Gln Trp Lys Glu Phe Gly Leu Asp Ser Val Glu Leu Ala His

100 105 110

Tyr Asp Val Leu Leu Ser Tyr Pro Asn Lys Thr His Pro Asn Tyr Ile

115 120 125

Ser Ile Ile Asn Glu Asp Gly Asn Glu Ile Phe Asn Thr Ser Leu Phe

130 135 140

Glu Pro Pro Pro Pro Gly Tyr Glu Asn Val Ser Asp Ile Val Pro Pro

145 150 155 160

Phe Ser Ala Phe Ser Pro Gln Gly Met Pro Glu Gly Asp Leu Val Tyr

165 170 175

Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys Leu Glu Arg Asp Met

180 185 190

Lys Ile Asn Cys Ser Gly Lys Ile Val Ile Ala Arg Tyr Gly Lys Val

195 200 205

Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu Ala Gly Ala Lys Gly

210 215 220

Val Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe Ala Pro Gly Val Lys

225 230 235 240

Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly Gly Val Gln Arg Gly

245 250 255

Asn Ile Leu Asn Leu Asn Gly Ala Gly Asp Pro Leu Thr Pro Gly Tyr

260 265 270

Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile Ala Glu Ala Val Gly

275 280 285

Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr Tyr Asp Ala Gln Lys

290 295 300

Leu Leu Glu Lys Met Gly Gly Ser Ala Pro Pro Asp Ser Ser Trp Arg

305 310 315 320

Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro Gly Phe Thr Gly Asn

325 330 335

Phe Ser Thr Gln Lys Val Lys Met His Ile His Ser Thr Asn Glu Val

340 345 350

Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Arg Gly Ala Val Glu Pro

355 360 365

Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp Ser Trp Val Phe Gly

370 375 380

Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val His Glu Ile Val Arg

385 390 395 400

Ser Phe Gly Thr Leu Lys Lys Glu Gly Trp Arg Pro Arg Arg Thr Ile

405 410 415

Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly Leu Leu Gly Ser Thr

420 425 430

Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln Glu Arg Gly Val Ala

435 440 445

Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn Tyr Thr Leu Arg Val

450 455 460

Asp Cys Thr Pro Leu Met Tyr Ser Leu Val His Asn Leu Thr Lys Glu

465 470 475 480

Leu Lys Ser Pro Asp Glu Gly Phe Glu Gly Lys Ser Leu Tyr Glu Ser

485 490 495

Trp Thr Lys Lys Ser Pro Ser Pro Glu Phe Ser Gly Met Pro Arg Ile

500 505 510

Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val Phe Phe Gln Arg Leu

515 520 525

Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys Asn Trp Glu Thr Asn

530 535 540

Lys Phe Ser Gly Tyr Pro Leu Tyr His Ser Val Tyr Glu Thr Tyr Glu

545 550 555 560

Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys Tyr His Leu Thr Val

565 570 575

Ala Gln Val Arg Gly Gly Met Val Phe Glu Leu Ala Asn Ser Ile Val

580 585 590

Leu Pro Phe Asp Cys Arg Asp Tyr Ala Val Val Leu Arg Lys Tyr Ala

595 600 605

Asp Lys Ile Tyr Ser Ile Ser Met Lys His Pro Gln Glu Met Lys Thr

610 615 620

Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala Val Lys Asn Phe Thr

625 630 635 640

Glu Ile Ala Ser Lys Phe Ser Glu Arg Leu Gln Asp Phe Asp Lys Ser

645 650 655

Asn Pro Ile Val Leu Arg Met Met Asn Asp Gln Leu Met Phe Leu Glu

660 665 670

Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp Arg Pro Phe Tyr Arg

675 680 685

His Val Ile Tyr Ala Pro Ser Ser His Asn Lys Tyr Ala Gly Glu Ser

690 695 700

Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile Glu Ser Lys Val Asp

705 710 715 720

Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln Ile Tyr Val Ala Ala

725 730 735

Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser Glu Val Ala

740 745 750

<210> 2

<211> 2250

<212> ДНК

<213> Homo sapiens

<400> 2

atgtggaatc tccttcacga aaccgactcg gctgtggcca ccgcgcgccg cccgcgctgg 60

ctgtgcgctg gggcgctggt gctggcgggt ggcttctttc tcctcggctt cctcttcggg 120

tggtttataa aatcctccaa tgaagctact aacattactc caaagcataa tatgaaagca 180

tttttggatg aattgaaagc tgagaacatc aagaagttct tatataattt tacacagata 240

ccacatttag caggaacaga acaaaacttt cagcttgcaa agcaaattca atcccagtgg 300

aaagaatttg gcctggattc tgttgagcta gcacattatg atgtcctgtt gtcctaccca 360

aataagactc atcccaacta catctcaata attaatgaag atggaaatga gattttcaac 420

acatcattat ttgaaccacc tcctccagga tatgaaaatg tttcggatat tgtaccacct 480

ttcagtgctt tctctcctca aggaatgcca gagggcgatc tagtgtatgt taactatgca 540

cgaactgaag acttctttaa attggaacgg gacatgaaaa tcaattgctc tgggaaaatt 600

gtaattgcca gatatgggaa agttttcaga ggaaataagg ttaaaaatgc ccagctggca 660

ggggccaaag gagtcattct ctactccgac cctgctgact actttgctcc tggggtgaag 720

tcctatccag atggttggaa tcttcctgga ggtggtgtcc agcgtggaaa tatcctaaat 780

ctgaatggtg caggagaccc tctcacacca ggttacccag caaatgaata tgcttatagg 840

cgtggaattg cagaggctgt tggtcttcca agtattcctg ttcatccaat tggatactat 900

gatgcacaga agctcctaga aaaaatgggt ggctcagcac caccagatag cagctggaga 960

ggaagtctca aagtgcccta caatgttgga cctggcttta ctggaaactt ttctacacaa 1020

aaagtcaaga tgcacatcca ctctaccaat gaagtgacaa gaatttacaa tgtgataggt 1080

actctcagag gagcagtgga accagacaga tatgtcattc tgggaggtca ccgggactca 1140

tgggtgtttg gtggtattga ccctcagagt ggagcagctg ttgttcatga aattgtgagg 1200

agctttggaa cactgaaaaa ggaagggtgg agacctagaa gaacaatttt gtttgcaagc 1260

tgggatgcag aagaatttgg tcttcttggt tctactgagt gggcagagga gaattcaaga 1320

ctccttcaag agcgtggcgt ggcttatatt aatgctgact catctataga aggaaactac 1380

actctgagag ttgattgtac accgctgatg tacagcttgg tacacaacct aacaaaagag 1440

ctgaaaagcc ctgatgaagg ctttgaaggc aaatctcttt atgaaagttg gactaaaaaa 1500

agtccttccc cagagttcag tggcatgccc aggataagca aattgggatc tggaaatgat 1560

tttgaggtgt tcttccaacg acttggaatt gcttcaggca gagcacggta tactaaaaat 1620

tgggaaacaa acaaattcag cggctatcca ctgtatcaca gtgtctatga aacatatgag 1680

ttggtggaaa agttttatga tccaatgttt aaatatcacc tcactgtggc ccaggttcga 1740

ggagggatgg tgtttgagct agccaattcc atagtgctcc cttttgattg tcgagattat 1800

gctgtagttt taagaaagta tgctgacaaa atctacagta tttctatgaa acatccacag 1860

gaaatgaaga catacagtgt atcatttgat tcactttttt ctgcagtaaa gaattttaca 1920

gaaattgctt ccaagttcag tgagagactc caggactttg acaaaagcaa cccaatagta 1980

ttaagaatga tgaatgatca actcatgttt ctggaaagag catttattga tccattaggg 2040

ttaccagaca ggccttttta taggcatgtc atctatgctc caagcagcca caacaagtat 2100

gcaggggagt cattcccagg aatttatgat gctctgtttg atattgaaag caaagtggac 2160

ccttccaagg cctggggaga agtgaagaga cagatttatg ttgcagcctt cacagtgcag 2220

gcagctgcag agactttgag tgaagtagcc 2250

<210> 3

<211> 739

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 3

Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val

1 5 10 15

Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile

20 25 30

Lys Ser Ser Ser Glu Ala Thr Asn Ile Ser Pro Gln His Asn Val Lys

35 40 45

Ala Phe Leu Asp Glu Met Lys Ala Glu Asn Ile Lys Lys Phe Leu Tyr

50 55 60

Leu Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln

65 70 75 80

Leu Ala Lys Gln Ile Gln Ala Glu Trp Lys Glu Phe Gly Leu Asp Ser

85 90 95

Val Glu Leu Ala His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Glu Thr

100 105 110

His Pro Asn Tyr Ile Ser Ile Ile Asp Glu Asp Gly Asn Glu Ile Phe

115 120 125

Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro Gly Tyr Glu Asn Ile Ser

130 135 140

Asp Val Val Pro Pro Tyr Ser Ala Phe Ser Pro Gln Gly Met Pro Glu

145 150 155 160

Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys

165 170 175

Leu Glu Arg Glu Leu Lys Ile Asn Cys Ser Gly Lys Ile Leu Ile Ala

180 185 190

Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu

195 200 205

Ala Gly Ala Lys Gly Ile Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe

210 215 220

Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly

225 230 235 240

Gly Val Gln Arg Gly Asn Val Leu Asn Leu Asn Gly Ala Gly Asp Pro

245 250 255

Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Glu Leu

260 265 270

Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr

275 280 285

Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser Ala Pro Pro

290 295 300

Asp Ser Ser Trp Lys Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro

305 310 315 320

Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met His Ile His

325 330 335

Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Ile Arg

340 345 350

Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp

355 360 365

Ala Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val

370 375 380

His Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Lys Gly Trp Arg

385 390 395 400

Pro Arg Arg Thr Ile Ile Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly

405 410 415

Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln

420 425 430

Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn

435 440 445

Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser Leu Val Tyr

450 455 460

Asn Leu Thr Lys Glu Leu Gln Ser Pro Asp Glu Gly Phe Glu Gly Lys

465 470 475 480

Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser Pro Ser Pro Glu Phe Ser

485 490 495

Gly Val Pro Arg Ile Asn Lys Leu Gly Ser Gly Asn Asp Phe Glu Val

500 505 510

Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys

515 520 525

Asn Trp Lys Thr Asn Lys Phe Ser Gly Tyr Pro Leu Tyr His Ser Val

530 535 540

Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys

545 550 555 560

Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Leu Val Phe Glu Leu

565 570 575

Ala Asp Ser Ile Val Leu Pro Phe Asp Cys Gln Asp Tyr Ala Val Val

580 585 590

Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Asn Leu Ala Met Lys His Pro

595 600 605

Glu Glu Leu Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala

610 615 620

Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Asn Gln Arg Leu Gln

625 630 635 640

Asp Phe Asp Lys Asn Asn Pro Leu Leu Val Arg Met Leu Asn Asp Gln

645 650 655

Leu Met Phe Leu Glu Arg Ala Phe Val Asp Pro Leu Gly Leu Pro Asp

660 665 670

Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys

675 680 685

Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile

690 695 700

Glu Ser Lys Val Asp Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln

705 710 715 720

Ile Tyr Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser

725 730 735

Glu Val Ala

<210> 4

<211> 2217

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 4

atggctagcg ccagacggcc cagatggctg tgcgccggag ccctggtgct ggccggagga 60

ttcttcctgc tgggcttcct gttcggctgg ttcatcaaga gcagcagcga ggccaccaac 120

atcagccccc agcacaacgt gaaggccttt ctggacgaga tgaaggccga gaacatcaag 180

aagtttctgt acctgttcac ccagatcccc cacctggccg gcaccgagca gaacttccag 240

ctggccaagc agattcaggc tgagtggaaa gagttcggcc tggacagcgt ggagctggcc 300

cactacgacg tgctgctgtc ctaccccaac gagacacacc ccaactacat cagcatcatc 360

gacgaggacg gcaacgagat tttcaacacc agcctgttcg agccccctcc ccctggctac 420

gagaacatct ccgacgtggt gcccccctac agcgccttca gccctcaggg aatgcctgaa 480

ggcgacctgg tgtacgtgaa ctacgcccgg accgaggact tcttcaagct ggaacgggag 540

ctgaagatca actgcagcgg caagatcctg atcgccagat acggcaaggt gttccggggc 600

aacaaagtga agaacgcaca gctggctgga gccaagggca tcatcctgta cagcgacccc 660

gccgactact tcgcccctgg cgtgaagtcc taccctgacg gctggaacct gcctggcggc 720

ggagtgcagc ggggcaacgt gctgaacctg aacggagccg gcgaccctct gaccccaggc 780

taccccgcca acgagtacgc ctaccggcgg gagctggccg aagccgtggg cctgcccagc 840

atccccgtgc accccatcgg ctactacgac gcccagaaac tgctggaaaa gatgggcggc 900

agcgcccctc ccgacagcag ctggaagggc agcctgaagg tgccctacaa cgtgggccct 960

ggcttcaccg gcaacttcag cacccagaaa gtgaagatgc acatccacag caccaacgaa 1020

gtgacccgga tctacaacgt gatcggcacc atcagaggcg ccgtggagcc cgacagatac 1080

gtgatcctgg gcggccaccg ggacgcctgg gtgttcggcg gcatcgaccc ccagagcgga 1140

gccgccgtgg tgcacgagat cgtgcggagc ttcggcaccc tgaagaagaa gggctggcgg 1200

cccagacgga ccatcatctt cgccagctgg gacgccgagg aattcggact gctgggctct 1260

accgagtggg ccgaggaaaa cagcagactg ctgcaggaac ggggcgtcgc ctacatcaac 1320

gccgacagct ccatcgaggg caactacacc ctgcgggtgg actgcacccc cctgatgtac 1380

agcctggtgt acaacctgac caaagagctg cagagccccg acgagggctt cgagggcaag 1440

agcctgtacg agagctggac caagaagtcc cccagccccg agttcagcgg cgtgccccgg 1500

atcaacaagc tgggcagcgg caacgacttc gaggtgttct tccagaggct gggcattgcc 1560

agcggcagag cccggtacac caagaactgg aaaaccaaca agttctccgg ctaccccctg 1620

taccacagcg tgtacgagac atacgaactg gtggagaagt tctacgaccc catgttcaag 1680

taccacctga ccgtggccca ggtccgggga gggctggtgt tcgaactggc cgacagcatc 1740

gtgctgccct tcgactgcca ggactatgct gtggtgctgc ggaagtacgc cgacaaaatc 1800

tacaacctgg ccatgaagca ccccgaggaa ctgaaaacct acagcgtgtc cttcgacagc 1860

ctgttcagcg ccgtgaagaa cttcaccgag atcgccagca agttcaacca gcggctgcag 1920

gacttcgaca agaacaaccc cctgctggtc cggatgctga acgaccagct gatgttcctg 1980

gaacgggcct tcgtggaccc cctgggcctg cctgaccggc ccttctaccg gcacgtgatc 2040

tatgccccca gcagccacaa caagtacgct ggcgagagct tccccggcat ctacgatgcc 2100

ctgttcgaca tcgagagcaa ggtggacccc agcaaggcct ggggcgaagt gaagcggcag 2160

atatacgtgg ccgccttcac agtgcaggcc gctgccgaga cactgagcga ggtggcc 2217

<210> 5

<211> 739

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 5

Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val

1 5 10 15

Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile

20 25 30

Lys Ser Ser Ser Glu Ala Thr Asn Ile Thr Pro Gln His Asn Val Lys

35 40 45

Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu Tyr

50 55 60

Asn Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Glu

65 70 75 80

Leu Ala Lys Gln Ile Gln Ala Gln Trp Lys Glu Phe Gly Leu Asp Ser

85 90 95

Val Glu Leu Ser His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Glu Thr

100 105 110

His Pro Asn Tyr Ile Ser Ile Ile Asp Glu Asp Gly Asn Glu Ile Phe

115 120 125

Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro Gly Tyr Glu Asn Ile Ser

130 135 140

Asp Val Val Pro Pro Tyr Ser Ala Phe Ser Pro Gln Gly Met Pro Glu

145 150 155 160

Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys

165 170 175

Leu Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile Leu Ile Ala

180 185 190

Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu

195 200 205

Ala Gly Ala Lys Gly Ile Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe

210 215 220

Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly

225 230 235 240

Gly Val Gln Arg Gly Asn Val Leu Asn Leu Asn Gly Ala Gly Asp Pro

245 250 255

Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile

260 265 270

Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr

275 280 285

Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ala Ala Pro Pro

290 295 300

Asp Ser Ser Trp Lys Gly Ser Leu Gln Val Pro Tyr Asn Val Gly Pro

305 310 315 320

Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met His Ile His

325 330 335

Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Lys

340 345 350

Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp

355 360 365

Ala Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val

370 375 380

His Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Lys Gly Trp Arg

385 390 395 400

Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly

405 410 415

Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln

420 425 430

Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn

435 440 445

Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser Leu Val Tyr

450 455 460

Asn Leu Thr Lys Glu Leu Gln Ser Pro Asp Glu Gly Phe Glu Gly Lys

465 470 475 480

Ser Leu Phe Asp Ser Trp Thr Glu Lys Ser Pro Ser Pro Glu Phe Ser

485 490 495

Gly Leu Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val

500 505 510

Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys

515 520 525

Asp Trp Lys Thr Ser Lys Phe Ser Gly Tyr Pro Leu Tyr His Ser Val

530 535 540

Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys

545 550 555 560

Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Ile Val Phe Glu Leu

565 570 575

Ala Asn Ser Val Val Leu Pro Phe Asp Cys Gln Asp Tyr Ala Val Val

580 585 590

Leu Lys Lys Tyr Ala Asp Lys Ile Tyr Asn Ile Ser Met Lys His Pro

595 600 605

Gln Glu Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala

610 615 620

Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Asn Gln Arg Leu Gln

625 630 635 640

Asp Phe Asp Lys Asn Asn Pro Ile Leu Leu Arg Met Met Asn Asp Gln

645 650 655

Leu Met Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp

660 665 670

Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys

675 680 685

Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile

690 695 700

Glu Ser Lys Val Asp Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln

705 710 715 720

Ile Tyr Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser

725 730 735

Glu Val Ala

<210> 6

<211> 2217

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 6

atggctagcg ccagacggcc cagatggctg tgtgctggcg ccctggtgct ggctggcggc 60

tttttcctgc tgggcttcct gttcggctgg ttcatcaaga gcagcagcga ggccaccaac 120

atcacccccc agcacaacgt gaaggccttt ctggacgagc tgaaggccga gaatatcaag 180

aagttcctgt acaacttcac ccagatcccc cacctggccg gcaccgagca gaacttcgag 240

ctggccaagc agatccaggc ccagtggaaa gagttcggcc tggacagcgt ggaactgagc 300

cactacgacg tgctgctgag ctaccccaac gagacacacc ccaactacat cagcatcatc 360

gacgaggacg gcaacgagat tttcaacacc agcctgttcg agccccctcc acccggctac 420

gagaacatca gcgacgtggt gcccccctac agcgcattca gtccacaggg aatgcccgag 480

ggcgacctgg tgtacgtgaa ctacgcccgg accgaggact tcttcaagct ggaacgggac 540

atgaagatca actgcagcgg caagatcctg atcgccagat acggcaaggt gttccggggc 600

aacaaagtga agaacgccca gctggcaggc gccaagggca tcatcctgta cagcgacccc 660

gccgactact tcgcccctgg cgtgaagtcc taccccgacg gctggaacct gcctggcggc 720

ggagtgcaga ggggcaacgt gctgaacctg aacggcgctg gcgaccctct gacccctggc 780

taccccgcca acgagtacgc ctacagacgg ggaatcgccg aggccgtggg cctgcctagc 840

atccctgtgc accccatcgg ctactacgac gcccagaaac tgctggaaaa gatgggcgga 900

gccgcccctc ccgacagctc ttggaagggc agcctgcagg tcccctacaa cgtgggccct 960

ggcttcaccg gcaacttcag cacccagaaa gtgaagatgc acatccacag caccaacgaa 1020

gtgacccgga tctacaacgt gatcggcacc ctgaagggcg ccgtggaacc cgacagatac 1080

gtgatcctgg gcggccaccg ggacgcctgg gtgttcggag gcatcgaccc tcagagcggc 1140

gctgccgtgg tgcacgagat cgtgcggagc ttcggcacac tgaagaagaa gggctggcgg 1200

cccagacgga ccatcctgtt cgccagctgg gacgccgagg aattcggcct gctgggcagc 1260

accgagtggg ccgaggaaaa cagtcggctg ctgcaggaac ggggcgtcgc ctacatcaac 1320

gccgacagca gcatcgaggg caactacacc ctgcgggtgg actgcacccc cctgatgtac 1380

agcctggtgt acaacctgac caaagagctg cagagccccg acgagggctt cgagggcaag 1440

tccctgttcg actcctggac cgagaagtcc cccagccccg agttcagcgg cctgcccaga 1500

atcagcaagc tgggcagcgg caacgacttc gaggtgttct tccagcggct gggaatcgcc 1560

agcggcagag cccggtacac caaggactgg aaaaccagca agttctccgg ctaccccctg 1620

taccacagcg tgtacgagac atacgagctg gtggaaaagt tctacgaccc catgttcaag 1680

taccacctga ccgtggccca ggtccgaggc ggcatcgtgt tcgaactggc caacagcgtg 1740

gtgctgccat tcgattgtca ggactacgcc gtggtgctga agaagtacgc cgacaaaatc 1800

tacaacatca gcatgaagca cccccaggaa atgaaaacct acagcgtgtc cttcgacagc 1860

ctgttcagcg ccgtgaagaa tttcaccgag atcgcctcca agttcaacca gagactgcag 1920

gacttcgaca agaacaaccc catcctgctg cggatgatga acgaccagct gatgttcctg 1980

gaacgggcct tcatcgaccc cctgggcctg cccgaccggc ccttttaccg gcacgtgatc 2040

tatgccccca gcagccacaa caaatacgcc ggcgagagtt tccccggcat ctacgatgcc 2100

ctgttcgata tcgagagcaa ggtggacccc agcaaggcct ggggcgaagt gaagcggcag 2160

atttacgtgg ccgcattcac agtgcaggct gctgccgaga cactgagcga ggtggcc 2217

<210> 7

<211> 739

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 7

Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val

1 5 10 15

Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile

20 25 30

Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr Pro Lys His Asn Met Lys

35 40 45

Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu Tyr

50 55 60

Asn Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln

65 70 75 80

Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys Glu Phe Gly Leu Asp Ser

85 90 95

Val Glu Leu Ala His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Lys Thr

100 105 110

His Pro Asn Tyr Ile Ser Ile Ile Asn Glu Asp Gly Asn Glu Ile Phe

115 120 125

Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro Gly Tyr Glu Asn Val Ser

130 135 140

Asp Ile Val Pro Pro Phe Ser Ala Phe Ser Pro Gln Gly Met Pro Glu

145 150 155 160

Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys

165 170 175

Leu Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile Val Ile Ala

180 185 190

Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu

195 200 205

Ala Gly Ala Lys Gly Val Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe

210 215 220

Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly

225 230 235 240

Gly Val Gln Arg Gly Asn Ile Leu Asn Leu Asn Gly Ala Gly Asp Pro

245 250 255

Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile

260 265 270

Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr

275 280 285

Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser Ala Pro Pro

290 295 300

Asp Ser Ser Trp Arg Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro

305 310 315 320

Gly Phe Thr Gly Asn Phe Ser Ala Gln Lys Leu Lys Leu His Ile His

325 330 335

Ser Asn Thr Lys Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Arg

340 345 350

Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp

355 360 365

Ser Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val

370 375 380

His Glu Ile Val Arg Thr Phe Gly Thr Leu Lys Lys Lys Gly Trp Arg

385 390 395 400

Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly

405 410 415

Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln

420 425 430

Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn

435 440 445

Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Leu His Ser Leu Val Tyr

450 455 460

Asn Leu Thr Lys Glu Leu Lys Ser Pro Asp Glu Gly Phe Glu Gly Lys

465 470 475 480

Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser Pro Ser Pro Glu Leu Ser

485 490 495

Gly Leu Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val

500 505 510

Phe Phe Gln Arg Leu Gly Ile Ser Ser Gly Arg Ala Arg Tyr Thr Lys

515 520 525

Asp Trp Lys Thr Ser Lys Phe Ser Ser Tyr Pro Leu Tyr His Ser Ile

530 535 540

Tyr Glu Thr Tyr Glu Leu Val Val Lys Phe Tyr Asp Pro Met Phe Lys

545 550 555 560

Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Met Val Phe Glu Leu

565 570 575

Ala Asn Ser Ile Val Leu Pro Phe Asp Cys Arg Asp Tyr Ala Val Ala

580 585 590

Leu Lys Asn His Ala Glu Asn Leu Tyr Ser Ile Ser Met Lys His Pro

595 600 605

Gln Glu Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala

610 615 620

Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Ser Glu Arg Leu Gln

625 630 635 640

Asp Phe Asp Lys Ser Asn Pro Ile Val Leu Arg Met Met Asn Asp Gln

645 650 655

Leu Met Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp

660 665 670

Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys

675 680 685

Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile

690 695 700

Glu Ser Lys Val Asp Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln

705 710 715 720

Ile Tyr Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser

725 730 735

Glu Val Ala

<210> 8

<211> 2217

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 8

atggctagcg ccagacggcc cagatggctg tgtgctggcg ccctggtgct ggctggcggc 60

tttttcctgc tgggcttcct gttcggctgg ttcatcaaga gcagcaacga ggccaccaac 120

atcaccccca agcacaacat gaaggccttt ctggacgagc tgaaggccga gaatatcaag 180

aagttcctgt acaacttcac ccagatcccc cacctggccg gcaccgagca gaacttccag 240

ctggccaagc agatccagag ccagtggaaa gagttcggcc tggacagcgt ggaactggcc 300

cactacgacg tgctgctgag ctaccccaac aagacccacc ccaactacat cagcatcatc 360

aacgaggacg gcaacgagat tttcaacacc agcctgttcg agccccctcc acccggctac 420

gagaacgtgt ccgacatcgt gcccccattc agcgcattca gtccacaggg aatgcccgag 480

ggcgacctgg tgtacgtgaa ctacgcccgg accgaggact tcttcaagct ggaacgggac 540

atgaagatca actgcagcgg caagatcgtg atcgccagat acggcaaggt gttccggggc 600

aacaaagtga agaacgccca gctggcaggc gccaagggcg tgatcctgta tagcgacccc 660

gccgactact tcgcccctgg cgtgaagtcc taccccgacg gctggaacct gcctggcggc 720

ggagtgcagc ggggcaacat cctgaacctg aacggcgctg gcgaccccct gacccctggc 780

tatcccgcca acgagtacgc ctacagacgg ggaatcgccg aggccgtggg cctgcctagc 840

atccctgtgc accccatcgg ctactacgac gcccagaaac tgctggaaaa gatgggcggc 900

agcgcccctc ccgatagctc ttggagaggc agcctgaagg tgccctacaa cgtgggccct 960

ggcttcaccg gcaacttcag cgcccagaag ctgaagctgc acatccacag caacaccaaa 1020

gtgacccgga tctacaacgt gatcggcacc ctgagaggcg ccgtggaacc cgacagatac 1080

gtgatcctgg gcggccaccg ggacagctgg gtgttcggcg gcatcgaccc tcagtctggc 1140

gccgctgtgg tgcacgagat cgtgcggacc tttggcaccc tgaagaagaa gggctggcgg 1200

cccagacgga ccatcctgtt cgccagctgg gacgccgagg aattcggcct gctgggcagc 1260

accgagtggg ccgaggaaaa cagtcggctg ctgcaggaac ggggcgtcgc ctacatcaac 1320

gccgacagca gcatcgaggg caactacacc ctgcgggtgg actgcacccc cctgctgcac 1380

agcctggtgt acaacctgac caaagagctg aagtcccccg acgagggctt cgagggcaag 1440

agcctgtacg agagctggac caagaagtcc cccagccccg agctgagcgg cctgcccaga 1500

atcagcaagc tgggcagcgg caacgacttc gaggtgttct tccagcggct gggcatcagc 1560

agcggcagag cccggtacac caaggactgg aaaaccagca agttcagcag ctaccccctg 1620

taccacagca tctacgagac atacgagctg gtggtcaagt tctacgaccc catgttcaag 1680

taccacctga ccgtggccca ggtccgaggc ggcatggtgt tcgagctggc caacagcatc 1740

gtgctgccct tcgactgccg ggactacgcc gtggccctga agaaccacgc cgagaacctg 1800

tacagcatca gcatgaagca cccccaggaa atgaaaacct acagcgtgtc cttcgacagc 1860

ctgttcagcg ccgtgaagaa tttcaccgag atcgcctcca agttcagcga gcggctgcag 1920

gacttcgaca agagcaaccc catcgtgctg agaatgatga acgaccagct gatgttcctg 1980

gaacgggcct tcatcgaccc cctgggcctg cccgaccggc ccttttaccg gcacgtgatc 2040

tatgccccca gcagccacaa caaatacgcc ggcgagagtt tccccggcat ctacgatgcc 2100

ctgttcgaca tcgagagcaa ggtggacccc agcaaggcct ggggcgaagt gaagcggcag 2160

atttacgtgg ccgcattcac agtgcaggcc gctgccgaga cactgagcga ggtggcc 2217

<210> 9

<211> 739

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 9

Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val

1 5 10 15

Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile

20 25 30

Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr Pro Lys His Asn Met Lys

35 40 45

Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu Tyr

50 55 60

Asn Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln

65 70 75 80

Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys Glu Phe Gly Leu Asp Ser

85 90 95

Val Glu Leu Ala His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Lys Thr

100 105 110

His Pro Asn Tyr Ile Ser Ile Ile Asn Glu Asp Gly Asn Glu Ile Phe

115 120 125

Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro Gly Tyr Glu Asn Val Ser

130 135 140

Asp Ile Val Pro Pro Phe Ser Ala Phe Ser Pro Gln Gly Met Pro Glu

145 150 155 160

Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys

165 170 175

Leu Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile Val Ile Ala

180 185 190

Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu

195 200 205

Ala Gly Ala Lys Gly Val Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe

210 215 220

Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly

225 230 235 240

Gly Val Gln Arg Gly Asn Ile Leu Asn Leu Asn Gly Ala Gly Asp Pro

245 250 255

Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile

260 265 270

Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr

275 280 285

Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser Ala Pro Pro

290 295 300

Asp Ser Ser Trp Arg Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro

305 310 315 320

Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met His Ile His

325 330 335

Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Arg

340 345 350

Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp

355 360 365

Ser Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val

370 375 380

His Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Glu Gly Trp Arg

385 390 395 400

Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly

405 410 415

Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln

420 425 430

Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn

435 440 445

Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser Leu Val His

450 455 460

Asn Leu Thr Lys Glu Leu Lys Ser Pro Asp Glu Gly Phe Glu Gly Lys

465 470 475 480

Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser Pro Ser Pro Glu Phe Ser

485 490 495

Gly Met Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val

500 505 510

Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys

515 520 525

Asn Trp Glu Thr Asn Lys Phe Ser Gly Tyr Pro Leu Tyr His Ser Val

530 535 540

Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys

545 550 555 560

Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Met Val Phe Glu Leu

565 570 575

Ala Asn Ser Ile Val Leu Pro Phe Asp Cys Arg Asp Tyr Ala Val Val

580 585 590

Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Ser Ile Ser Met Lys His Pro

595 600 605

Gln Glu Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala

610 615 620

Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Ser Glu Arg Leu Gln

625 630 635 640

Asp Phe Asp Lys Ser Asn Pro Ile Val Leu Arg Met Met Asn Asp Gln

645 650 655

Leu Met Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp

660 665 670

Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys

675 680 685

Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile

690 695 700

Glu Ser Lys Val Asp Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln

705 710 715 720

Ile Tyr Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser

725 730 735

Glu Val Ala

<210> 10

<211> 2217

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 10

atggctagcg cgcgccgccc gcgctggctg tgcgctgggg cgctggtgct ggcgggtggc 60

ttctttctcc tcggcttcct cttcgggtgg tttataaaat cctccaatga agctactaac 120

attactccaa agcataatat gaaagcattt ttggatgaat tgaaagctga gaacatcaag 180

aagttcttat ataattttac acagatacca catttagcag gaacagaaca aaactttcag 240

cttgcaaagc aaattcaatc ccagtggaaa gaatttggcc tggattctgt tgagctggca 300

cattatgatg tcctgttgtc ctacccaaat aagactcatc ccaactacat ctcaataatt 360

aatgaagatg gaaatgagat tttcaacaca tcattatttg aaccacctcc tccaggatat 420

gaaaatgttt cggatattgt accacctttc agtgctttct ctcctcaagg aatgccagag 480

ggcgatctag tgtatgttaa ctatgcacga actgaagact tctttaaatt ggaacgggac 540

atgaaaatca attgctctgg gaaaattgta attgccagat atgggaaagt tttcagagga 600

aataaggtta aaaatgccca gctggcaggg gccaaaggag tcattctcta ctccgaccct 660

gctgactact ttgctcctgg ggtgaagtcc tatccagatg gttggaatct tcctggaggt 720

ggtgtccagc gtggaaatat cctaaatctg aatggtgcag gagaccctct cacaccaggt 780

tacccagcaa atgaatatgc ttataggcgt ggaattgcag aggctgttgg tcttccaagt 840

attcctgttc atccaattgg atactatgat gcacagaagc tcctagaaaa aatgggtggc 900

tcagcaccac cagatagcag ctggagagga agtctcaaag tgccctacaa tgttggacct 960

ggctttactg gaaacttttc tacacaaaaa gtcaagatgc acatccactc taccaatgaa 1020

gtgacaagaa tttacaatgt gataggtact ctcagaggag cagtggaacc agacagatat 1080

gtcattctgg gaggtcaccg ggactcatgg gtgtttggtg gtattgaccc tcagagtgga 1140

gcagctgttg ttcatgaaat tgtgaggagc tttggaacac tgaaaaagga agggtggaga 1200

cctagaagaa caattttgtt tgcaagctgg gatgcagaag aatttggtct tcttggttct 1260

actgagtggg cagaggagaa ttcaagactc cttcaagagc gtggcgtggc ttatattaat 1320

gctgactcat ctatagaagg aaactacact ctgagagttg attgtacacc gctgatgtac 1380

agcttggtac acaacctaac aaaagagctg aaaagccctg atgaaggctt tgaaggcaaa 1440

tctctttatg aaagttggac taaaaaaagt ccttccccag agttcagtgg catgcccagg 1500

ataagcaaat tgggatctgg aaatgatttt gaggtgttct tccaacgact tggaattgct 1560

tcaggcagag cacggtatac taaaaattgg gaaacaaaca aattcagcgg ctatccactg 1620

tatcacagtg tctatgaaac atatgagttg gtggaaaagt tttatgatcc aatgtttaaa 1680

tatcacctca ctgtggccca ggttcgagga gggatggtgt ttgagctggc caattccata 1740

gtgctccctt ttgattgtcg agattatgct gtagttttaa gaaagtatgc tgacaaaatc 1800

tacagtattt ctatgaaaca tccacaggaa atgaagacat acagtgtatc atttgattca 1860

cttttttctg cagtaaagaa ttttacagaa attgcttcca agttcagtga gagactccag 1920

gactttgaca aaagcaaccc aatagtatta agaatgatga atgatcaact catgtttctg 1980

gaaagagcat ttattgatcc attagggtta ccagacaggc ctttttatag gcatgtcatc 2040

tatgctccaa gcagccacaa caagtatgca ggggagtcat tcccaggaat ttatgatgct 2100

ctgtttgata ttgaaagcaa agtggaccct tccaaggcct ggggagaagt gaagagacag 2160

atttatgttg cagccttcac agtgcaggca gctgcagaga ctttgagtga agtagcc 2217

<210> 11

<211> 710

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 11

Met Ala Ser Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr Pro Lys His

1 5 10 15

Asn Met Lys Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys

20 25 30

Phe Leu Tyr Asn Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln

35 40 45

Asn Phe Gln Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys Glu Phe Gly

50 55 60

Leu Asp Ser Val Glu Leu Ala His Tyr Asp Val Leu Leu Ser Tyr Pro

65 70 75 80

Asn Lys Thr His Pro Asn Tyr Ile Ser Ile Ile Asn Glu Asp Gly Asn

85 90 95

Glu Ile Phe Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro Gly Tyr Glu

100 105 110

Asn Val Ser Asp Ile Val Pro Pro Phe Ser Ala Phe Ser Pro Gln Gly

115 120 125

Met Pro Glu Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp

130 135 140

Phe Phe Lys Leu Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile

145 150 155 160

Val Ile Ala Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn

165 170 175

Ala Gln Leu Ala Gly Ala Lys Gly Val Ile Leu Tyr Ser Asp Pro Ala

180 185 190

Asp Tyr Phe Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu

195 200 205

Pro Gly Gly Gly Val Gln Arg Gly Asn Ile Leu Asn Leu Asn Gly Ala

210 215 220

Gly Asp Pro Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg

225 230 235 240

Arg Gly Ile Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro

245 250 255

Ile Gly Tyr Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser

260 265 270

Ala Pro Pro Asp Ser Ser Trp Arg Gly Ser Leu Lys Val Pro Tyr Asn

275 280 285

Val Gly Pro Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met

290 295 300

His Ile His Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn Val Ile Gly

305 310 315 320

Thr Leu Arg Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly

325 330 335

His Arg Asp Ser Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala

340 345 350

Ala Val Val His Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Glu

355 360 365

Gly Trp Arg Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu

370 375 380

Glu Phe Gly Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg

385 390 395 400

Leu Leu Gln Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile

405 410 415

Glu Gly Asn Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser

420 425 430

Leu Val His Asn Leu Thr Lys Glu Leu Lys Ser Pro Asp Glu Gly Phe

435 440 445

Glu Gly Lys Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser Pro Ser Pro

450 455 460

Glu Phe Ser Gly Met Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp

465 470 475 480

Phe Glu Val Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg

485 490 495

Tyr Thr Lys Asn Trp Glu Thr Asn Lys Phe Ser Gly Tyr Pro Leu Tyr

500 505 510

His Ser Val Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro

515 520 525

Met Phe Lys Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Met Val

530 535 540

Phe Glu Leu Ala Asn Ser Ile Val Leu Pro Phe Asp Cys Arg Asp Tyr

545 550 555 560

Ala Val Val Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Ser Ile Ser Met

565 570 575

Lys His Pro Gln Glu Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu

580 585 590

Phe Ser Ala Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Ser Glu

595 600 605

Arg Leu Gln Asp Phe Asp Lys Ser Asn Pro Ile Val Leu Arg Met Met

610 615 620

Asn Asp Gln Leu Met Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly

625 630 635 640

Leu Pro Asp Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser

645 650 655

His Asn Lys Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu

660 665 670

Phe Asp Ile Glu Ser Lys Val Asp Pro Ser Lys Ala Trp Gly Glu Val

675 680 685

Lys Arg Gln Ile Tyr Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu

690 695 700

Thr Leu Ser Glu Val Ala

705 710

<210> 12

<211> 2130

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 12

atggctagca aatcctccaa tgaagctact aacattactc caaagcataa tatgaaagca 60

tttttggatg aattgaaagc tgagaacatc aagaagttct tatataattt tacacagata 120

ccacatttag caggaacaga acaaaacttt cagcttgcaa agcaaattca atcccagtgg 180

aaagaatttg gcctggattc tgttgagctg gcacattatg atgtcctgtt gtcctaccca 240

aataagactc atcccaacta catctcaata attaatgaag atggaaatga gattttcaac 300

acatcattat ttgaaccacc tcctccagga tatgaaaatg tttcggatat tgtaccacct 360

ttcagtgctt tctctcctca aggaatgcca gagggcgatc tagtgtatgt taactatgca 420

cgaactgaag acttctttaa attggaacgg gacatgaaaa tcaattgctc tgggaaaatt 480

gtaattgcca gatatgggaa agttttcaga ggaaataagg ttaaaaatgc ccagctggca 540

ggggccaaag gagtcattct ctactccgac cctgctgact actttgctcc tggggtgaag 600

tcctatccag atggttggaa tcttcctgga ggtggtgtcc agcgtggaaa tatcctaaat 660

ctgaatggtg caggagaccc tctcacacca ggttacccag caaatgaata tgcttatagg 720

cgtggaattg cagaggctgt tggtcttcca agtattcctg ttcatccaat tggatactat 780

gatgcacaga agctcctaga aaaaatgggt ggctcagcac caccagatag cagctggaga 840

ggaagtctca aagtgcccta caatgttgga cctggcttta ctggaaactt ttctacacaa 900

aaagtcaaga tgcacatcca ctctaccaat gaagtgacaa gaatttacaa tgtgataggt 960

actctcagag gagcagtgga accagacaga tatgtcattc tgggaggtca ccgggactca 1020

tgggtgtttg gtggtattga ccctcagagt ggagcagctg ttgttcatga aattgtgagg 1080

agctttggaa cactgaaaaa ggaagggtgg agacctagaa gaacaatttt gtttgcaagc 1140

tgggatgcag aagaatttgg tcttcttggt tctactgagt gggcagagga gaattcaaga 1200

ctccttcaag agcgtggcgt ggcttatatt aatgctgact catctataga aggaaactac 1260

actctgagag ttgattgtac accgctgatg tacagcttgg tacacaacct aacaaaagag 1320

ctgaaaagcc ctgatgaagg ctttgaaggc aaatctcttt atgaaagttg gactaaaaaa 1380

agtccttccc cagagttcag tggcatgccc aggataagca aattgggatc tggaaatgat 1440

tttgaggtgt tcttccaacg acttggaatt gcttcaggca gagcacggta tactaaaaat 1500

tgggaaacaa acaaattcag cggctatcca ctgtatcaca gtgtctatga aacatatgag 1560

ttggtggaaa agttttatga tccaatgttt aaatatcacc tcactgtggc ccaggttcga 1620

ggagggatgg tgtttgagct ggccaattcc atagtgctcc cttttgattg tcgagattat 1680

gctgtagttt taagaaagta tgctgacaaa atctacagta tttctatgaa acatccacag 1740

gaaatgaaga catacagtgt atcatttgat tcactttttt ctgcagtaaa gaattttaca 1800

gaaattgctt ccaagttcag tgagagactc caggactttg acaaaagcaa cccaatagta 1860

ttaagaatga tgaatgatca actcatgttt ctggaaagag catttattga tccattaggg 1920

ttaccagaca ggccttttta taggcatgtc atctatgctc caagcagcca caacaagtat 1980

gcaggggagt cattcccagg aatttatgat gctctgtttg atattgaaag caaagtggac 2040

ccttccaagg cctggggaga agtgaagaga cagatttatg ttgcagcctt cacagtgcag 2100

gcagctgcag agactttgag tgaagtagcc 2130

<210> 13

<211> 732

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 13

Met Ala Ser Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp

1 5 10 15

Val Pro Gly Ser Thr Gly Asp Ala Ala Lys Ser Ser Asn Glu Ala Thr

20 25 30

Asn Ile Thr Pro Lys His Asn Met Lys Ala Phe Leu Asp Glu Leu Lys

35 40 45

Ala Glu Asn Ile Lys Lys Phe Leu Tyr Asn Phe Thr Gln Ile Pro His

50 55 60

Leu Ala Gly Thr Glu Gln Asn Phe Gln Leu Ala Lys Gln Ile Gln Ser

65 70 75 80

Gln Trp Lys Glu Phe Gly Leu Asp Ser Val Glu Leu Ala His Tyr Asp

85 90 95

Val Leu Leu Ser Tyr Pro Asn Lys Thr His Pro Asn Tyr Ile Ser Ile

100 105 110

Ile Asn Glu Asp Gly Asn Glu Ile Phe Asn Thr Ser Leu Phe Glu Pro

115 120 125

Pro Pro Pro Gly Tyr Glu Asn Val Ser Asp Ile Val Pro Pro Phe Ser

130 135 140

Ala Phe Ser Pro Gln Gly Met Pro Glu Gly Asp Leu Val Tyr Val Asn

145 150 155 160

Tyr Ala Arg Thr Glu Asp Phe Phe Lys Leu Glu Arg Asp Met Lys Ile

165 170 175

Asn Cys Ser Gly Lys Ile Val Ile Ala Arg Tyr Gly Lys Val Phe Arg

180 185 190

Gly Asn Lys Val Lys Asn Ala Gln Leu Ala Gly Ala Lys Gly Val Ile

195 200 205

Leu Tyr Ser Asp Pro Ala Asp Tyr Phe Ala Pro Gly Val Lys Ser Tyr

210 215 220

Pro Asp Gly Trp Asn Leu Pro Gly Gly Gly Val Gln Arg Gly Asn Ile

225 230 235 240

Leu Asn Leu Asn Gly Ala Gly Asp Pro Leu Thr Pro Gly Tyr Pro Ala

245 250 255

Asn Glu Tyr Ala Tyr Arg Arg Gly Ile Ala Glu Ala Val Gly Leu Pro

260 265 270

Ser Ile Pro Val His Pro Ile Gly Tyr Tyr Asp Ala Gln Lys Leu Leu

275 280 285

Glu Lys Met Gly Gly Ser Ala Pro Pro Asp Ser Ser Trp Arg Gly Ser

290 295 300

Leu Lys Val Pro Tyr Asn Val Gly Pro Gly Phe Thr Gly Asn Phe Ser

305 310 315 320

Thr Gln Lys Val Lys Met His Ile His Ser Thr Asn Glu Val Thr Arg

325 330 335

Ile Tyr Asn Val Ile Gly Thr Leu Arg Gly Ala Val Glu Pro Asp Arg

340 345 350

Tyr Val Ile Leu Gly Gly His Arg Asp Ser Trp Val Phe Gly Gly Ile

355 360 365

Asp Pro Gln Ser Gly Ala Ala Val Val His Glu Ile Val Arg Ser Phe

370 375 380

Gly Thr Leu Lys Lys Glu Gly Trp Arg Pro Arg Arg Thr Ile Leu Phe

385 390 395 400

Ala Ser Trp Asp Ala Glu Glu Phe Gly Leu Leu Gly Ser Thr Glu Trp

405 410 415

Ala Glu Glu Asn Ser Arg Leu Leu Gln Glu Arg Gly Val Ala Tyr Ile

420 425 430

Asn Ala Asp Ser Ser Ile Glu Gly Asn Tyr Thr Leu Arg Val Asp Cys

435 440 445

Thr Pro Leu Met Tyr Ser Leu Val His Asn Leu Thr Lys Glu Leu Lys

450 455 460

Ser Pro Asp Glu Gly Phe Glu Gly Lys Ser Leu Tyr Glu Ser Trp Thr

465 470 475 480

Lys Lys Ser Pro Ser Pro Glu Phe Ser Gly Met Pro Arg Ile Ser Lys

485 490 495

Leu Gly Ser Gly Asn Asp Phe Glu Val Phe Phe Gln Arg Leu Gly Ile

500 505 510

Ala Ser Gly Arg Ala Arg Tyr Thr Lys Asn Trp Glu Thr Asn Lys Phe

515 520 525

Ser Gly Tyr Pro Leu Tyr His Ser Val Tyr Glu Thr Tyr Glu Leu Val

530 535 540

Glu Lys Phe Tyr Asp Pro Met Phe Lys Tyr His Leu Thr Val Ala Gln

545 550 555 560

Val Arg Gly Gly Met Val Phe Glu Leu Ala Asn Ser Ile Val Leu Pro

565 570 575

Phe Asp Cys Arg Asp Tyr Ala Val Val Leu Arg Lys Tyr Ala Asp Lys

580 585 590

Ile Tyr Ser Ile Ser Met Lys His Pro Gln Glu Met Lys Thr Tyr Ser

595 600 605

Val Ser Phe Asp Ser Leu Phe Ser Ala Val Lys Asn Phe Thr Glu Ile

610 615 620

Ala Ser Lys Phe Ser Glu Arg Leu Gln Asp Phe Asp Lys Ser Asn Pro

625 630 635 640

Ile Val Leu Arg Met Met Asn Asp Gln Leu Met Phe Leu Glu Arg Ala

645 650 655

Phe Ile Asp Pro Leu Gly Leu Pro Asp Arg Pro Phe Tyr Arg His Val

660 665 670

Ile Tyr Ala Pro Ser Ser His Asn Lys Tyr Ala Gly Glu Ser Phe Pro

675 680 685

Gly Ile Tyr Asp Ala Leu Phe Asp Ile Glu Ser Lys Val Asp Pro Ser

690 695 700

Lys Ala Trp Gly Glu Val Lys Arg Gln Ile Tyr Val Ala Ala Phe Thr

705 710 715 720

Val Gln Ala Ala Ala Glu Thr Leu Ser Glu Val Ala

725 730

<210> 14

<211> 2196

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 14

atggctagcg aaaccgacac tttgttgttg tgggtgcttt tgctttgggt acccggatct 60

actggtgatg ctgctaaatc ctccaatgaa gctactaaca ttactccaaa gcataatatg 120

aaagcatttt tggatgaatt gaaagctgag aacatcaaga agttcttata taattttaca 180

cagataccac atttagcagg aacagaacaa aactttcagc ttgcaaagca aattcaatcc 240

cagtggaaag aatttggcct ggattctgtt gagctagcac attatgatgt cctgttgtcc 300

tacccaaata agactcatcc caactacatc tcaataatta atgaagatgg aaatgagatt 360

ttcaacacat cattatttga accacctcct ccaggatatg aaaatgtttc ggatattgta 420

ccacctttca gtgctttctc tcctcaagga atgccagagg gcgatctagt gtatgttaac 480

tatgcacgaa ctgaagactt ctttaaattg gaacgggaca tgaaaatcaa ttgctctggg 540

aaaattgtaa ttgccagata tgggaaagtt ttcagaggaa ataaggttaa aaatgcccag 600

ctggcagggg ccaaaggagt cattctctac tccgaccctg ctgactactt tgctcctggg 660

gtgaagtcct atccagatgg ttggaatctt cctggaggtg gtgtccagcg tggaaatatc 720

ctaaatctga atggtgcagg agaccctctc acaccaggtt acccagcaaa tgaatatgct 780

tataggcgtg gaattgcaga ggctgttggt cttccaagta ttcctgttca tccaattgga 840

tactatgatg cacagaagct cctagaaaaa atgggtggct cagcaccacc agatagcagc 900

tggagaggaa gtctcaaagt gccctacaat gttggacctg gctttactgg aaacttttct 960

acacaaaaag tcaagatgca catccactct accaatgaag tgacaagaat ttacaatgtg 1020

ataggtactc tcagaggagc agtggaacca gacagatatg tcattctggg aggtcaccgg 1080

gactcatggg tgtttggtgg tattgaccct cagagtggag cagctgttgt tcatgaaatt 1140

gtgaggagct ttggaacact gaaaaaggaa gggtggagac ctagaagaac aattttgttt 1200

gcaagctggg atgcagaaga atttggtctt cttggttcta ctgagtgggc agaggagaat 1260

tcaagactcc ttcaagagcg tggcgtggct tatattaatg ctgactcatc tatagaagga 1320

aactacactc tgagagttga ttgtacaccg ctgatgtaca gcttggtaca caacctaaca 1380

aaagagctga aaagccctga tgaaggcttt gaaggcaaat ctctttatga aagttggact 1440

aaaaaaagtc cttccccaga gttcagtggc atgcccagga taagcaaatt gggatctgga 1500

aatgattttg aggtgttctt ccaacgactt ggaattgctt caggcagagc acggtatact 1560

aaaaattggg aaacaaacaa attcagcggc tatccactgt atcacagtgt ctatgaaaca 1620

tatgagttgg tggaaaagtt ttatgatcca atgtttaaat atcacctcac tgtggcccag 1680

gttcgaggag ggatggtgtt tgagctagcc aattccatag tgctcccttt tgattgtcga 1740

gattatgctg tagttttaag aaagtatgct gacaaaatct acagtatttc tatgaaacat 1800

ccacaggaaa tgaagacata cagtgtatca tttgattcac ttttttctgc agtaaagaat 1860

tttacagaaa ttgcttccaa gttcagtgag agactccagg actttgacaa aagcaaccca 1920

atagtattaa gaatgatgaa tgatcaactc atgtttctgg aaagagcatt tattgatcca 1980

ttagggttac cagacaggcc tttttatagg catgtcatct atgctccaag cagccacaac 2040

aagtatgcag gggagtcatt cccaggaatt tatgatgctc tgtttgatat tgaaagcaaa 2100

gtggaccctt ccaaggcctg gggagaagtg aagagacaga tttatgttgc agccttcaca 2160

gtgcaggcag ctgcagagac tttgagtgaa gtagcc 2196

<210> 15

<211> 263

<212> ПРТ

<213> Homo sapiens

<400> 15

Met Ala Ser Trp Val Pro Val Val Phe Leu Thr Leu Ser Val Thr Trp

1 5 10 15

Ile Gly Ala Ala Pro Leu Ile Leu Ser Arg Ile Val Gly Gly Trp Glu

20 25 30

Cys Glu Lys His Ser Gln Pro Trp Gln Val Leu Val Ala Ser Arg Gly

35 40 45

Arg Ala Val Cys Gly Gly Val Leu Val His Pro Gln Trp Val Leu Thr

50 55 60

Ala Ala His Cys Ile Arg Asn Lys Ser Val Ile Leu Leu Gly Arg His

65 70 75 80

Ser Leu Phe His Pro Glu Asp Thr Gly Gln Val Phe Gln Val Ser His

85 90 95

Ser Phe Pro His Pro Leu Tyr Asp Met Ser Leu Leu Lys Asn Arg Phe

100 105 110

Leu Arg Pro Gly Asp Asp Ser Ser His Asp Leu Met Leu Leu Arg Leu

115 120 125

Ser Glu Pro Ala Glu Leu Thr Asp Ala Val Lys Val Met Asp Leu Pro

130 135 140

Thr Gln Glu Pro Ala Leu Gly Thr Thr Cys Tyr Ala Ser Gly Trp Gly

145 150 155 160

Ser Ile Glu Pro Glu Glu Phe Leu Thr Pro Lys Lys Leu Gln Cys Val

165 170 175

Asp Leu His Val Ile Ser Asn Asp Val Cys Ala Gln Val His Pro Gln

180 185 190

Lys Val Thr Lys Phe Met Leu Cys Ala Gly Arg Trp Thr Gly Gly Lys

195 200 205

Ser Thr Cys Ser Gly Asp Ser Gly Gly Pro Leu Val Cys Asn Gly Val

210 215 220

Leu Gln Gly Ile Thr Ser Trp Gly Ser Glu Pro Cys Ala Leu Pro Glu

225 230 235 240

Arg Pro Ser Leu Tyr Thr Lys Val Val His Tyr Arg Lys Trp Ile Lys

245 250 255

Asp Thr Ile Val Ala Asn Pro

260

<210> 16

<211> 789

<212> ДНК

<213> Homo sapiens

<400> 16

atggctagct gggtcccggt tgtcttcctc accctgtccg tgacgtggat tggcgctgcg 60

cccctcatcc tgtctcggat tgtgggaggc tgggagtgcg agaagcattc ccaaccctgg 120

caggtgcttg tggcctctcg tggcagggca gtctgcggcg gtgttctggt gcacccccag 180

tgggtcctca cagctgccca ctgcatcagg aacaaaagcg tgatcttgct gggtcggcac 240

agcttgtttc atcctgaaga cacaggccag gtatttcagg tcagccacag cttcccacac 300

ccgctctacg atatgagcct cctgaagaat cgattcctca ggccaggtga tgactccagc 360

cacgacctca tgctgctccg cctgtcagag cctgccgagc tcacggatgc tgtgaaggtc 420

atggacctgc ccacccagga gccagcactg gggaccacct gctacgcctc aggctggggc 480

agcattgaac cagaggagtt cttgacccca aagaaacttc agtgtgtgga cctccatgtt 540

atttccaatg acgtgtgtgc gcaagttcac cctcagaagg tgaccaagtt catgctgtgt 600

gctggacgct ggacaggggg caaaagcacc tgctcgggtg attctggggg cccacttgtc 660

tgtaatggtg tgcttcaagg tatcacgtca tggggcagtg aaccatgtgc cctgcccgaa 720

aggccttccc tgtacaccaa ggtggtgcat taccggaagt ggatcaagga caccatcgtg 780

gccaacccc 789

<210> 17

<211> 240

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 17

Met Ala Ser Ile Val Gly Gly Trp Glu Cys Glu Lys His Ser Gln Pro

1 5 10 15

Trp Gln Val Leu Val Ala Ser Arg Gly Arg Ala Val Cys Gly Gly Val

20 25 30

Leu Val His Pro Gln Trp Val Leu Thr Ala Ala His Cys Ile Arg Asn

35 40 45

Lys Ser Val Ile Leu Leu Gly Arg His Ser Leu Phe His Pro Glu Asp

50 55 60

Thr Gly Gln Val Phe Gln Val Ser His Ser Phe Pro His Pro Leu Tyr

65 70 75 80

Asp Met Ser Leu Leu Lys Asn Arg Phe Leu Arg Pro Gly Asp Asp Ser

85 90 95

Ser His Asp Leu Met Leu Leu Arg Leu Ser Glu Pro Ala Glu Leu Thr

100 105 110

Asp Ala Val Lys Val Met Asp Leu Pro Thr Gln Glu Pro Ala Leu Gly

115 120 125

Thr Thr Cys Tyr Ala Ser Gly Trp Gly Ser Ile Glu Pro Glu Glu Phe

130 135 140

Leu Thr Pro Lys Lys Leu Gln Cys Val Asp Leu His Val Ile Ser Asn

145 150 155 160

Asp Val Cys Ala Gln Val His Pro Gln Lys Val Thr Lys Phe Met Leu

165 170 175

Cys Ala Gly Arg Trp Thr Gly Gly Lys Ser Thr Cys Ser Gly Asp Ser

180 185 190

Gly Gly Pro Leu Val Cys Asn Gly Val Leu Gln Gly Ile Thr Ser Trp

195 200 205

Gly Ser Glu Pro Cys Ala Leu Pro Glu Arg Pro Ser Leu Tyr Thr Lys

210 215 220

Val Val His Tyr Arg Lys Trp Ile Lys Asp Thr Ile Val Ala Asn Pro

225 230 235 240

<210> 18

<211> 720

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 18

atggctagca ttgtgggagg ctgggagtgc gagaagcatt cccaaccctg gcaggtgctt 60

gtggcctctc gtggcagggc agtctgcggc ggtgttctgg tgcaccccca gtgggtcctc 120

acagctgccc actgcatcag gaacaaaagc gtgatcttgc tgggtcggca cagcttgttt 180

catcctgaag acacaggcca ggtatttcag gtcagccaca gcttcccaca cccgctctac 240

gatatgagcc tcctgaagaa tcgattcctc aggccaggtg atgactccag ccacgacctc 300

atgctgctcc gcctgtcaga gcctgccgag ctcacggatg ctgtgaaggt catggacctg 360

cccacccagg agccagcact ggggaccacc tgctacgcct caggctgggg cagcattgaa 420

ccagaggagt tcttgacccc aaagaaactt cagtgtgtgg acctccatgt tatttccaat 480

gacgtgtgtg cgcaagttca ccctcagaag gtgaccaagt tcatgctgtg tgctggacgc 540

tggacagggg gcaaaagcac ctgctcgggt gattctgggg gcccacttgt ctgtaatggt 600

gtgcttcaag gtatcacgtc atggggcagt gaaccatgtg ccctgcccga aaggccttcc 660

ctgtacacca aggtggtgca ttaccggaag tggatcaagg acaccatcgt ggccaacccc 720

<210> 19

<211> 281

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 19

Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val

1 5 10 15

Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile

20 25 30

Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr Pro Gly Ile Val Gly Gly

35 40 45

Trp Glu Cys Glu Lys His Ser Gln Pro Trp Gln Val Leu Val Ala Ser

50 55 60

Arg Gly Arg Ala Val Cys Gly Gly Val Leu Val His Pro Gln Trp Val

65 70 75 80

Leu Thr Ala Ala His Cys Ile Arg Asn Lys Ser Val Ile Leu Leu Gly

85 90 95

Arg His Ser Leu Phe His Pro Glu Asp Thr Gly Gln Val Phe Gln Val

100 105 110

Ser His Ser Phe Pro His Pro Leu Tyr Asp Met Ser Leu Leu Lys Asn

115 120 125

Arg Phe Leu Arg Pro Gly Asp Asp Ser Ser His Asp Leu Met Leu Leu

130 135 140

Arg Leu Ser Glu Pro Ala Glu Leu Thr Asp Ala Val Lys Val Met Asp

145 150 155 160

Leu Pro Thr Gln Glu Pro Ala Leu Gly Thr Thr Cys Tyr Ala Ser Gly

165 170 175

Trp Gly Ser Ile Glu Pro Glu Glu Phe Leu Thr Pro Lys Lys Leu Gln

180 185 190

Cys Val Asp Leu His Val Ile Ser Asn Asp Val Cys Ala Gln Val His

195 200 205

Pro Gln Lys Val Thr Lys Phe Met Leu Cys Ala Gly Arg Trp Thr Gly

210 215 220

Gly Lys Ser Thr Cys Ser Gly Asp Ser Gly Gly Pro Leu Val Cys Asn

225 230 235 240

Gly Val Leu Gln Gly Ile Thr Ser Trp Gly Ser Glu Pro Cys Ala Leu

245 250 255

Pro Glu Arg Pro Ser Leu Tyr Thr Lys Val Val His Tyr Arg Lys Trp

260 265 270

Ile Lys Asp Thr Ile Val Ala Asn Pro

275 280

<210> 20

<211> 846

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 20

atggctagcg cgcgccgccc gcgctggctg tgcgctgggg cgctggtgct ggcgggtggc 60

ttctttctcc tcggcttcct cttcgggtgg tttataaaat cctccaatga agctactaac 120

attactccag gaattgtggg aggctgggag tgcgagaagc attcccaacc ctggcaggtg 180

cttgtggcct ctcgtggcag ggcagtctgc ggcggtgttc tggtgcaccc ccagtgggtc 240

ctcacagctg cccactgcat caggaacaaa agcgtgatct tgctgggtcg gcacagcttg 300

tttcatcctg aagacacagg ccaggtattt caggtcagcc acagcttccc acacccgctc 360

tacgatatga gcctcctgaa gaatcgattc ctcaggccag gtgatgactc cagccacgac 420

ctcatgctgc tccgcctgtc agagcctgcc gagctcacgg atgctgtgaa ggtcatggac 480

ctgcccaccc aggagccagc actggggacc acctgctacg cctcaggctg gggcagcatt 540

gaaccagagg agttcttgac cccaaagaaa cttcagtgtg tggacctcca tgttatttcc 600

aatgacgtgt gtgcgcaagt tcaccctcag aaggtgacca agttcatgct gtgtgctgga 660

cgctggacag ggggcaaaag cacctgctcg ggtgattctg ggggcccact tgtctgtaat 720

ggtgtgcttc aaggtatcac gtcatggggc agtgaaccat gtgccctgcc cgaaaggcct 780

tccctgtaca ccaaggtggt gcattaccgg aagtggatca aggacaccat cgtggccaac 840

ccctga 846

<210> 21

<211> 125

<212> ПРТ

<213> Homo sapiens

<400> 21

Met Ala Ser Lys Ala Val Leu Leu Ala Leu Leu Met Ala Gly Leu Ala

1 5 10 15

Leu Gln Pro Gly Thr Ala Leu Leu Cys Tyr Ser Cys Lys Ala Gln Val

20 25 30

Ser Asn Glu Asp Cys Leu Gln Val Glu Asn Cys Thr Gln Leu Gly Glu

35 40 45

Gln Cys Trp Thr Ala Arg Ile Arg Ala Val Gly Leu Leu Thr Val Ile

50 55 60

Ser Lys Gly Cys Ser Leu Asn Cys Val Asp Asp Ser Gln Asp Tyr Tyr

65 70 75 80

Val Gly Lys Lys Asn Ile Thr Cys Cys Asp Thr Asp Leu Cys Asn Ala

85 90 95

Ser Gly Ala His Ala Leu Gln Pro Ala Ala Ala Ile Leu Ala Leu Leu

100 105 110

Pro Ala Leu Gly Leu Leu Leu Trp Gly Pro Gly Gln Leu

115 120 125

<210> 22

<211> 375

<212> ДНК

<213> Homo sapiens

<400> 22

atggctagca aggctgtgct gcttgccctg ttgatggcag gcttggccct gcagccaggc 60

actgccctgc tgtgctactc ctgcaaagcc caggtgagca acgaggactg cctgcaggtg 120

gagaactgca cccagctggg ggagcagtgc tggaccgcgc gcatccgcgc agttggcctc 180

ctgaccgtca tcagcaaagg ctgcagcttg aactgcgtgg atgactcaca ggactactac 240

gtgggcaaga agaacatcac gtgctgtgac accgacttgt gcaacgccag cggggcccat 300

gccctgcagc cggctgccgc catccttgcg ctgctccctg cactcggcct gctgctctgg 360

ggacccggcc agcta 375

<210> 23

<211> 5964

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 23

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcgcgcgcc gcccgcgctg gctgtgcgct ggggcgctgg tgctggcggg 2040

tggcttcttt ctcctcggct tcctcttcgg gtggtttata aaatcctcca atgaagctac 2100

taacattact ccaaagcata atatgaaagc atttttggat gaattgaaag ctgagaacat 2160

caagaagttc ttatataatt ttacacagat accacattta gcaggaacag aacaaaactt 2220

tcagcttgca aagcaaattc aatcccagtg gaaagaattt ggcctggatt ctgttgagct 2280

ggcacattat gatgtcctgt tgtcctaccc aaataagact catcccaact acatctcaat 2340

aattaatgaa gatggaaatg agattttcaa cacatcatta tttgaaccac ctcctccagg 2400

atatgaaaat gtttcggata ttgtaccacc tttcagtgct ttctctcctc aaggaatgcc 2460

agagggcgat ctagtgtatg ttaactatgc acgaactgaa gacttcttta aattggaacg 2520

ggacatgaaa atcaattgct ctgggaaaat tgtaattgcc agatatggga aagttttcag 2580

aggaaataag gttaaaaatg cccagctggc aggggccaaa ggagtcattc tctactccga 2640

ccctgctgac tactttgctc ctggggtgaa gtcctatcca gatggttgga atcttcctgg 2700

aggtggtgtc cagcgtggaa atatcctaaa tctgaatggt gcaggagacc ctctcacacc 2760

aggttaccca gcaaatgaat atgcttatag gcgtggaatt gcagaggctg ttggtcttcc 2820

aagtattcct gttcatccaa ttggatacta tgatgcacag aagctcctag aaaaaatggg 2880

tggctcagca ccaccagata gcagctggag aggaagtctc aaagtgccct acaatgttgg 2940

acctggcttt actggaaact tttctacaca aaaagtcaag atgcacatcc actctaccaa 3000

tgaagtgaca agaatttaca atgtgatagg tactctcaga ggagcagtgg aaccagacag 3060

atatgtcatt ctgggaggtc accgggactc atgggtgttt ggtggtattg accctcagag 3120

tggagcagct gttgttcatg aaattgtgag gagctttgga acactgaaaa aggaagggtg 3180

gagacctaga agaacaattt tgtttgcaag ctgggatgca gaagaatttg gtcttcttgg 3240

ttctactgag tgggcagagg agaattcaag actccttcaa gagcgtggcg tggcttatat 3300

taatgctgac tcatctatag aaggaaacta cactctgaga gttgattgta caccgctgat 3360

gtacagcttg gtacacaacc taacaaaaga gctgaaaagc cctgatgaag gctttgaagg 3420

caaatctctt tatgaaagtt ggactaaaaa aagtccttcc ccagagttca gtggcatgcc 3480

caggataagc aaattgggat ctggaaatga ttttgaggtg ttcttccaac gacttggaat 3540

tgcttcaggc agagcacggt atactaaaaa ttgggaaaca aacaaattca gcggctatcc 3600

actgtatcac agtgtctatg aaacatatga gttggtggaa aagttttatg atccaatgtt 3660

taaatatcac ctcactgtgg cccaggttcg aggagggatg gtgtttgagc tggccaattc 3720

catagtgctc ccttttgatt gtcgagatta tgctgtagtt ttaagaaagt atgctgacaa 3780

aatctacagt atttctatga aacatccaca ggaaatgaag acatacagtg tatcatttga 3840

ttcacttttt tctgcagtaa agaattttac agaaattgct tccaagttca gtgagagact 3900

ccaggacttt gacaaaagca acccaatagt attaagaatg atgaatgatc aactcatgtt 3960

tctggaaaga gcatttattg atccattagg gttaccagac aggccttttt ataggcatgt 4020

catctatgct ccaagcagcc acaacaagta tgcaggggag tcattcccag gaatttatga 4080

tgctctgttt gatattgaaa gcaaagtgga cccttccaag gcctggggag aagtgaagag 4140

acagatttat gttgcagcct tcacagtgca ggcagctgca gagactttga gtgaagtagc 4200

ctaaagatct gggccctaac aaaacaaaaa gatggggtta ttccctaaac ttcatgggtt 4260

acgtaattgg aagttggggg acattgccac aagatcatat tgtacaaaag atcaaacact 4320

gttttagaaa acttcctgta aacaggccta ttgattggaa agtatgtcaa aggattgtgg 4380

gtcttttggg ctttgctgct ccatttacac aatgtggata tcctgcctta atgcctttgt 4440

atgcatgtat acaagctaaa caggctttca ctttctcgcc aacttacaag gcctttctaa 4500

gtaaacagta catgaacctt taccccgttg ctcggcaacg gcctggtctg tgccaagtgt 4560

ttgctgacgc aacccccact ggctggggct tggccatagg ccatcagcgc atgcgtggaa 4620

cctttgtggc tcctctgccg atccatactg cggaactcct agccgcttgt tttgctcgca 4680

gccggtctgg agcaaagctc ataggaactg acaattctgt cgtcctctcg cggaaatata 4740

catcgtttcg atctacgtat gatctttttc cctctgccaa aaattatggg gacatcatga 4800

agccccttga gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt 4860

gttggaattt tttgtgtctc tcactcggaa ggaattctgc attaatgaat cggccaacgc 4920

gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 4980

cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 5040

tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 5100

aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 5160

catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 5220

caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 5280

ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 5340

aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 5400

gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 5460

cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 5520

ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta 5580

tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 5640

tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 5700

cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 5760

tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 5820

tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 5880

tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 5940

cgttcatcca tagttgcctg actc 5964

<210> 24

<211> 4122

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 24

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 2040

aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 2100

ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 2160

cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 2220

ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 2280

ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 2340

ctggggaccc ggccagctat agagatctgg gccctaacaa aacaaaaaga tggggttatt 2400

ccctaaactt catgggttac gtaattggaa gttgggggac attgccacaa gatcatattg 2460

tacaaaagat caaacactgt tttagaaaac ttcctgtaaa caggcctatt gattggaaag 2520

tatgtcaaag gattgtgggt cttttgggct ttgctgctcc atttacacaa tgtggatatc 2580

ctgccttaat gcctttgtat gcatgtatac aagctaaaca ggctttcact ttctcgccaa 2640

cttacaaggc ctttctaagt aaacagtaca tgaaccttta ccccgttgct cggcaacggc 2700

ctggtctgtg ccaagtgttt gctgacgcaa cccccactgg ctggggcttg gccataggcc 2760

atcagcgcat gcgtggaacc tttgtggctc ctctgccgat ccatactgcg gaactcctag 2820

ccgcttgttt tgctcgcagc cggtctggag caaagctcat aggaactgac aattctgtcg 2880

tcctctcgcg gaaatataca tcgtttcgat ctacgtatga tctttttccc tctgccaaaa 2940

attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 3000

ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcggaagg aattctgcat 3060

taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 3120

tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 3180

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 3240

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 3300

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 3360

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 3420

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 3480

tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 3540

tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 3600

gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 3660

agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 3720

tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 3780

agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 3840

tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 3900

acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 3960

tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 4020

agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 4080

tcagcgatct gtctatttcg ttcatccata gttgcctgac tc 4122

210> 25

<211> 4467

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 25

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcattgtgg gaggctggga gtgcgagaag cattcccaac cctggcaggt 2040

gcttgtggcc tctcgtggca gggcagtctg cggcggtgtt ctggtgcacc cccagtgggt 2100

cctcacagct gcccactgca tcaggaacaa aagcgtgatc ttgctgggtc ggcacagctt 2160

gtttcatcct gaagacacag gccaggtatt tcaggtcagc cacagcttcc cacacccgct 2220

ctacgatatg agcctcctga agaatcgatt cctcaggcca ggtgatgact ccagccacga 2280

cctcatgctg ctccgcctgt cagagcctgc cgagctcacg gatgctgtga aggtcatgga 2340

cctgcccacc caggagccag cactggggac cacctgctac gcctcaggct ggggcagcat 2400

tgaaccagag gagttcttga ccccaaagaa acttcagtgt gtggacctcc atgttatttc 2460

caatgacgtg tgtgcgcaag ttcaccctca gaaggtgacc aagttcatgc tgtgtgctgg 2520

acgctggaca gggggcaaaa gcacctgctc gggtgattct gggggcccac ttgtctgtaa 2580

tggtgtgctt caaggtatca cgtcatgggg cagtgaacca tgtgccctgc ccgaaaggcc 2640

ttccctgtac accaaggtgg tgcattaccg gaagtggatc aaggacacca tcgtggccaa 2700

cccctgaaga tctgggccct aacaaaacaa aaagatgggg ttattcccta aacttcatgg 2760

gttacgtaat tggaagttgg gggacattgc cacaagatca tattgtacaa aagatcaaac 2820

actgttttag aaaacttcct gtaaacaggc ctattgattg gaaagtatgt caaaggattg 2880

tgggtctttt gggctttgct gctccattta cacaatgtgg atatcctgcc ttaatgcctt 2940

tgtatgcatg tatacaagct aaacaggctt tcactttctc gccaacttac aaggcctttc 3000

taagtaaaca gtacatgaac ctttaccccg ttgctcggca acggcctggt ctgtgccaag 3060

tgtttgctga cgcaaccccc actggctggg gcttggccat aggccatcag cgcatgcgtg 3120

gaacctttgt ggctcctctg ccgatccata ctgcggaact cctagccgct tgttttgctc 3180

gcagccggtc tggagcaaag ctcataggaa ctgacaattc tgtcgtcctc tcgcggaaat 3240

atacatcgtt tcgatctacg tatgatcttt ttccctctgc caaaaattat ggggacatca 3300

tgaagcccct tgagcatctg acttctggct aataaaggaa atttattttc attgcaatag 3360

tgtgttggaa ttttttgtgt ctctcactcg gaaggaattc tgcattaatg aatcggccaa 3420

cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 3480

ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 3540

ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 3600

gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 3660

gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 3720

taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 3780

accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 3840

tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 3900

cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 3960

agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 4020

gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 4080

gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 4140

tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 4200

acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 4260

cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 4320

acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 4380

acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 4440

tttcgttcat ccatagttgc ctgactc 4467

<210> 26

<211> 7563

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 26

gaattctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct 60

cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat 120

cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 180

acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 240

ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 300

ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 360

gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 420

gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 480

ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 540

actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 600

gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 660

ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 720

ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 780

gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 840

tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 900

tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 960

aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 1020

aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga ctcggcgtaa 1080

tgctctgcca gtgttacaac caattaacca attctgatta gaaaaactca tcgagcatca 1140

aatgaaactg caatttattc atatcaggat tatcaatacc atatttttga aaaagccgtt 1200

tctgtaatga aggagaaaac tcaccgaggc agttccatag gatggcaaga tcctggtatc 1260

ggtctgcgat tccgactcgt ccaacatcaa tacaacctat taatttcccc tcgtcaaaaa 1320

taaggttatc aagtgagaaa tcaccatgag tgacgactga atccggtgag aatggcaaaa 1380

gcttatgcat ttctttccag acttgttcaa caggccagcc attacgctcg tcatcaaaat 1440

cactcgcatc aaccaaaccg ttattcattc gtgattgcgc ctgagcgaga cgaaatacgc 1500

gatcgctgtt aaaaggacaa ttacaaacag gaatcaaatg caaccggcgc aggaacactg 1560

ccagcgcatc aacaatattt tcacctgaat caggatattc ttctaatacc tggaatgctg 1620

ttttcccggg gatcgcagtg gtgagtaacc atgcatcatc aggagtacgg ataaaatgct 1680

tgatggtcgg aagaggcata aattccgtca gccagtttag tctgaccatc tcatctgtaa 1740

catcattggc aacgctacct ttgccatgtt tcagaaacaa ctctggcgca tcgggcttcc 1800

catacaatcg atagattgtc gcacctgatt gcccgacatt atcgcgagcc catttatacc 1860

catataaatc agcatccatg ttggaattta atcgcggcct cgagcaagac gtttcccgtt 1920

gaatatggct cataacaccc cttgtattac tgtttatgta agcagacagg gtaccaatct 1980

tccgagtgag agacacaaaa aattccaaca cactattgca atgaaaataa atttccttta 2040

ttagccagaa gtcagatgct caaggggctt catgatgtcc ccataatttt tggcagaggg 2100

aaaaagatca tacgtagatc gaaacgatgt atatttccgc gagaggacga cagaattgtc 2160

agttcctatg agctttgctc cagaccggct gcgagcaaaa caagcggcta ggagttccgc 2220

agtatggatc ggcagaggag ccacaaaggt tccacgcatg cgctgatggc ctatggccaa 2280

gccccagcca gtgggggttg cgtcagcaaa cacttggcac agaccaggcc gttgccgagc 2340

aacggggtaa aggttcatgt actgtttact tagaaaggcc ttgtaagttg gcgagaaagt 2400

gaaagcctgt ttagcttgta tacatgcata caaaggcatt aaggcaggat atccacattg 2460

tgtaaatgga gcagcaaagc ccaaaagacc cacaatcctt tgacatactt tccaatcaat 2520

aggcctgttt acaggaagtt ttctaaaaca gtgtttgatc ttttgtacaa tatgatcttg 2580

tggcaatgtc ccccaacttc caattacgta acccatgaag tttagggaat aaccccatct 2640

ttttgttttg ttagggccca gatctttagg ctacttcact caaagtctct gcagctgcct 2700

gcactgtgaa ggctgcaaca taaatctgtc tcttcacttc tccccaggcc ttggaagggt 2760

ccactttgct ttcaatatca aacagagcat cataaattcc tgggaatgac tcccctgcat 2820

acttgttgtg gctgcttgga gcatagatga catgcctata aaaaggcctg tctggtaacc 2880

ctaatggatc aataaatgct ctttccagaa acatgagttg atcattcatc attcttaata 2940

ctattgggtt gcttttgtca aagtcctgga gtctctcact gaacttggaa gcaatttctg 3000

taaaattctt tactgcagaa aaaagtgaat caaatgatac actgtatgtc ttcatttcct 3060

gtggatgttt catagaaata ctgtagattt tgtcagcata ctttcttaaa actacagcat 3120

aatctcgaca atcaaaaggg agcactatgg aattggccag ctcaaacacc atccctcctc 3180

gaacctgggc cacagtgagg tgatatttaa acattggatc ataaaacttt tccaccaact 3240

catatgtttc atagacactg tgatacagtg gatagccgct gaatttgttt gtttcccaat 3300

ttttagtata ccgtgctctg cctgaagcaa ttccaagtcg ttggaagaac acctcaaaat 3360

catttccaga tcccaatttg cttatcctgg gcatgccact gaactctggg gaaggacttt 3420

ttttagtcca actttcataa agagatttgc cttcaaagcc ttcatcaggg cttttcagct 3480

cttttgttag gttgtgtacc aagctgtaca tcagcggtgt acaatcaact ctcagagtgt 3540

agtttccttc tatagatgag tcagcattaa tataagccac gccacgctct tgaaggagtc 3600

ttgaattctc ctctgcccac tcagtagaac caagaagacc aaattcttct gcatcccagc 3660

ttgcaaacaa aattgttctt ctaggtctcc acccttcctt tttcagtgtt ccaaagctcc 3720

tcacaatttc atgaacaaca gctgctccac tctgagggtc aataccacca aacacccatg 3780

agtcccggtg acctcccaga atgacatatc tgtctggttc cactgctcct ctgagagtac 3840

ctatcacatt gtaaattctt gtcacttcat tggtagagtg gatgtgcatc ttgacttttt 3900

gtgtagaaaa gtttccagta aagccaggtc caacattgta gggcactttg agacttcctc 3960

tccagctgct atctggtggt gctgagccac ccattttttc taggagcttc tgtgcatcat 4020

agtatccaat tggatgaaca ggaatacttg gaagaccaac agcctctgca attccacgcc 4080

tataagcata ttcatttgct gggtaacctg gtgtgagagg gtctcctgca ccattcagat 4140

ttaggatatt tccacgctgg acaccacctc caggaagatt ccaaccatct ggataggact 4200

tcaccccagg agcaaagtag tcagcagggt cggagtagag aatgactcct ttggcccctg 4260

ccagctgggc atttttaacc ttatttcctc tgaaaacttt cccatatctg gcaattacaa 4320

ttttcccaga gcaattgatt ttcatgtccc gttccaattt aaagaagtct tcagttcgtg 4380

catagttaac atacactaga tcgccctctg gcattccttg aggagagaaa gcactgaaag 4440

gtggtacaat atccgaaaca ttttcatatc ctggaggagg tggttcaaat aatgatgtgt 4500

tgaaaatctc atttccatct tcattaatta ttgagatgta gttgggatga gtcttatttg 4560

ggtaggacaa caggacatca taatgtgcca gctcaacaga atccaggcca aattctttcc 4620

actgggattg aatttgcttt gcaagctgaa agttttgttc tgttcctgct aaatgtggta 4680

tctgtgtaaa attatataag aacttcttga tgttctcagc tttcaattca tccaaaaatg 4740

ctttcatatt atgctttgga gtaatgttag tagcttcatt ggaggatttt ataaaccacc 4800

cgaagaggaa gccgaggaga aagaagccac ccgccagcac cagcgcccca gcgcacagcc 4860

agcgcgggcg gcgcgcgcta gccatgttcg tcacagggtc cccagtcctc gcggagattg 4920

acgagatgtg agaggcaata ttcggagcag ggtttactgt tcctgaactg gagccaccag 4980

caggaaaata cagacccctg actctgggat cctgacctgg aagatagtca gggttgaggc 5040

aagcaaaagg tacatgtaag agaagagccc acagcgtccc tcaaatccct ggagtcttga 5100

ctggggaagc caggcccacc ctggagagta catacctgct tgctgagatc cggacggtga 5160

gtcactcttg gcacggggaa tccgcgttcc aatgcaccgt tcccggccgc ggaggctgga 5220

tcggtcccgg tgtcttctat ggaggtcaaa acagcgtgga tggcgtctcc aggcgatctg 5280

acggttcact aaacgagctc tgcttatata gacctcccac cgtacacgcc taccgcccat 5340

ttgcgtcaac ggggcggggt tattacgaca ttttggaaag tcccgttgat tttggtgctc 5400

gacctgcagg gtaccaatat tggctattgg ccattgcata cgttgtatct atatcataat 5460

atgtacattt atattggctc atgtccaata tgaccgccat gttgacattg attattgact 5520

agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc 5580

gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg 5640

acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa 5700

tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca 5760

agtccgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac 5820

atgaccttac gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc 5880

atggtgatgc ggttttggca gtacaccaat gggcgtggat agcggtttga ctcacgggga 5940

tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg 6000

gactttccaa aatgtcgtaa taaccccgcc ccgttgacgc aaatgggcgg taggcgtgta 6060

cggtgggagg tctatataag cagagctcgt ttagtgaacc gtcagatcgc ctggagacgc 6120

catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct ccgcggccgg 6180

gaacggtgca ttggaacgcg gattccccgt gccaagagtg actcaccgtc cggatctcag 6240

caagcaggta tgtactctcc agggtgggcc tggcttcccc agtcaagact ccagggattt 6300

gagggacgct gtgggctctt ctcttacatg taccttttgc ttgcctcaac cctgactatc 6360

ttccaggtca ggatcccaga gtcaggggtc tgtattttcc tgctggtggc tccagttcag 6420

gaacagtaaa ccctgctccg aatattgcct ctcacatctc gtcaatctcc gcgaggactg 6480

gggaccctgt gacgaacatg gctagcaagg ctgtgctgct tgccctgttg atggcaggct 6540

tggccctgca gccaggcact gccctgctgt gctactcctg caaagcccag gtgagcaacg 6600

aggactgcct gcaggtggag aactgcaccc agctggggga gcagtgctgg accgcgcgca 6660

tccgcgcagt tggcctcctg accgtcatca gcaaaggctg cagcttgaac tgcgtggatg 6720

actcacagga ctactacgtg ggcaagaaga acatcacgtg ctgtgacacc gacttgtgca 6780

acgccagcgg ggcccatgcc ctgcagccgg ctgccgccat ccttgcgctg ctccctgcac 6840

tcggcctgct gctctgggga cccggccagc tatagagatc tgggccctaa caaaacaaaa 6900

agatggggtt attccctaaa cttcatgggt tacgtaattg gaagttgggg gacattgcca 6960

caagatcata ttgtacaaaa gatcaaacac tgttttagaa aacttcctgt aaacaggcct 7020

attgattgga aagtatgtca aaggattgtg ggtcttttgg gctttgctgc tccatttaca 7080

caatgtggat atcctgcctt aatgcctttg tatgcatgta tacaagctaa acaggctttc 7140

actttctcgc caacttacaa ggcctttcta agtaaacagt acatgaacct ttaccccgtt 7200

gctcggcaac ggcctggtct gtgccaagtg tttgctgacg caacccccac tggctggggc 7260

ttggccatag gccatcagcg catgcgtgga acctttgtgg ctcctctgcc gatccatact 7320

gcggaactcc tagccgcttg ttttgctcgc agccggtctg gagcaaagct cataggaact 7380

gacaattctg tcgtcctctc gcggaaatat acatcgtttc gatctacgta tgatcttttt 7440

ccctctgcca aaaattatgg ggacatcatg aagccccttg agcatctgac ttctggctaa 7500

taaaggaaat ttattttcat tgcaatagtg tgttggaatt ttttgtgtct ctcactcgga 7560

agc 7563

<210> 27

<211> 6396

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 27

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcgcgcgcc gcccgcgctg gctgtgcgct ggggcgctgg tgctggcggg 2040

tggcttcttt ctcctcggct tcctcttcgg gtggtttata aaatcctcca atgaagctac 2100

taacattact ccaaagcata atatgaaagc atttttggat gaattgaaag ctgagaacat 2160

caagaagttc ttatataatt ttacacagat accacattta gcaggaacag aacaaaactt 2220

tcagcttgca aagcaaattc aatcccagtg gaaagaattt ggcctggatt ctgttgagct 2280

ggcacattat gatgtcctgt tgtcctaccc aaataagact catcccaact acatctcaat 2340

aattaatgaa gatggaaatg agattttcaa cacatcatta tttgaaccac ctcctccagg 2400

atatgaaaat gtttcggata ttgtaccacc tttcagtgct ttctctcctc aaggaatgcc 2460

agagggcgat ctagtgtatg ttaactatgc acgaactgaa gacttcttta aattggaacg 2520

ggacatgaaa atcaattgct ctgggaaaat tgtaattgcc agatatggga aagttttcag 2580

aggaaataag gttaaaaatg cccagctggc aggggccaaa ggagtcattc tctactccga 2640

ccctgctgac tactttgctc ctggggtgaa gtcctatcca gatggttgga atcttcctgg 2700

aggtggtgtc cagcgtggaa atatcctaaa tctgaatggt gcaggagacc ctctcacacc 2760

aggttaccca gcaaatgaat atgcttatag gcgtggaatt gcagaggctg ttggtcttcc 2820

aagtattcct gttcatccaa ttggatacta tgatgcacag aagctcctag aaaaaatggg 2880

tggctcagca ccaccagata gcagctggag aggaagtctc aaagtgccct acaatgttgg 2940

acctggcttt actggaaact tttctacaca aaaagtcaag atgcacatcc actctaccaa 3000

tgaagtgaca agaatttaca atgtgatagg tactctcaga ggagcagtgg aaccagacag 3060

atatgtcatt ctgggaggtc accgggactc atgggtgttt ggtggtattg accctcagag 3120

tggagcagct gttgttcatg aaattgtgag gagctttgga acactgaaaa aggaagggtg 3180

gagacctaga agaacaattt tgtttgcaag ctgggatgca gaagaatttg gtcttcttgg 3240

ttctactgag tgggcagagg agaattcaag actccttcaa gagcgtggcg tggcttatat 3300

taatgctgac tcatctatag aaggaaacta cactctgaga gttgattgta caccgctgat 3360

gtacagcttg gtacacaacc taacaaaaga gctgaaaagc cctgatgaag gctttgaagg 3420

caaatctctt tatgaaagtt ggactaaaaa aagtccttcc ccagagttca gtggcatgcc 3480

caggataagc aaattgggat ctggaaatga ttttgaggtg ttcttccaac gacttggaat 3540

tgcttcaggc agagcacggt atactaaaaa ttgggaaaca aacaaattca gcggctatcc 3600

actgtatcac agtgtctatg aaacatatga gttggtggaa aagttttatg atccaatgtt 3660

taaatatcac ctcactgtgg cccaggttcg aggagggatg gtgtttgagc tggccaattc 3720

catagtgctc ccttttgatt gtcgagatta tgctgtagtt ttaagaaagt atgctgacaa 3780

aatctacagt atttctatga aacatccaca ggaaatgaag acatacagtg tatcatttga 3840

ttcacttttt tctgcagtaa agaattttac agaaattgct tccaagttca gtgagagact 3900

ccaggacttt gacaaaagca acccaatagt attaagaatg atgaatgatc aactcatgtt 3960

tctggaaaga gcatttattg atccattagg gttaccagac aggccttttt ataggcatgt 4020

catctatgct ccaagcagcc acaacaagta tgcaggggag tcattcccag gaatttatga 4080

tgctctgttt gatattgaaa gcaaagtgga cccttccaag gcctggggag aagtgaagag 4140

acagatttat gttgcagcct tcacagtgca ggcagctgca gagactttga gtgaagtagc 4200

cggatccgaa ggtaggggtt cattattgac ctgtggagat gtcgaagaaa acccaggacc 4260

cgcaagcaag gctgtgctgc ttgccctgtt gatggcaggc ttggccctgc agccaggcac 4320

tgccctgctg tgctactcct gcaaagccca ggtgagcaac gaggactgcc tgcaggtgga 4380

gaactgcacc cagctggggg agcagtgctg gaccgcgcgc atccgcgcag ttggcctcct 4440

gaccgtcatc agcaaaggct gcagcttgaa ctgcgtggat gactcacagg actactacgt 4500

gggcaagaag aacatcacgt gctgtgacac cgacttgtgc aacgccagcg gggcccatgc 4560

cctgcagccg gctgccgcca tccttgcgct gctccctgca ctcggcctgc tgctctgggg 4620

acccggccag ctatagagat ctgggcccta acaaaacaaa aagatggggt tattccctaa 4680

acttcatggg ttacgtaatt ggaagttggg ggacattgcc acaagatcat attgtacaaa 4740

agatcaaaca ctgttttaga aaacttcctg taaacaggcc tattgattgg aaagtatgtc 4800

aaaggattgt gggtcttttg ggctttgctg ctccatttac acaatgtgga tatcctgcct 4860

taatgccttt gtatgcatgt atacaagcta aacaggcttt cactttctcg ccaacttaca 4920

aggcctttct aagtaaacag tacatgaacc tttaccccgt tgctcggcaa cggcctggtc 4980

tgtgccaagt gtttgctgac gcaaccccca ctggctgggg cttggccata ggccatcagc 5040

gcatgcgtgg aacctttgtg gctcctctgc cgatccatac tgcggaactc ctagccgctt 5100

gttttgctcg cagccggtct ggagcaaagc tcataggaac tgacaattct gtcgtcctct 5160

cgcggaaata tacatcgttt cgatctacgt atgatctttt tccctctgcc aaaaattatg 5220

gggacatcat gaagcccctt gagcatctga cttctggcta ataaaggaaa tttattttca 5280

ttgcaatagt gtgttggaat tttttgtgtc tctcactcgg aaggaattct gcattaatga 5340

atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 5400

actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 5460

gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 5520

cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 5580

ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 5640

ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 5700

ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 5760

agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 5820

cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5880

aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 5940

gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 6000

agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 6060

ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 6120

cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 6180

tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 6240

aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 6300

tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 6360

atctgtctat ttcgttcatc catagttgcc tgactc 6396

<210> 28

<211> 6405

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 28

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 2040

aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 2100

ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 2160

cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 2220

ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 2280

ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 2340

ctggggaccc ggccagctag gatcccagac cctgaacttt gatctgctga aactggcagg 2400

cgatgtggaa agcaacccag gcccaatggc aagcgcgcgc cgcccgcgct ggctgtgcgc 2460

tggggcgctg gtgctggcgg gtggcttctt tctcctcggc ttcctcttcg ggtggtttat 2520

aaaatcctcc aatgaagcta ctaacattac tccaaagcat aatatgaaag catttttgga 2580

tgaattgaaa gctgagaaca tcaagaagtt cttatataat tttacacaga taccacattt 2640

agcaggaaca gaacaaaact ttcagcttgc aaagcaaatt caatcccagt ggaaagaatt 2700

tggcctggat tctgttgagc tggcacatta tgatgtcctg ttgtcctacc caaataagac 2760

tcatcccaac tacatctcaa taattaatga agatggaaat gagattttca acacatcatt 2820

atttgaacca cctcctccag gatatgaaaa tgtttcggat attgtaccac ctttcagtgc 2880

tttctctcct caaggaatgc cagagggcga tctagtgtat gttaactatg cacgaactga 2940

agacttcttt aaattggaac gggacatgaa aatcaattgc tctgggaaaa ttgtaattgc 3000

cagatatggg aaagttttca gaggaaataa ggttaaaaat gcccagctgg caggggccaa 3060

aggagtcatt ctctactccg accctgctga ctactttgct cctggggtga agtcctatcc 3120

agatggttgg aatcttcctg gaggtggtgt ccagcgtgga aatatcctaa atctgaatgg 3180

tgcaggagac cctctcacac caggttaccc agcaaatgaa tatgcttata ggcgtggaat 3240

tgcagaggct gttggtcttc caagtattcc tgttcatcca attggatact atgatgcaca 3300

gaagctccta gaaaaaatgg gtggctcagc accaccagat agcagctgga gaggaagtct 3360

caaagtgccc tacaatgttg gacctggctt tactggaaac ttttctacac aaaaagtcaa 3420

gatgcacatc cactctacca atgaagtgac aagaatttac aatgtgatag gtactctcag 3480

aggagcagtg gaaccagaca gatatgtcat tctgggaggt caccgggact catgggtgtt 3540

tggtggtatt gaccctcaga gtggagcagc tgttgttcat gaaattgtga ggagctttgg 3600

aacactgaaa aaggaagggt ggagacctag aagaacaatt ttgtttgcaa gctgggatgc 3660

agaagaattt ggtcttcttg gttctactga gtgggcagag gagaattcaa gactccttca 3720

agagcgtggc gtggcttata ttaatgctga ctcatctata gaaggaaact acactctgag 3780

agttgattgt acaccgctga tgtacagctt ggtacacaac ctaacaaaag agctgaaaag 3840

ccctgatgaa ggctttgaag gcaaatctct ttatgaaagt tggactaaaa aaagtccttc 3900

cccagagttc agtggcatgc ccaggataag caaattggga tctggaaatg attttgaggt 3960

gttcttccaa cgacttggaa ttgcttcagg cagagcacgg tatactaaaa attgggaaac 4020

aaacaaattc agcggctatc cactgtatca cagtgtctat gaaacatatg agttggtgga 4080

aaagttttat gatccaatgt ttaaatatca cctcactgtg gcccaggttc gaggagggat 4140

ggtgtttgag ctggccaatt ccatagtgct cccttttgat tgtcgagatt atgctgtagt 4200

tttaagaaag tatgctgaca aaatctacag tatttctatg aaacatccac aggaaatgaa 4260

gacatacagt gtatcatttg attcactttt ttctgcagta aagaatttta cagaaattgc 4320

ttccaagttc agtgagagac tccaggactt tgacaaaagc aacccaatag tattaagaat 4380

gatgaatgat caactcatgt ttctggaaag agcatttatt gatccattag ggttaccaga 4440

caggcctttt tataggcatg tcatctatgc tccaagcagc cacaacaagt atgcagggga 4500

gtcattccca ggaatttatg atgctctgtt tgatattgaa agcaaagtgg acccttccaa 4560

ggcctgggga gaagtgaaga gacagattta tgttgcagcc ttcacagtgc aggcagctgc 4620

agagactttg agtgaagtag cctaaagatc tgggccctaa caaaacaaaa agatggggtt 4680

attccctaaa cttcatgggt tacgtaattg gaagttgggg gacattgcca caagatcata 4740

ttgtacaaaa gatcaaacac tgttttagaa aacttcctgt aaacaggcct attgattgga 4800

aagtatgtca aaggattgtg ggtcttttgg gctttgctgc tccatttaca caatgtggat 4860

atcctgcctt aatgcctttg tatgcatgta tacaagctaa acaggctttc actttctcgc 4920

caacttacaa ggcctttcta agtaaacagt acatgaacct ttaccccgtt gctcggcaac 4980

ggcctggtct gtgccaagtg tttgctgacg caacccccac tggctggggc ttggccatag 5040

gccatcagcg catgcgtgga acctttgtgg ctcctctgcc gatccatact gcggaactcc 5100

tagccgcttg ttttgctcgc agccggtctg gagcaaagct cataggaact gacaattctg 5160

tcgtcctctc gcggaaatat acatcgtttc gatctacgta tgatcttttt ccctctgcca 5220

aaaattatgg ggacatcatg aagccccttg agcatctgac ttctggctaa taaaggaaat 5280

ttattttcat tgcaatagtg tgttggaatt ttttgtgtct ctcactcgga aggaattctg 5340

cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 5400

tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 5460

tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 5520

gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 5580

aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 5640

ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 5700

gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 5760

ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 5820

ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 5880

cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 5940

attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 6000

ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6060

aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 6120

gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 6180

tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 6240

ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 6300

taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 6360

atctcagcga tctgtctatt tcgttcatcc atagttgcct gactc 6405

<210> 29

<211> 6750

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 29

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcattgtgg gaggctggga gtgcgagaag cattcccaac cctggcaggt 2040

gcttgtggcc tctcgtggca gggcagtctg cggcggtgtt ctggtgcacc cccagtgggt 2100

cctcacagct gcccactgca tcaggaacaa aagcgtgatc ttgctgggtc ggcacagctt 2160

gtttcatcct gaagacacag gccaggtatt tcaggtcagc cacagcttcc cacacccgct 2220

ctacgatatg agcctcctga agaatcgatt cctcaggcca ggtgatgact ccagccacga 2280

cctcatgctg ctccgcctgt cagagcctgc cgagctcacg gatgctgtga aggtcatgga 2340

cctgcccacc caggagccag cactggggac cacctgctac gcctcaggct ggggcagcat 2400

tgaaccagag gagttcttga ccccaaagaa acttcagtgt gtggacctcc atgttatttc 2460

caatgacgtg tgtgcgcaag ttcaccctca gaaggtgacc aagttcatgc tgtgtgctgg 2520

acgctggaca gggggcaaaa gcacctgctc gggtgattct gggggcccac ttgtctgtaa 2580

tggtgtgctt caaggtatca cgtcatgggg cagtgaacca tgtgccctgc ccgaaaggcc 2640

ttccctgtac accaaggtgg tgcattaccg gaagtggatc aaggacacca tcgtggccaa 2700

ccccggatcc cagaccctga actttgatct gctgaaactg gcaggcgatg tggaaagcaa 2760

cccaggccca atggcaagcg cgcgccgccc gcgctggctg tgcgctgggg cgctggtgct 2820

ggcgggtggc ttctttctcc tcggcttcct cttcgggtgg tttataaaat cctccaatga 2880

agctactaac attactccaa agcataatat gaaagcattt ttggatgaat tgaaagctga 2940

gaacatcaag aagttcttat ataattttac acagatacca catttagcag gaacagaaca 3000

aaactttcag cttgcaaagc aaattcaatc ccagtggaaa gaatttggcc tggattctgt 3060

tgagctggca cattatgatg tcctgttgtc ctacccaaat aagactcatc ccaactacat 3120

ctcaataatt aatgaagatg gaaatgagat tttcaacaca tcattatttg aaccacctcc 3180

tccaggatat gaaaatgttt cggatattgt accacctttc agtgctttct ctcctcaagg 3240

aatgccagag ggcgatctag tgtatgttaa ctatgcacga actgaagact tctttaaatt 3300

ggaacgggac atgaaaatca attgctctgg gaaaattgta attgccagat atgggaaagt 3360

tttcagagga aataaggtta aaaatgccca gctggcaggg gccaaaggag tcattctcta 3420

ctccgaccct gctgactact ttgctcctgg ggtgaagtcc tatccagatg gttggaatct 3480

tcctggaggt ggtgtccagc gtggaaatat cctaaatctg aatggtgcag gagaccctct 3540

cacaccaggt tacccagcaa atgaatatgc ttataggcgt ggaattgcag aggctgttgg 3600

tcttccaagt attcctgttc atccaattgg atactatgat gcacagaagc tcctagaaaa 3660

aatgggtggc tcagcaccac cagatagcag ctggagagga agtctcaaag tgccctacaa 3720

tgttggacct ggctttactg gaaacttttc tacacaaaaa gtcaagatgc acatccactc 3780

taccaatgaa gtgacaagaa tttacaatgt gataggtact ctcagaggag cagtggaacc 3840

agacagatat gtcattctgg gaggtcaccg ggactcatgg gtgtttggtg gtattgaccc 3900

tcagagtgga gcagctgttg ttcatgaaat tgtgaggagc tttggaacac tgaaaaagga 3960

agggtggaga cctagaagaa caattttgtt tgcaagctgg gatgcagaag aatttggtct 4020

tcttggttct actgagtggg cagaggagaa ttcaagactc cttcaagagc gtggcgtggc 4080

ttatattaat gctgactcat ctatagaagg aaactacact ctgagagttg attgtacacc 4140

gctgatgtac agcttggtac acaacctaac aaaagagctg aaaagccctg atgaaggctt 4200

tgaaggcaaa tctctttatg aaagttggac taaaaaaagt ccttccccag agttcagtgg 4260

catgcccagg ataagcaaat tgggatctgg aaatgatttt gaggtgttct tccaacgact 4320

tggaattgct tcaggcagag cacggtatac taaaaattgg gaaacaaaca aattcagcgg 4380

ctatccactg tatcacagtg tctatgaaac atatgagttg gtggaaaagt tttatgatcc 4440

aatgtttaaa tatcacctca ctgtggccca ggttcgagga gggatggtgt ttgagctggc 4500

caattccata gtgctccctt ttgattgtcg agattatgct gtagttttaa gaaagtatgc 4560

tgacaaaatc tacagtattt ctatgaaaca tccacaggaa atgaagacat acagtgtatc 4620

atttgattca cttttttctg cagtaaagaa ttttacagaa attgcttcca agttcagtga 4680

gagactccag gactttgaca aaagcaaccc aatagtatta agaatgatga atgatcaact 4740

catgtttctg gaaagagcat ttattgatcc attagggtta ccagacaggc ctttttatag 4800

gcatgtcatc tatgctccaa gcagccacaa caagtatgca ggggagtcat tcccaggaat 4860

ttatgatgct ctgtttgata ttgaaagcaa agtggaccct tccaaggcct ggggagaagt 4920

gaagagacag atttatgttg cagccttcac agtgcaggca gctgcagaga ctttgagtga 4980

agtagcctaa agatctgggc cctaacaaaa caaaaagatg gggttattcc ctaaacttca 5040

tgggttacgt aattggaagt tgggggacat tgccacaaga tcatattgta caaaagatca 5100

aacactgttt tagaaaactt cctgtaaaca ggcctattga ttggaaagta tgtcaaagga 5160

ttgtgggtct tttgggcttt gctgctccat ttacacaatg tggatatcct gccttaatgc 5220

ctttgtatgc atgtatacaa gctaaacagg ctttcacttt ctcgccaact tacaaggcct 5280

ttctaagtaa acagtacatg aacctttacc ccgttgctcg gcaacggcct ggtctgtgcc 5340

aagtgtttgc tgacgcaacc cccactggct ggggcttggc cataggccat cagcgcatgc 5400

gtggaacctt tgtggctcct ctgccgatcc atactgcgga actcctagcc gcttgttttg 5460

ctcgcagccg gtctggagca aagctcatag gaactgacaa ttctgtcgtc ctctcgcgga 5520

aatatacatc gtttcgatct acgtatgatc tttttccctc tgccaaaaat tatggggaca 5580

tcatgaagcc ccttgagcat ctgacttctg gctaataaag gaaatttatt ttcattgcaa 5640

tagtgtgttg gaattttttg tgtctctcac tcggaaggaa ttctgcatta atgaatcggc 5700

caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 5760

tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 5820

cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 5880

aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 5940

gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 6000

agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 6060

cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 6120

cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 6180

ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 6240

gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 6300

tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 6360

acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 6420

tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 6480

attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 6540

gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 6600

ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 6660

taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 6720

ctatttcgtt catccatagt tgcctgactc 6750

<210> 30

<211> 6908

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 30

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcgcgcgcc gcccgcgctg gctgtgcgct ggggcgctgg tgctggcggg 2040

tggcttcttt ctcctcggct tcctcttcgg gtggtttata aaatcctcca atgaagctac 2100

taacattact ccaaagcata atatgaaagc atttttggat gaattgaaag ctgagaacat 2160

caagaagttc ttatataatt ttacacagat accacattta gcaggaacag aacaaaactt 2220

tcagcttgca aagcaaattc aatcccagtg gaaagaattt ggcctggatt ctgttgagct 2280

ggcacattat gatgtcctgt tgtcctaccc aaataagact catcccaact acatctcaat 2340

aattaatgaa gatggaaatg agattttcaa cacatcatta tttgaaccac ctcctccagg 2400

atatgaaaat gtttcggata ttgtaccacc tttcagtgct ttctctcctc aaggaatgcc 2460

agagggcgat ctagtgtatg ttaactatgc acgaactgaa gacttcttta aattggaacg 2520

ggacatgaaa atcaattgct ctgggaaaat tgtaattgcc agatatggga aagttttcag 2580

aggaaataag gttaaaaatg cccagctggc aggggccaaa ggagtcattc tctactccga 2640

ccctgctgac tactttgctc ctggggtgaa gtcctatcca gatggttgga atcttcctgg 2700

aggtggtgtc cagcgtggaa atatcctaaa tctgaatggt gcaggagacc ctctcacacc 2760

aggttaccca gcaaatgaat atgcttatag gcgtggaatt gcagaggctg ttggtcttcc 2820

aagtattcct gttcatccaa ttggatacta tgatgcacag aagctcctag aaaaaatggg 2880

tggctcagca ccaccagata gcagctggag aggaagtctc aaagtgccct acaatgttgg 2940

acctggcttt actggaaact tttctacaca aaaagtcaag atgcacatcc actctaccaa 3000

tgaagtgaca agaatttaca atgtgatagg tactctcaga ggagcagtgg aaccagacag 3060

atatgtcatt ctgggaggtc accgggactc atgggtgttt ggtggtattg accctcagag 3120

tggagcagct gttgttcatg aaattgtgag gagctttgga acactgaaaa aggaagggtg 3180

gagacctaga agaacaattt tgtttgcaag ctgggatgca gaagaatttg gtcttcttgg 3240

ttctactgag tgggcagagg agaattcaag actccttcaa gagcgtggcg tggcttatat 3300

taatgctgac tcatctatag aaggaaacta cactctgaga gttgattgta caccgctgat 3360

gtacagcttg gtacacaacc taacaaaaga gctgaaaagc cctgatgaag gctttgaagg 3420

caaatctctt tatgaaagtt ggactaaaaa aagtccttcc ccagagttca gtggcatgcc 3480

caggataagc aaattgggat ctggaaatga ttttgaggtg ttcttccaac gacttggaat 3540

tgcttcaggc agagcacggt atactaaaaa ttgggaaaca aacaaattca gcggctatcc 3600

actgtatcac agtgtctatg aaacatatga gttggtggaa aagttttatg atccaatgtt 3660

taaatatcac ctcactgtgg cccaggttcg aggagggatg gtgtttgagc tggccaattc 3720

catagtgctc ccttttgatt gtcgagatta tgctgtagtt ttaagaaagt atgctgacaa 3780

aatctacagt atttctatga aacatccaca ggaaatgaag acatacagtg tatcatttga 3840

ttcacttttt tctgcagtaa agaattttac agaaattgct tccaagttca gtgagagact 3900

ccaggacttt gacaaaagca acccaatagt attaagaatg atgaatgatc aactcatgtt 3960

tctggaaaga gcatttattg atccattagg gttaccagac aggccttttt ataggcatgt 4020

catctatgct ccaagcagcc acaacaagta tgcaggggag tcattcccag gaatttatga 4080

tgctctgttt gatattgaaa gcaaagtgga cccttccaag gcctggggag aagtgaagag 4140

acagatttat gttgcagcct tcacagtgca ggcagctgca gagactttga gtgaagtagc 4200

ctaaagatct gaccccctaa cgttactggc cgaagccgct tggaataagg ccggtgtgcg 4260

tttgtctata tgttattttc caccatattg ccgtcttttg gcaatgtgag ggcccggaaa 4320

cctggccctg tcttcttgac gagcattcct aggggtcttt cccctctcgc caaaggaatg 4380

caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg aagcttcttg aagacaaaca 4440

acgtctgtag cgaccctttg caggcagcgg aaccccccac ctggcgacag gtgcctctgc 4500

ggccaaaagc cacgtgtata agatacacct gcaaaggcgg cacaacccca gtgccacgtt 4560

gtgagttgga tagttgtgga aagagtcaaa tggctctcct caagcgtatt caacaagggg 4620

ctgaaggatg cccagaaggt accccattgt atgggatctg atctggggcc tcggtgcaca 4680

tgctttacat gtgtttagtc gaggttaaaa aacgtctagg ccccccgaac cacggggacg 4740

tggttttcct ttgaaaaaca cgatgataat atggccagca aggctgtgct gcttgccctg 4800

ttgatggcag gcttggccct gcagccaggc actgccctgc tgtgctactc ctgcaaagcc 4860

caggtgagca acgaggactg cctgcaggtg gagaactgca cccagctggg ggagcagtgc 4920

tggaccgcgc gcatccgcgc agttggcctc ctgaccgtca tcagcaaagg ctgcagcttg 4980

aactgcgtgg atgactcaca ggactactac gtgggcaaga agaacatcac gtgctgtgac 5040

accgacttgt gcaacgccag cggggcccat gccctgcagc cggctgccgc catccttgcg 5100

ctgctccctg cactcggcct gctgctctgg ggacccggcc agctataggg atctgggccc 5160

taacaaaaca aaaagatggg gttattccct aaacttcatg ggttacgtaa ttggaagttg 5220

ggggacattg ccacaagatc atattgtaca aaagatcaaa cactgtttta gaaaacttcc 5280

tgtaaacagg cctattgatt ggaaagtatg tcaaaggatt gtgggtcttt tgggctttgc 5340

tgctccattt acacaatgtg gatatcctgc cttaatgcct ttgtatgcat gtatacaagc 5400

taaacaggct ttcactttct cgccaactta caaggccttt ctaagtaaac agtacatgaa 5460

cctttacccc gttgctcggc aacggcctgg tctgtgccaa gtgtttgctg acgcaacccc 5520

cactggctgg ggcttggcca taggccatca gcgcatgcgt ggaacctttg tggctcctct 5580

gccgatccat actgcggaac tcctagccgc ttgttttgct cgcagccggt ctggagcaaa 5640

gctcatagga actgacaatt ctgtcgtcct ctcgcggaaa tatacatcgt ttcgatctac 5700

gtatgatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct 5760

gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg 5820

tctctcactc ggaaggaatt ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 5880

tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 5940

tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 6000

ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 6060

ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 6120

gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 6180

gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 6240

ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 6300

tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 6360

gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 6420

tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 6480

tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt atctgcgctc 6540

tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 6600

ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 6660

ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 6720

gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt 6780

aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc 6840

aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg 6900

cctgactc 6908

<210> 31

<211> 6914

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 31

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 2040

aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 2100

ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 2160

cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 2220

ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 2280

ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 2340

ctggggaccc ggccagctat agagatctga ccccctaacg ttactggccg aagccgcttg 2400

gaataaggcc ggtgtgcgtt tgtctatatg ttattttcca ccatattgcc gtcttttggc 2460

aatgtgaggg cccggaaacc tggccctgtc ttcttgacga gcattcctag gggtctttcc 2520

cctctcgcca aaggaatgca aggtctgttg aatgtcgtga aggaagcagt tcctctggaa 2580

gcttcttgaa gacaaacaac gtctgtagcg accctttgca ggcagcggaa ccccccacct 2640

ggcgacaggt gcctctgcgg ccaaaagcca cgtgtataag atacacctgc aaaggcggca 2700

caaccccagt gccacgttgt gagttggata gttgtggaaa gagtcaaatg gctctcctca 2760

agcgtattca acaaggggct gaaggatgcc cagaaggtac cccattgtat gggatctgat 2820

ctggggcctc ggtgcacatg ctttacatgt gtttagtcga ggttaaaaaa cgtctaggcc 2880

ccccgaacca cggggacgtg gttttccttt gaaaaacacg atgataatat ggccacaacc 2940

atggcgcgcc gcccgcgctg gctgtgcgct ggggcgctgg tgctggcggg tggcttcttt 3000

ctcctcggct tcctcttcgg gtggtttata aaatcctcca atgaagctac taacattact 3060

ccaaagcata atatgaaagc atttttggat gaattgaaag ctgagaacat caagaagttc 3120

ttatataatt ttacacagat accacattta gcaggaacag aacaaaactt tcagcttgca 3180

aagcaaattc aatcccagtg gaaagaattt ggcctggatt ctgttgagct ggcacattat 3240

gatgtcctgt tgtcctaccc aaataagact catcccaact acatctcaat aattaatgaa 3300

gatggaaatg agattttcaa cacatcatta tttgaaccac ctcctccagg atatgaaaat 3360

gtttcggata ttgtaccacc tttcagtgct ttctctcctc aaggaatgcc agagggcgat 3420

ctagtgtatg ttaactatgc acgaactgaa gacttcttta aattggaacg ggacatgaaa 3480

atcaattgct ctgggaaaat tgtaattgcc agatatggga aagttttcag aggaaataag 3540

gttaaaaatg cccagctggc aggggccaaa ggagtcattc tctactccga ccctgctgac 3600

tactttgctc ctggggtgaa gtcctatcca gatggttgga atcttcctgg aggtggtgtc 3660

cagcgtggaa atatcctaaa tctgaatggt gcaggagacc ctctcacacc aggttaccca 3720

gcaaatgaat atgcttatag gcgtggaatt gcagaggctg ttggtcttcc aagtattcct 3780

gttcatccaa ttggatacta tgatgcacag aagctcctag aaaaaatggg tggctcagca 3840

ccaccagata gcagctggag aggaagtctc aaagtgccct acaatgttgg acctggcttt 3900

actggaaact tttctacaca aaaagtcaag atgcacatcc actctaccaa tgaagtgaca 3960

agaatttaca atgtgatagg tactctcaga ggagcagtgg aaccagacag atatgtcatt 4020

ctgggaggtc accgggactc atgggtgttt ggtggtattg accctcagag tggagcagct 4080

gttgttcatg aaattgtgag gagctttgga acactgaaaa aggaagggtg gagacctaga 4140

agaacaattt tgtttgcaag ctgggatgca gaagaatttg gtcttcttgg ttctactgag 4200

tgggcagagg agaattcaag actccttcaa gagcgtggcg tggcttatat taatgctgac 4260

tcatctatag aaggaaacta cactctgaga gttgattgta caccgctgat gtacagcttg 4320

gtacacaacc taacaaaaga gctgaaaagc cctgatgaag gctttgaagg caaatctctt 4380

tatgaaagtt ggactaaaaa aagtccttcc ccagagttca gtggcatgcc caggataagc 4440

aaattgggat ctggaaatga ttttgaggtg ttcttccaac gacttggaat tgcttcaggc 4500

agagcacggt atactaaaaa ttgggaaaca aacaaattca gcggctatcc actgtatcac 4560

agtgtctatg aaacatatga gttggtggaa aagttttatg atccaatgtt taaatatcac 4620

ctcactgtgg cccaggttcg aggagggatg gtgtttgagc tggccaattc catagtgctc 4680

ccttttgatt gtcgagatta tgctgtagtt ttaagaaagt atgctgacaa aatctacagt 4740

atttctatga aacatccaca ggaaatgaag acatacagtg tatcatttga ttcacttttt 4800

tctgcagtaa agaattttac agaaattgct tccaagttca gtgagagact ccaggacttt 4860

gacaaaagca acccaatagt attaagaatg atgaatgatc aactcatgtt tctggaaaga 4920

gcatttattg atccattagg gttaccagac aggccttttt ataggcatgt catctatgct 4980

ccaagcagcc acaacaagta tgcaggggag tcattcccag gaatttatga tgctctgttt 5040

gatattgaaa gcaaagtgga cccttccaag gcctggggag aagtgaagag acagatttat 5100

gttgcagcct tcacagtgca ggcagctgca gagactttga gtgaagtagc ctaaagatct 5160

gggccctaac aaaacaaaaa gatggggtta ttccctaaac ttcatgggtt acgtaattgg 5220

aagttggggg acattgccac aagatcatat tgtacaaaag atcaaacact gttttagaaa 5280

acttcctgta aacaggccta ttgattggaa agtatgtcaa aggattgtgg gtcttttggg 5340

ctttgctgct ccatttacac aatgtggata tcctgcctta atgcctttgt atgcatgtat 5400

acaagctaaa caggctttca ctttctcgcc aacttacaag gcctttctaa gtaaacagta 5460

catgaacctt taccccgttg ctcggcaacg gcctggtctg tgccaagtgt ttgctgacgc 5520

aacccccact ggctggggct tggccatagg ccatcagcgc atgcgtggaa cctttgtggc 5580

tcctctgccg atccatactg cggaactcct agccgcttgt tttgctcgca gccggtctgg 5640

agcaaagctc ataggaactg acaattctgt cgtcctctcg cggaaatata catcgtttcg 5700

atctacgtat gatctttttc cctctgccaa aaattatggg gacatcatga agccccttga 5760

gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt gttggaattt 5820

tttgtgtctc tcactcggaa ggaattctgc attaatgaat cggccaacgc gcggggagag 5880

gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 5940

ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 6000

caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 6060

aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 6120

atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 6180

cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 6240

ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 6300

gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 6360

accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 6420

cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 6480

cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 6540

gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 6600

aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 6660

aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 6720

actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 6780

taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 6840

gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 6900

tagttgcctg actc 6914

<210> 32

<211> 5411

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 32

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 2040

aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 2100

ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 2160

cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 2220

ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 2280

ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 2340

ctggggaccc ggccagctat agagatctga ccccctaacg ttactggccg aagccgcttg 2400

gaataaggcc ggtgtgcgtt tgtctatatg ttattttcca ccatattgcc gtcttttggc 2460

aatgtgaggg cccggaaacc tggccctgtc ttcttgacga gcattcctag gggtctttcc 2520

cctctcgcca aaggaatgca aggtctgttg aatgtcgtga aggaagcagt tcctctggaa 2580

gcttcttgaa gacaaacaac gtctgtagcg accctttgca ggcagcggaa ccccccacct 2640

ggcgacaggt gcctctgcgg ccaaaagcca cgtgtataag atacacctgc aaaggcggca 2700

caaccccagt gccacgttgt gagttggata gttgtggaaa gagtcaaatg gctctcctca 2760

agcgtattca acaaggggct gaaggatgcc cagaaggtac cccattgtat gggatctgat 2820

ctggggcctc ggtgcacatg ctttacatgt gtttagtcga ggttaaaaaa cgtctaggcc 2880

ccccgaacca cggggacgtg gttttccttt gaaaaacacg atgataatat ggccagcatt 2940

gtgggaggct gggagtgcga gaagcattcc caaccctggc aggtgcttgt ggcctctcgt 3000

ggcagggcag tctgcggcgg tgttctggtg cacccccagt gggtcctcac agctgcccac 3060

tgcatcagga acaaaagcgt gatcttgctg ggtcggcaca gcttgtttca tcctgaagac 3120

acaggccagg tatttcaggt cagccacagc ttcccacacc cgctctacga tatgagcctc 3180

ctgaagaatc gattcctcag gccaggtgat gactccagcc acgacctcat gctgctccgc 3240

ctgtcagagc ctgccgagct cacggatgct gtgaaggtca tggacctgcc cacccaggag 3300

ccagcactgg ggaccacctg ctacgcctca ggctggggca gcattgaacc agaggagttc 3360

ttgaccccaa agaaacttca gtgtgtggac ctccatgtta tttccaatga cgtgtgtgcg 3420

caagttcacc ctcagaaggt gaccaagttc atgctgtgtg ctggacgctg gacagggggc 3480

aaaagcacct gctcgggtga ttctgggggc ccacttgtct gtaatggtgt gcttcaaggt 3540

atcacgtcat ggggcagtga accatgtgcc ctgcccgaaa ggccttccct gtacaccaag 3600

gtggtgcatt accggaagtg gatcaaggac accatcgtgg ccaacccctg aggatctggg 3660

ccctaacaaa acaaaaagat ggggttattc cctaaacttc atgggttacg taattggaag 3720

ttgggggaca ttgccacaag atcatattgt acaaaagatc aaacactgtt ttagaaaact 3780

tcctgtaaac aggcctattg attggaaagt atgtcaaagg attgtgggtc ttttgggctt 3840

tgctgctcca tttacacaat gtggatatcc tgccttaatg cctttgtatg catgtataca 3900

agctaaacag gctttcactt tctcgccaac ttacaaggcc tttctaagta aacagtacat 3960

gaacctttac cccgttgctc ggcaacggcc tggtctgtgc caagtgtttg ctgacgcaac 4020

ccccactggc tggggcttgg ccataggcca tcagcgcatg cgtggaacct ttgtggctcc 4080

tctgccgatc catactgcgg aactcctagc cgcttgtttt gctcgcagcc ggtctggagc 4140

aaagctcata ggaactgaca attctgtcgt cctctcgcgg aaatatacat cgtttcgatc 4200

tacgtatgat ctttttccct ctgccaaaaa ttatggggac atcatgaagc cccttgagca 4260

tctgacttct ggctaataaa ggaaatttat tttcattgca atagtgtgtt ggaatttttt 4320

gtgtctctca ctcggaagga attctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 4380

gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 4440

ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 4500

gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 4560

aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 4620

gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 4680

ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 4740

cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 4800

cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 4860

gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 4920

cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 4980

agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 5040

ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 5100

ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 5160

gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 5220

cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 5280

attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 5340

accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 5400

ttgcctgact c 5411

<210> 33

<211> 7694

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 33

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcattgtgg gaggctggga gtgcgagaag cattcccaac cctggcaggt 2040

gcttgtggcc tctcgtggca gggcagtctg cggcggtgtt ctggtgcacc cccagtgggt 2100

cctcacagct gcccactgca tcaggaacaa aagcgtgatc ttgctgggtc ggcacagctt 2160

gtttcatcct gaagacacag gccaggtatt tcaggtcagc cacagcttcc cacacccgct 2220

ctacgatatg agcctcctga agaatcgatt cctcaggcca ggtgatgact ccagccacga 2280

cctcatgctg ctccgcctgt cagagcctgc cgagctcacg gatgctgtga aggtcatgga 2340

cctgcccacc caggagccag cactggggac cacctgctac gcctcaggct ggggcagcat 2400

tgaaccagag gagttcttga ccccaaagaa acttcagtgt gtggacctcc atgttatttc 2460

caatgacgtg tgtgcgcaag ttcaccctca gaaggtgacc aagttcatgc tgtgtgctgg 2520

acgctggaca gggggcaaaa gcacctgctc gggtgattct gggggcccac ttgtctgtaa 2580

tggtgtgctt caaggtatca cgtcatgggg cagtgaacca tgtgccctgc ccgaaaggcc 2640

ttccctgtac accaaggtgg tgcattaccg gaagtggatc aaggacacca tcgtggccaa 2700

ccccggatcc cagaccctga actttgatct gctgaaactg gcaggcgatg tggaaagcaa 2760

cccaggccca atggcaagcg cgcgccgccc gcgctggctg tgcgctgggg cgctggtgct 2820

ggcgggtggc ttctttctcc tcggcttcct cttcgggtgg tttataaaat cctccaatga 2880

agctactaac attactccaa agcataatat gaaagcattt ttggatgaat tgaaagctga 2940

gaacatcaag aagttcttat ataattttac acagatacca catttagcag gaacagaaca 3000

aaactttcag cttgcaaagc aaattcaatc ccagtggaaa gaatttggcc tggattctgt 3060

tgagctggca cattatgatg tcctgttgtc ctacccaaat aagactcatc ccaactacat 3120

ctcaataatt aatgaagatg gaaatgagat tttcaacaca tcattatttg aaccacctcc 3180

tccaggatat gaaaatgttt cggatattgt accacctttc agtgctttct ctcctcaagg 3240

aatgccagag ggcgatctag tgtatgttaa ctatgcacga actgaagact tctttaaatt 3300

ggaacgggac atgaaaatca attgctctgg gaaaattgta attgccagat atgggaaagt 3360

tttcagagga aataaggtta aaaatgccca gctggcaggg gccaaaggag tcattctcta 3420

ctccgaccct gctgactact ttgctcctgg ggtgaagtcc tatccagatg gttggaatct 3480

tcctggaggt ggtgtccagc gtggaaatat cctaaatctg aatggtgcag gagaccctct 3540

cacaccaggt tacccagcaa atgaatatgc ttataggcgt ggaattgcag aggctgttgg 3600

tcttccaagt attcctgttc atccaattgg atactatgat gcacagaagc tcctagaaaa 3660

aatgggtggc tcagcaccac cagatagcag ctggagagga agtctcaaag tgccctacaa 3720

tgttggacct ggctttactg gaaacttttc tacacaaaaa gtcaagatgc acatccactc 3780

taccaatgaa gtgacaagaa tttacaatgt gataggtact ctcagaggag cagtggaacc 3840

agacagatat gtcattctgg gaggtcaccg ggactcatgg gtgtttggtg gtattgaccc 3900

tcagagtgga gcagctgttg ttcatgaaat tgtgaggagc tttggaacac tgaaaaagga 3960

agggtggaga cctagaagaa caattttgtt tgcaagctgg gatgcagaag aatttggtct 4020

tcttggttct actgagtggg cagaggagaa ttcaagactc cttcaagagc gtggcgtggc 4080

ttatattaat gctgactcat ctatagaagg aaactacact ctgagagttg attgtacacc 4140

gctgatgtac agcttggtac acaacctaac aaaagagctg aaaagccctg atgaaggctt 4200

tgaaggcaaa tctctttatg aaagttggac taaaaaaagt ccttccccag agttcagtgg 4260

catgcccagg ataagcaaat tgggatctgg aaatgatttt gaggtgttct tccaacgact 4320

tggaattgct tcaggcagag cacggtatac taaaaattgg gaaacaaaca aattcagcgg 4380

ctatccactg tatcacagtg tctatgaaac atatgagttg gtggaaaagt tttatgatcc 4440

aatgtttaaa tatcacctca ctgtggccca ggttcgagga gggatggtgt ttgagctggc 4500

caattccata gtgctccctt ttgattgtcg agattatgct gtagttttaa gaaagtatgc 4560

tgacaaaatc tacagtattt ctatgaaaca tccacaggaa atgaagacat acagtgtatc 4620

atttgattca cttttttctg cagtaaagaa ttttacagaa attgcttcca agttcagtga 4680

gagactccag gactttgaca aaagcaaccc aatagtatta agaatgatga atgatcaact 4740

catgtttctg gaaagagcat ttattgatcc attagggtta ccagacaggc ctttttatag 4800

gcatgtcatc tatgctccaa gcagccacaa caagtatgca ggggagtcat tcccaggaat 4860

ttatgatgct ctgtttgata ttgaaagcaa agtggaccct tccaaggcct ggggagaagt 4920

gaagagacag atttatgttg cagccttcac agtgcaggca gctgcagaga ctttgagtga 4980

agtagcctaa agatctgacc ccctaacgtt actggccgaa gccgcttgga ataaggccgg 5040

tgtgcgtttg tctatatgtt attttccacc atattgccgt cttttggcaa tgtgagggcc 5100

cggaaacctg gccctgtctt cttgacgagc attcctaggg gtctttcccc tctcgccaaa 5160

ggaatgcaag gtctgttgaa tgtcgtgaag gaagcagttc ctctggaagc ttcttgaaga 5220

caaacaacgt ctgtagcgac cctttgcagg cagcggaacc ccccacctgg cgacaggtgc 5280

ctctgcggcc aaaagccacg tgtataagat acacctgcaa aggcggcaca accccagtgc 5340

cacgttgtga gttggatagt tgtggaaaga gtcaaatggc tctcctcaag cgtattcaac 5400

aaggggctga aggatgccca gaaggtaccc cattgtatgg gatctgatct ggggcctcgg 5460

tgcacatgct ttacatgtgt ttagtcgagg ttaaaaaacg tctaggcccc ccgaaccacg 5520

gggacgtggt tttcctttga aaaacacgat gataatatgg ccagcaaggc tgtgctgctt 5580

gccctgttga tggcaggctt ggccctgcag ccaggcactg ccctgctgtg ctactcctgc 5640

aaagcccagg tgagcaacga ggactgcctg caggtggaga actgcaccca gctgggggag 5700

cagtgctgga ccgcgcgcat ccgcgcagtt ggcctcctga ccgtcatcag caaaggctgc 5760

agcttgaact gcgtggatga ctcacaggac tactacgtgg gcaagaagaa catcacgtgc 5820

tgtgacaccg acttgtgcaa cgccagcggg gcccatgccc tgcagccggc tgccgccatc 5880

cttgcgctgc tccctgcact cggcctgctg ctctggggac ccggccagct atagggatct 5940

gggccctaac aaaacaaaaa gatggggtta ttccctaaac ttcatgggtt acgtaattgg 6000

aagttggggg acattgccac aagatcatat tgtacaaaag atcaaacact gttttagaaa 6060

acttcctgta aacaggccta ttgattggaa agtatgtcaa aggattgtgg gtcttttggg 6120

ctttgctgct ccatttacac aatgtggata tcctgcctta atgcctttgt atgcatgtat 6180

acaagctaaa caggctttca ctttctcgcc aacttacaag gcctttctaa gtaaacagta 6240

catgaacctt taccccgttg ctcggcaacg gcctggtctg tgccaagtgt ttgctgacgc 6300

aacccccact ggctggggct tggccatagg ccatcagcgc atgcgtggaa cctttgtggc 6360

tcctctgccg atccatactg cggaactcct agccgcttgt tttgctcgca gccggtctgg 6420

agcaaagctc ataggaactg acaattctgt cgtcctctcg cggaaatata catcgtttcg 6480

atctacgtat gatctttttc cctctgccaa aaattatggg gacatcatga agccccttga 6540

gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt gttggaattt 6600

tttgtgtctc tcactcggaa ggaattctgc attaatgaat cggccaacgc gcggggagag 6660

gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 6720

ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 6780

caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 6840

aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 6900

atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 6960

cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 7020

ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 7080

gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 7140

accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 7200

cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 7260

cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 7320

gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 7380

aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 7440

aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 7500

actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 7560

taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 7620

gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 7680

tagttgcctg actc 7694

<210> 34

<211> 7182

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 34

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcattgtgg gaggctggga gtgcgagaag cattcccaac cctggcaggt 2040

gcttgtggcc tctcgtggca gggcagtctg cggcggtgtt ctggtgcacc cccagtgggt 2100

cctcacagct gcccactgca tcaggaacaa aagcgtgatc ttgctgggtc ggcacagctt 2160

gtttcatcct gaagacacag gccaggtatt tcaggtcagc cacagcttcc cacacccgct 2220

ctacgatatg agcctcctga agaatcgatt cctcaggcca ggtgatgact ccagccacga 2280

cctcatgctg ctccgcctgt cagagcctgc cgagctcacg gatgctgtga aggtcatgga 2340

cctgcccacc caggagccag cactggggac cacctgctac gcctcaggct ggggcagcat 2400

tgaaccagag gagttcttga ccccaaagaa acttcagtgt gtggacctcc atgttatttc 2460

caatgacgtg tgtgcgcaag ttcaccctca gaaggtgacc aagttcatgc tgtgtgctgg 2520

acgctggaca gggggcaaaa gcacctgctc gggtgattct gggggcccac ttgtctgtaa 2580

tggtgtgctt caaggtatca cgtcatgggg cagtgaacca tgtgccctgc ccgaaaggcc 2640

ttccctgtac accaaggtgg tgcattaccg gaagtggatc aaggacacca tcgtggccaa 2700

ccccggatcc cagaccctga actttgatct gctgaaactg gcaggcgatg tggaaagcaa 2760

cccaggccca atggcaagcg cgcgccgccc gcgctggctg tgcgctgggg cgctggtgct 2820

ggcgggtggc ttctttctcc tcggcttcct cttcgggtgg tttataaaat cctccaatga 2880

agctactaac attactccaa agcataatat gaaagcattt ttggatgaat tgaaagctga 2940

gaacatcaag aagttcttat ataattttac acagatacca catttagcag gaacagaaca 3000

aaactttcag cttgcaaagc aaattcaatc ccagtggaaa gaatttggcc tggattctgt 3060

tgagctggca cattatgatg tcctgttgtc ctacccaaat aagactcatc ccaactacat 3120

ctcaataatt aatgaagatg gaaatgagat tttcaacaca tcattatttg aaccacctcc 3180

tccaggatat gaaaatgttt cggatattgt accacctttc agtgctttct ctcctcaagg 3240

aatgccagag ggcgatctag tgtatgttaa ctatgcacga actgaagact tctttaaatt 3300

ggaacgggac atgaaaatca attgctctgg gaaaattgta attgccagat atgggaaagt 3360

tttcagagga aataaggtta aaaatgccca gctggcaggg gccaaaggag tcattctcta 3420

ctccgaccct gctgactact ttgctcctgg ggtgaagtcc tatccagatg gttggaatct 3480

tcctggaggt ggtgtccagc gtggaaatat cctaaatctg aatggtgcag gagaccctct 3540

cacaccaggt tacccagcaa atgaatatgc ttataggcgt ggaattgcag aggctgttgg 3600

tcttccaagt attcctgttc atccaattgg atactatgat gcacagaagc tcctagaaaa 3660

aatgggtggc tcagcaccac cagatagcag ctggagagga agtctcaaag tgccctacaa 3720

tgttggacct ggctttactg gaaacttttc tacacaaaaa gtcaagatgc acatccactc 3780

taccaatgaa gtgacaagaa tttacaatgt gataggtact ctcagaggag cagtggaacc 3840

agacagatat gtcattctgg gaggtcaccg ggactcatgg gtgtttggtg gtattgaccc 3900

tcagagtgga gcagctgttg ttcatgaaat tgtgaggagc tttggaacac tgaaaaagga 3960

agggtggaga cctagaagaa caattttgtt tgcaagctgg gatgcagaag aatttggtct 4020

tcttggttct actgagtggg cagaggagaa ttcaagactc cttcaagagc gtggcgtggc 4080

ttatattaat gctgactcat ctatagaagg aaactacact ctgagagttg attgtacacc 4140

gctgatgtac agcttggtac acaacctaac aaaagagctg aaaagccctg atgaaggctt 4200

tgaaggcaaa tctctttatg aaagttggac taaaaaaagt ccttccccag agttcagtgg 4260

catgcccagg ataagcaaat tgggatctgg aaatgatttt gaggtgttct tccaacgact 4320

tggaattgct tcaggcagag cacggtatac taaaaattgg gaaacaaaca aattcagcgg 4380

ctatccactg tatcacagtg tctatgaaac atatgagttg gtggaaaagt tttatgatcc 4440

aatgtttaaa tatcacctca ctgtggccca ggttcgagga gggatggtgt ttgagctggc 4500

caattccata gtgctccctt ttgattgtcg agattatgct gtagttttaa gaaagtatgc 4560

tgacaaaatc tacagtattt ctatgaaaca tccacaggaa atgaagacat acagtgtatc 4620

atttgattca cttttttctg cagtaaagaa ttttacagaa attgcttcca agttcagtga 4680

gagactccag gactttgaca aaagcaaccc aatagtatta agaatgatga atgatcaact 4740

catgtttctg gaaagagcat ttattgatcc attagggtta ccagacaggc ctttttatag 4800

gcatgtcatc tatgctccaa gcagccacaa caagtatgca ggggagtcat tcccaggaat 4860

ttatgatgct ctgtttgata ttgaaagcaa agtggaccct tccaaggcct ggggagaagt 4920

gaagagacag atttatgttg cagccttcac agtgcaggca gctgcagaga ctttgagtga 4980

agtagccgga tccgaaggta ggggttcatt attgacctgt ggagatgtcg aagaaaaccc 5040

aggacccgca agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 5100

aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 5160

ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 5220

cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 5280

ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 5340

ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 5400

ctggggaccc ggccagctat agagatctgg gccctaacaa aacaaaaaga tggggttatt 5460

ccctaaactt catgggttac gtaattggaa gttgggggac attgccacaa gatcatattg 5520

tacaaaagat caaacactgt tttagaaaac ttcctgtaaa caggcctatt gattggaaag 5580

tatgtcaaag gattgtgggt cttttgggct ttgctgctcc atttacacaa tgtggatatc 5640

ctgccttaat gcctttgtat gcatgtatac aagctaaaca ggctttcact ttctcgccaa 5700

cttacaaggc ctttctaagt aaacagtaca tgaaccttta ccccgttgct cggcaacggc 5760

ctggtctgtg ccaagtgttt gctgacgcaa cccccactgg ctggggcttg gccataggcc 5820

atcagcgcat gcgtggaacc tttgtggctc ctctgccgat ccatactgcg gaactcctag 5880

ccgcttgttt tgctcgcagc cggtctggag caaagctcat aggaactgac aattctgtcg 5940

tcctctcgcg gaaatataca tcgtttcgat ctacgtatga tctttttccc tctgccaaaa 6000

attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 6060

ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcggaagg aattctgcat 6120

taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 6180

tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 6240

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 6300

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 6360

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 6420

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 6480

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 6540

tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 6600

tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 6660

gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 6720

agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 6780

tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 6840

agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 6900

tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 6960

acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 7020

tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 7080

agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 7140

tcagcgatct gtctatttcg ttcatccata gttgcctgac tc 7182

<210> 35

<211> 7182

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 35

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcattgtgg gaggctggga gtgcgagaag cattcccaac cctggcaggt 2040

gcttgtggcc tctcgtggca gggcagtctg cggcggtgtt ctggtgcacc cccagtgggt 2100

cctcacagct gcccactgca tcaggaacaa aagcgtgatc ttgctgggtc ggcacagctt 2160

gtttcatcct gaagacacag gccaggtatt tcaggtcagc cacagcttcc cacacccgct 2220

ctacgatatg agcctcctga agaatcgatt cctcaggcca ggtgatgact ccagccacga 2280

cctcatgctg ctccgcctgt cagagcctgc cgagctcacg gatgctgtga aggtcatgga 2340

cctgcccacc caggagccag cactggggac cacctgctac gcctcaggct ggggcagcat 2400

tgaaccagag gagttcttga ccccaaagaa acttcagtgt gtggacctcc atgttatttc 2460

caatgacgtg tgtgcgcaag ttcaccctca gaaggtgacc aagttcatgc tgtgtgctgg 2520

acgctggaca gggggcaaaa gcacctgctc gggtgattct gggggcccac ttgtctgtaa 2580

tggtgtgctt caaggtatca cgtcatgggg cagtgaacca tgtgccctgc ccgaaaggcc 2640

ttccctgtac accaaggtgg tgcattaccg gaagtggatc aaggacacca tcgtggccaa 2700

ccccggatcc gaaggtaggg gttcattatt gacctgtgga gatgtcgaag aaaacccagg 2760

acccgctagc aaggctgtgc tgcttgccct gttgatggca ggcttggccc tgcagccagg 2820

cactgccctg ctgtgctact cctgcaaagc ccaggtgagc aacgaggact gcctgcaggt 2880

ggagaactgc acccagctgg gggagcagtg ctggaccgcg cgcatccgcg cagttggcct 2940

cctgaccgtc atcagcaaag gctgcagctt gaactgcgtg gatgactcac aggactacta 3000

cgtgggcaag aagaacatca cgtgctgtga caccgacttg tgcaacgcca gcggggccca 3060

tgccctgcag ccggctgccg ccatccttgc gctgctccct gcactcggcc tgctgctctg 3120

gggacccggc cagctaggat cccagaccct gaactttgat ctgctgaaac tggcaggcga 3180

tgtggaaagc aacccaggcc caatggcaag cgcgcgccgc ccgcgctggc tgtgcgctgg 3240

ggcgctggtg ctggcgggtg gcttctttct cctcggcttc ctcttcgggt ggtttataaa 3300

atcctccaat gaagctacta acattactcc aaagcataat atgaaagcat ttttggatga 3360

attgaaagct gagaacatca agaagttctt atataatttt acacagatac cacatttagc 3420

aggaacagaa caaaactttc agcttgcaaa gcaaattcaa tcccagtgga aagaatttgg 3480

cctggattct gttgagctgg cacattatga tgtcctgttg tcctacccaa ataagactca 3540

tcccaactac atctcaataa ttaatgaaga tggaaatgag attttcaaca catcattatt 3600

tgaaccacct cctccaggat atgaaaatgt ttcggatatt gtaccacctt tcagtgcttt 3660

ctctcctcaa ggaatgccag agggcgatct agtgtatgtt aactatgcac gaactgaaga 3720

cttctttaaa ttggaacggg acatgaaaat caattgctct gggaaaattg taattgccag 3780

atatgggaaa gttttcagag gaaataaggt taaaaatgcc cagctggcag gggccaaagg 3840

agtcattctc tactccgacc ctgctgacta ctttgctcct ggggtgaagt cctatccaga 3900

tggttggaat cttcctggag gtggtgtcca gcgtggaaat atcctaaatc tgaatggtgc 3960

aggagaccct ctcacaccag gttacccagc aaatgaatat gcttataggc gtggaattgc 4020

agaggctgtt ggtcttccaa gtattcctgt tcatccaatt ggatactatg atgcacagaa 4080

gctcctagaa aaaatgggtg gctcagcacc accagatagc agctggagag gaagtctcaa 4140

agtgccctac aatgttggac ctggctttac tggaaacttt tctacacaaa aagtcaagat 4200

gcacatccac tctaccaatg aagtgacaag aatttacaat gtgataggta ctctcagagg 4260

agcagtggaa ccagacagat atgtcattct gggaggtcac cgggactcat gggtgtttgg 4320

tggtattgac cctcagagtg gagcagctgt tgttcatgaa attgtgagga gctttggaac 4380

actgaaaaag gaagggtgga gacctagaag aacaattttg tttgcaagct gggatgcaga 4440

agaatttggt cttcttggtt ctactgagtg ggcagaggag aattcaagac tccttcaaga 4500

gcgtggcgtg gcttatatta atgctgactc atctatagaa ggaaactaca ctctgagagt 4560

tgattgtaca ccgctgatgt acagcttggt acacaaccta acaaaagagc tgaaaagccc 4620

tgatgaaggc tttgaaggca aatctcttta tgaaagttgg actaaaaaaa gtccttcccc 4680

agagttcagt ggcatgccca ggataagcaa attgggatct ggaaatgatt ttgaggtgtt 4740

cttccaacga cttggaattg cttcaggcag agcacggtat actaaaaatt gggaaacaaa 4800

caaattcagc ggctatccac tgtatcacag tgtctatgaa acatatgagt tggtggaaaa 4860

gttttatgat ccaatgttta aatatcacct cactgtggcc caggttcgag gagggatggt 4920

gtttgagctg gccaattcca tagtgctccc ttttgattgt cgagattatg ctgtagtttt 4980

aagaaagtat gctgacaaaa tctacagtat ttctatgaaa catccacagg aaatgaagac 5040

atacagtgta tcatttgatt cacttttttc tgcagtaaag aattttacag aaattgcttc 5100

caagttcagt gagagactcc aggactttga caaaagcaac ccaatagtat taagaatgat 5160

gaatgatcaa ctcatgtttc tggaaagagc atttattgat ccattagggt taccagacag 5220

gcctttttat aggcatgtca tctatgctcc aagcagccac aacaagtatg caggggagtc 5280

attcccagga atttatgatg ctctgtttga tattgaaagc aaagtggacc cttccaaggc 5340

ctggggagaa gtgaagagac agatttatgt tgcagccttc acagtgcagg cagctgcaga 5400

gactttgagt gaagtagcct aaagatctgg gccctaacaa aacaaaaaga tggggttatt 5460

ccctaaactt catgggttac gtaattggaa gttgggggac attgccacaa gatcatattg 5520

tacaaaagat caaacactgt tttagaaaac ttcctgtaaa caggcctatt gattggaaag 5580

tatgtcaaag gattgtgggt cttttgggct ttgctgctcc atttacacaa tgtggatatc 5640

ctgccttaat gcctttgtat gcatgtatac aagctaaaca ggctttcact ttctcgccaa 5700

cttacaaggc ctttctaagt aaacagtaca tgaaccttta ccccgttgct cggcaacggc 5760

ctggtctgtg ccaagtgttt gctgacgcaa cccccactgg ctggggcttg gccataggcc 5820

atcagcgcat gcgtggaacc tttgtggctc ctctgccgat ccatactgcg gaactcctag 5880

ccgcttgttt tgctcgcagc cggtctggag caaagctcat aggaactgac aattctgtcg 5940

tcctctcgcg gaaatataca tcgtttcgat ctacgtatga tctttttccc tctgccaaaa 6000

attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 6060

ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcggaagg aattctgcat 6120

taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 6180

tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 6240

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 6300

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 6360

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 6420

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 6480

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 6540

tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 6600

tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 6660

gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 6720

agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 6780

tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 6840

agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 6900

tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 6960

acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 7020

tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 7080

agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 7140

tcagcgatct gtctatttcg ttcatccata gttgcctgac tc 7182

<210> 36

<211> 7694

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 36

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcaaggctg tgctgcttgc cctgttgatg gcaggcttgg ccctgcagcc 2040

aggcactgcc ctgctgtgct actcctgcaa agcccaggtg agcaacgagg actgcctgca 2100

ggtggagaac tgcacccagc tgggggagca gtgctggacc gcgcgcatcc gcgcagttgg 2160

cctcctgacc gtcatcagca aaggctgcag cttgaactgc gtggatgact cacaggacta 2220

ctacgtgggc aagaagaaca tcacgtgctg tgacaccgac ttgtgcaacg ccagcggggc 2280

ccatgccctg cagccggctg ccgccatcct tgcgctgctc cctgcactcg gcctgctgct 2340

ctggggaccc ggccagctag gatcccagac cctgaacttt gatctgctga aactggcagg 2400

cgatgtggaa agcaacccag gcccaatggc aagcgcgcgc cgcccgcgct ggctgtgcgc 2460

tggggcgctg gtgctggcgg gtggcttctt tctcctcggc ttcctcttcg ggtggtttat 2520

aaaatcctcc aatgaagcta ctaacattac tccaaagcat aatatgaaag catttttgga 2580

tgaattgaaa gctgagaaca tcaagaagtt cttatataat tttacacaga taccacattt 2640

agcaggaaca gaacaaaact ttcagcttgc aaagcaaatt caatcccagt ggaaagaatt 2700

tggcctggat tctgttgagc tggcacatta tgatgtcctg ttgtcctacc caaataagac 2760

tcatcccaac tacatctcaa taattaatga agatggaaat gagattttca acacatcatt 2820

atttgaacca cctcctccag gatatgaaaa tgtttcggat attgtaccac ctttcagtgc 2880

tttctctcct caaggaatgc cagagggcga tctagtgtat gttaactatg cacgaactga 2940

agacttcttt aaattggaac gggacatgaa aatcaattgc tctgggaaaa ttgtaattgc 3000

cagatatggg aaagttttca gaggaaataa ggttaaaaat gcccagctgg caggggccaa 3060

aggagtcatt ctctactccg accctgctga ctactttgct cctggggtga agtcctatcc 3120

agatggttgg aatcttcctg gaggtggtgt ccagcgtgga aatatcctaa atctgaatgg 3180

tgcaggagac cctctcacac caggttaccc agcaaatgaa tatgcttata ggcgtggaat 3240

tgcagaggct gttggtcttc caagtattcc tgttcatcca attggatact atgatgcaca 3300

gaagctccta gaaaaaatgg gtggctcagc accaccagat agcagctgga gaggaagtct 3360

caaagtgccc tacaatgttg gacctggctt tactggaaac ttttctacac aaaaagtcaa 3420

gatgcacatc cactctacca atgaagtgac aagaatttac aatgtgatag gtactctcag 3480

aggagcagtg gaaccagaca gatatgtcat tctgggaggt caccgggact catgggtgtt 3540

tggtggtatt gaccctcaga gtggagcagc tgttgttcat gaaattgtga ggagctttgg 3600

aacactgaaa aaggaagggt ggagacctag aagaacaatt ttgtttgcaa gctgggatgc 3660

agaagaattt ggtcttcttg gttctactga gtgggcagag gagaattcaa gactccttca 3720

agagcgtggc gtggcttata ttaatgctga ctcatctata gaaggaaact acactctgag 3780

agttgattgt acaccgctga tgtacagctt ggtacacaac ctaacaaaag agctgaaaag 3840

ccctgatgaa ggctttgaag gcaaatctct ttatgaaagt tggactaaaa aaagtccttc 3900

cccagagttc agtggcatgc ccaggataag caaattggga tctggaaatg attttgaggt 3960

gttcttccaa cgacttggaa ttgcttcagg cagagcacgg tatactaaaa attgggaaac 4020

aaacaaattc agcggctatc cactgtatca cagtgtctat gaaacatatg agttggtgga 4080

aaagttttat gatccaatgt ttaaatatca cctcactgtg gcccaggttc gaggagggat 4140

ggtgtttgag ctggccaatt ccatagtgct cccttttgat tgtcgagatt atgctgtagt 4200

tttaagaaag tatgctgaca aaatctacag tatttctatg aaacatccac aggaaatgaa 4260

gacatacagt gtatcatttg attcactttt ttctgcagta aagaatttta cagaaattgc 4320

ttccaagttc agtgagagac tccaggactt tgacaaaagc aacccaatag tattaagaat 4380

gatgaatgat caactcatgt ttctggaaag agcatttatt gatccattag ggttaccaga 4440

caggcctttt tataggcatg tcatctatgc tccaagcagc cacaacaagt atgcagggga 4500

gtcattccca ggaatttatg atgctctgtt tgatattgaa agcaaagtgg acccttccaa 4560

ggcctgggga gaagtgaaga gacagattta tgttgcagcc ttcacagtgc aggcagctgc 4620

agagactttg agtgaagtag cctaaagatc tgacccccta acgttactgg ccgaagccgc 4680

ttggaataag gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt 4740

ggcaatgtga gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt 4800

tcccctctcg ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg 4860

gaagcttctt gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca 4920

cctggcgaca ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg 4980

gcacaacccc agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc 5040

tcaagcgtat tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct 5100

gatctggggc ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaacgtctag 5160

gccccccgaa ccacggggac gtggttttcc tttgaaaaac acgatgataa tatggccagc 5220

attgtgggag gctgggagtg cgagaagcat tcccaaccct ggcaggtgct tgtggcctct 5280

cgtggcaggg cagtctgcgg cggtgttctg gtgcaccccc agtgggtcct cacagctgcc 5340

cactgcatca ggaacaaaag cgtgatcttg ctgggtcggc acagcttgtt tcatcctgaa 5400

gacacaggcc aggtatttca ggtcagccac agcttcccac acccgctcta cgatatgagc 5460

ctcctgaaga atcgattcct caggccaggt gatgactcca gccacgacct catgctgctc 5520

cgcctgtcag agcctgccga gctcacggat gctgtgaagg tcatggacct gcccacccag 5580

gagccagcac tggggaccac ctgctacgcc tcaggctggg gcagcattga accagaggag 5640

ttcttgaccc caaagaaact tcagtgtgtg gacctccatg ttatttccaa tgacgtgtgt 5700

gcgcaagttc accctcagaa ggtgaccaag ttcatgctgt gtgctggacg ctggacaggg 5760

ggcaaaagca cctgctcggg tgattctggg ggcccacttg tctgtaatgg tgtgcttcaa 5820

ggtatcacgt catggggcag tgaaccatgt gccctgcccg aaaggccttc cctgtacacc 5880

aaggtggtgc attaccggaa gtggatcaag gacaccatcg tggccaaccc ctgaggatct 5940

gggccctaac aaaacaaaaa gatggggtta ttccctaaac ttcatgggtt acgtaattgg 6000

aagttggggg acattgccac aagatcatat tgtacaaaag atcaaacact gttttagaaa 6060

acttcctgta aacaggccta ttgattggaa agtatgtcaa aggattgtgg gtcttttggg 6120

ctttgctgct ccatttacac aatgtggata tcctgcctta atgcctttgt atgcatgtat 6180

acaagctaaa caggctttca ctttctcgcc aacttacaag gcctttctaa gtaaacagta 6240

catgaacctt taccccgttg ctcggcaacg gcctggtctg tgccaagtgt ttgctgacgc 6300

aacccccact ggctggggct tggccatagg ccatcagcgc atgcgtggaa cctttgtggc 6360

tcctctgccg atccatactg cggaactcct agccgcttgt tttgctcgca gccggtctgg 6420

agcaaagctc ataggaactg acaattctgt cgtcctctcg cggaaatata catcgtttcg 6480

atctacgtat gatctttttc cctctgccaa aaattatggg gacatcatga agccccttga 6540

gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt gttggaattt 6600

tttgtgtctc tcactcggaa ggaattctgc attaatgaat cggccaacgc gcggggagag 6660

gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 6720

ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 6780

caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 6840

aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 6900

atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 6960

cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 7020

ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 7080

gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 7140

accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 7200

cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 7260

cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 7320

gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 7380

aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 7440

aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 7500

actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 7560

taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 7620

gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 7680

tagttgcctg actc 7694

<210> 37

<211> 8461

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 37

catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60

ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120

gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180

gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240

taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300

agtgaaatct gaataatttt gtgttactca tagcgcgtaa tactgtaata gtaatcaatt 360

acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 420

ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 480

cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 540

actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 600

aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 660

acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag 720

tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt 780

gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac 840

aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataagc 900

agagctggtt tagtgaaccg tcagatccgc tagagatcca ccatggctag cggtgccccg 960

acgttgcccc ctgcctggca gccctttctc aaggaccacc gcatctctac attcaagaac 1020

tggcccttct tggagggctg cgcctgcgcc ccggagcgga tggccgaggc tggcttcatc 1080

cactgcccca ctgagaacga gccagacttg gcccagtgtt tcttctgctt caaggagctg 1140

gaaggctggg agccagatga cgaccccata gaggaacata aaaagcattc gtccggttgc 1200

gctttccttt ctgtcaagaa gcagtttgaa gaattaaccc ttggtgaatt tttgaaactg 1260

gacagagaaa gagccaagaa caaaattgca aaggaaacca acaataagaa gaaagaattt 1320

gaggaaactg cggagaaagt gcgccgtgcc atcgagcagc tggctgccat ggattagaga 1380

tctgaccccc taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct 1440

atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc 1500

ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc 1560

tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg 1620

tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa 1680

agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt 1740

ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg 1800

atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta 1860

catgtgttta gtcgaggtta aaaaacgtct aggccccccg aaccacgggg acgtggtttt 1920

cctttgaaaa acacgataat atggcggccg ctcgagccta agcttctaga taagatatcc 1980

gatccaccgg atctagataa ctgatcataa tcagccatac cacatttgta gaggttttac 2040

ttgctttaaa aaacctccca cacctccccc tgaacctgaa acataaaatg aatgcaattg 2100

ttgttgttaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 2160

atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 2220

atgtatctta acgcggatct gggcgtggtt aagggtggga aagaatatat aaggtggggg 2280

tcttatgtag ttttgtatct gttttgcagc agccgccgcc gccatgagca ccaactcgtt 2340

tgatggaagc attgtgagct catatttgac aacgcgcatg cccccatggg ccggggtgcg 2400

tcagaatgtg atgggctcca gcattgatgg tcgccccgtc ctgcccgcaa actctactac 2460

cttgacctac gagaccgtgt ctggaacgcc gttggagact gcagcctccg ccgccgcttc 2520

agccgctgca gccaccgccc gcgggattgt gactgacttt gctttcctga gcccgcttgc 2580

aagcagtgca gcttcccgtt catccgcccg cgatgacaag ttgacggctc ttttggcaca 2640

attggattct ttgacccggg aacttaatgt cgtttctcag cagctgttgg atctgcgcca 2700

gcaggtttct gccctgaagg cttcctcccc tcccaatgcg gtttaaaaca taaataaaaa 2760

accagactct gtttggattt ggatcaagca agtgtcttgc tgtctttatt taggggtttt 2820

gcgcgcgcgg taggcccggg accagcggtc tcggtcgttg agggtcctgt gtattttttc 2880

caggacgtgg taaaggtgac tctggatgtt cagatacatg ggcataagcc cgtctctggg 2940

gtggaggtag caccactgca gagcttcatg ctgcggggtg gtgttgtaga tgatccagtc 3000

gtagcaggag cgctgggcgt ggtgcctaaa aatgtctttc agtagcaagc tgattgccag 3060

gggcaggccc ttggtgtaag tgtttacaaa gcggttaagc tgggatgggt gcatacgtgg 3120

ggatatgaga tgcatcttgg actgtatttt taggttggct atgttcccag ccatatccct 3180

ccggggattc atgttgtgca gaaccaccag cacagtgtat ccggtgcact tgggaaattt 3240

gtcatgtagc ttagaaggaa atgcgtggaa gaacttggag acgcccttgt gacctccaag 3300

attttccatg cattcgtcca taatgatggc aatgggccca cgggcggcgg cctgggcgaa 3360

gatatttctg ggatcactaa cgtcatagtt gtgttccagg atgagatcgt cataggccat 3420

ttttacaaag cgcgggcgga gggtgccaga ctgcggtata atggttccat ccggcccagg 3480

ggcgtagtta ccctcacaga tttgcatttc ccacgctttg agttcagatg gggggatcat 3540

gtctacctgc ggggcgatga agaaaacggt ttccggggta ggggagatca gctgggaaga 3600

aagcaggttc ctgagcagct gcgacttacc gcagccggtg ggcccgtaaa tcacacctat 3660

taccggctgc aactggtagt taagagagct gcagctgccg tcatccctga gcaggggggc 3720

cacttcgtta agcatgtccc tgactcgcat gttttccctg accaaatccg ccagaaggcg 3780

ctcgccgccc agcgatagca gttcttgcaa ggaagcaaag tttttcaacg gtttgagacc 3840

gtccgccgta ggcatgcttt tgagcgtttg accaagcagt tccaggcggt cccacagctc 3900

ggtcacctgc tctacggcat ctcgatccag catatctcct cgtttcgcgg gttggggcgg 3960

ctttcgctgt acggcagtag tcggtgctcg tccagacggg ccagggtcat gtctttccac 4020

gggcgcaggg tcctcgtcag cgtagtctgg gtcacggtga aggggtgcgc tccgggctgc 4080

gcgctggcca gggtgcgctt gaggctggtc ctgctggtgc tgaagcgctg ccggtcttcg 4140

ccctgcgcgt cggccaggta gcatttgacc atggtgtcat agtccagccc ctccgcggcg 4200

tggcccttgg cgcgcagctt gcccttggag gaggcgccgc acgaggggca gtgcagactt 4260

ttgagggcgt agagcttggg cgcgagaaat accgattccg gggagtaggc atccgcgccg 4320

caggccccgc agacggtctc gcattccacg agccaggtga gctctggccg ttcggggtca 4380

aaaaccaggt ttcccccatg ctttttgatg cgtttcttac ctctggtttc catgagccgg 4440

tgtccacgct cggtgacgaa aaggctgtcc gtgtccccgt atacagactt gagagggagt 4500

ttaaacgaat tcaatagctt gttgcatggg cggcgatata aaatgcaagg tgctgctcaa 4560

aaaatcaggc aaagcctcgc gcaaaaaaga aagcacatcg tagtcatgct catgcagata 4620

aaggcaggta agctccggaa ccaccacaga aaaagacacc atttttctct caaacatgtc 4680

tgcgggtttc tgcataaaca caaaataaaa taacaaaaaa acatttaaac attagaagcc 4740

tgtcttacaa caggaaaaac aacccttata agcataagac ggactacggc catgccggcg 4800

tgaccgtaaa aaaactggtc accgtgatta aaaagcacca ccgacagctc ctcggtcatg 4860

tccggagtca taatgtaaga ctcggtaaac acatcaggtt gattcacatc ggtcagtgct 4920

aaaaagcgac cgaaatagcc cgggggaata catacccgca ggcgtagaga caacattaca 4980

gcccccatag gaggtataac aaaattaata ggagagaaaa acacataaac acctgaaaaa 5040

ccctcctgcc taggcaaaat agcaccctcc cgctccagaa caacatacag cgcttccaca 5100

gcggcagcca taacagtcag ccttaccagt aaaaaagaaa acctattaaa aaaacaccac 5160

tcgacacggc accagctcaa tcagtcacag tgtaaaaaag ggccaagtgc agagcgagta 5220

tatataggac taaaaaatga cgtaacggtt aaagtccaca aaaaacaccc agaaaaccgc 5280

acgcgaacct acgcccagaa acgaaagcca aaaaacccac aacttcctca aatcgtcact 5340

tccgttttcc cacgttacgt cacttcccat tttaagaaaa ctacaattcc caacacatac 5400

aagttactcc gccctaaaac ctacgtcacc cgccccgttc ccacgccccg cgccacgtca 5460

caaactccac cccctcatta tcatattggc ttcaatccaa aataaggtat attattgatg 5520

atgttaatta acatgcatgg atccatatgc ggtgtgaaat accgcacaga tgcgtaagga 5580

gaaaataccg catcaggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 5640

ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 5700

caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 5760

aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 5820

atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 5880

cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 5940

ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 6000

gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 6060

accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 6120

cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 6180

cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 6240

gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 6300

aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 6360

aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 6420

actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 6480

taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 6540

gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 6600

tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 6660

ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 6720

accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 6780

agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 6840

acgttgttgc cattgctgca gccatgagat tatcaaaaag gatcttcacc tagatccttt 6900

tcacgtagaa agccagtccg cagaaacggt gctgaccccg gatgaatgtc agctactggg 6960

ctatctggac aagggaaaac gcaagcgcaa agagaaagca ggtagcttgc agtgggctta 7020

catggcgata gctagactgg gcggttttat ggacagcaag cgaaccggaa ttgccagctg 7080

gggcgccctc tggtaaggtt gggaagccct gcaaagtaaa ctggatggct ttcttgccgc 7140

caaggatctg atggcgcagg ggatcaagct ctgatcaaga gacaggatga ggatcgtttc 7200

gcatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg gagaggctat 7260

tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg ttccggctgt 7320

cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc ctgaatgaac 7380

tgcaagacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct tgcgcagctg 7440

tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa gtgccggggc 7500

aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg gctgatgcaa 7560

tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa gcgaaacatc 7620

gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat gatctggacg 7680

aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg agcatgcccg 7740

acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc atggtggaaa 7800

atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac cgctatcagg 7860

acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg gctgaccgct 7920

tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc tatcgccttc 7980

ttgacgagtt cttctgaatt ttgttaaaat ttttgttaaa tcagctcatt ttttaaccaa 8040

taggccgaaa tcggcaccat cccttataaa tcaaaagaat agaccgagat agggttgagt 8100

gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg 8160

cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccta atcaagtttt 8220

ttgtggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga 8280

gcttgacggg gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg 8340

ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgcgcgc 8400

ttaatgcgcc gctacagggc gcgtccattc gccattcagg atcgaattaa ttcttaatta 8460

a 8461

<210> 38

<211> 956

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 38

Met Ala Ser Glu Leu Ala Ala Leu Cys Arg Trp Gly Leu Leu Leu Ala

1 5 10 15

Leu Leu Pro Pro Gly Ala Ala Ser Thr Gln Val Cys Thr Gly Thr Asp

20 25 30

Met Lys Leu Arg Leu Pro Ala Ser Pro Glu Thr His Leu Asp Met Leu

35 40 45

Arg His Leu Tyr Gln Gly Cys Gln Val Val Gln Gly Asn Leu Glu Leu

50 55 60

Thr Tyr Leu Pro Thr Asn Ala Ser Leu Ser Phe Leu Gln Asp Ile Gln

65 70 75 80

Glu Val Gln Gly Tyr Val Leu Ile Ala His Asn Gln Val Arg Gln Val

85 90 95

Pro Leu Gln Arg Leu Arg Ile Val Arg Gly Thr Gln Leu Phe Glu Asp

100 105 110

Asn Tyr Ala Leu Ala Val Leu Asp Asn Gly Asp Pro Leu Asp Ser Val

115 120 125

Ala Pro Ala Ala Gly Ala Thr Pro Gly Gly Leu Gln Glu Leu Gln Leu

130 135 140

Arg Ser Leu Thr Glu Ile Leu Lys Gly Gly Val Leu Ile Arg Arg Ser

145 150 155 160

Pro Gln Leu Cys His Gln Asp Thr Val Leu Trp Glu Asp Val Phe Arg

165 170 175

Lys Asn Asn Gln Leu Ala Leu Val Leu Met Asp Thr Asn Arg Ser Arg

180 185 190

Ala Cys His Pro Cys Ala Pro Met Cys Lys Ala Asn His Cys Trp Gly

195 200 205

Glu Ser Ser Gln Asp Cys Gln Thr Leu Thr Arg Thr Ile Cys Thr Ser

210 215 220

Ala Cys Ala Arg Cys Lys Ala Pro Leu Pro Thr Asp Cys Cys His Glu

225 230 235 240

Gln Cys Ala Ala Gly Cys Thr Gly Pro Lys His Ser Asp Cys Leu Ala

245 250 255

Cys Leu His Phe Asn His Ser Gly Ile Cys Glu Leu His Cys Pro Ala

260 265 270

Leu Val Thr Tyr Asn Thr Asp Thr Phe Glu Ser Met Pro Asn Pro Glu

275 280 285

Gly Arg Tyr Thr Phe Gly Ala Ser Cys Val Thr Ala Cys Pro Tyr Asn

290 295 300

Tyr Leu Ser Thr Asp Val Gly Ser Cys Thr Leu Val Cys Pro Leu His

305 310 315 320

Asn Gln Glu Val Thr Ala Glu Asp Gly Thr Gln Arg Cys Glu Lys Cys

325 330 335

Ser Lys Pro Cys Ala Arg Val Cys Tyr Gly Leu Gly Met Glu His Leu

340 345 350

Arg Glu Ala Arg Ala Ile Thr Ser Ala Asn Val Gln Asp Phe Val Gly

355 360 365

Cys Lys Lys Ile Phe Gly Ser Leu Ala Phe Leu Pro Glu Ser Phe Asp

370 375 380

Gly Asp Pro Ala Ser Gly Thr Ala Pro Leu Gln Pro Glu Gln Leu Gln

385 390 395 400

Val Phe Glu Thr Leu Glu Glu Ile Thr Gly Tyr Leu Tyr Ile Ser Ala

405 410 415

Trp Pro Asp Ser Phe Pro Asn Leu Ser Val Phe Gln Asn Leu Arg Val

420 425 430

Ile Arg Gly Arg Ile Leu His Asn Gly Ala Tyr Ser Leu Thr Leu Gln

435 440 445

Gly Leu Gly Ile Ser Trp Leu Gly Leu Arg Ser Leu Gln Glu Leu Gly

450 455 460

Ser Gly Leu Ala Leu Val His Arg Asn Ala Arg Leu Cys Phe Val His

465 470 475 480

Thr Val Pro Trp Asp Gln Leu Phe Arg Asn Pro His Gln Ala Leu Leu

485 490 495

His Ser Gly Asn Arg Pro Glu Glu Asp Cys Val Gly Glu Gly Phe Val

500 505 510

Cys Tyr Ser Leu Cys Ala His Gly His Cys Trp Gly Pro Gly Pro Thr

515 520 525

Gln Cys Val Asn Cys Ser His Phe Leu Arg Gly Gln Glu Cys Val Glu

530 535 540

Glu Cys Arg Val Leu Gln Gly Leu Pro Arg Glu Tyr Val Asn Ala Arg

545 550 555 560

His Cys Leu Pro Cys His Pro Glu Cys Gln Pro Gln Asn Gly Ser Val

565 570 575

Thr Cys Phe Gly Pro Glu Ala Asp Gln Cys Val Ala Cys Ala His Tyr

580 585 590

Lys Asp Pro Pro Phe Cys Val Ala Arg Cys Pro Ser Gly Val Lys Pro

595 600 605

Asp Leu Ser Tyr Met Pro Ile Trp Lys Phe Pro Asp Glu Glu Gly Ala

610 615 620

Cys Gln Pro Cys Pro Ile Asn Cys Thr His Ser Cys Val Asp Leu Asp

625 630 635 640

Asp Lys Gly Cys Pro Ala Glu Gln Arg Ala Ser Pro Leu Thr Ser Ile

645 650 655

Ile Ser Ala Val Val Gly Ile Leu Leu Val Val Val Leu Gly Val Val

660 665 670

Phe Gly Ile Leu Ile Lys Arg Arg Gln Gln Lys Ile Arg Lys Tyr Thr

675 680 685

Met Arg Arg Asn Glu Asp Leu Gly Pro Ser Ser Pro Met Asp Ser Thr

690 695 700

Phe Tyr Arg Ser Leu Leu Glu Asp Glu Asp Met Gly Glu Leu Val Asp

705 710 715 720

Ala Glu Glu Tyr Leu Val Pro Gln Gln Gly Phe Phe Cys Pro Asp Pro

725 730 735

Thr Pro Gly Thr Gly Ser Thr Ala His Arg Arg His Arg Ser Ser Ser

740 745 750

Ala Arg Asn Gly Gly Gly Asp Leu Thr Leu Gly Met Glu Pro Ser Gly

755 760 765

Glu Gly Pro Pro Arg Ser Pro Arg Ala Pro Ser Glu Gly Thr Gly Ser

770 775 780

Asp Val Phe Asp Gly Asp Leu Ala Val Gly Val Thr Lys Gly Leu Gln

785 790 795 800

Ser Leu Ser Pro Gln Asp Leu Ser Pro Leu Gln Arg Tyr Ser Glu Asp

805 810 815

Pro Thr Leu Pro Leu Pro Ser Glu Thr Asp Gly Lys Val Ala Pro Leu

820 825 830

Ser Cys Ser Pro Gln Pro Glu Phe Val Asn Gln Ser Asp Val Gln Pro

835 840 845

Lys Ser Pro Leu Thr Pro Glu Gly Pro Pro Ser Pro Ala Arg Pro Thr

850 855 860

Gly Ala Thr Leu Glu Arg Ala Lys Thr Leu Ser Pro Gly Lys Asn Gly

865 870 875 880

Val Val Lys Asp Val Phe Thr Phe Gly Gly Ala Val Glu Asn Pro Glu

885 890 895

Phe Leu Ala Pro Arg Glu Gly Thr Ala Ser Pro Pro His Pro Ser Pro

900 905 910

Ala Phe Ser Pro Ala Phe Asp Asn Leu Phe Phe Trp Asp Gln Asn Ser

915 920 925

Ser Glu Gln Gly Pro Pro Pro Ser Asn Phe Glu Gly Thr Pro Thr Ala

930 935 940

Glu Asn Pro Glu Phe Leu Gly Leu Asp Val Pro Val

945 950 955

<210> 39

<211> 2871

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 39

atggctagcg agctggccgc cctgtgtaga tggggactgc tgctggctct gctgcctcct 60

ggagccgctt ctacacaggt ctgcaccggc accgacatga agctgagact gcccgccagc 120

cccgagacac acctggacat gctgcggcac ctgtaccagg gctgccaggt ggtccagggg 180

aatctggaac tgacctacct gcccaccaac gccagcctga gcttcctgca ggacatccag 240

gaagtgcagg gctacgtcct gatcgcccac aaccaggtcc gccaggtgcc cctgcagcgg 300

ctgagaatcg tgcggggcac ccagctgttc gaggacaact acgccctggc cgtgctggac 360

aacggcgacc ctctggatag cgtggcccct gctgctgggg ctacacctgg cggactgcag 420

gaactgcagc tgcggagcct gaccgagatc ctgaagggcg gcgtgctgat caggcggagc 480

cctcagctgt gccaccagga caccgtgctg tgggaggacg tgttccggaa gaacaaccag 540

ctggccctcg tgctgatgga caccaacaga agccgggcct gccacccctg cgcccccatg 600

tgcaaggcca atcactgctg gggagagagc agccaggact gccagaccct gacccggacc 660

atctgcacca gcgcctgcgc cagatgcaag gcccccctgc ctaccgactg ctgccacgaa 720

cagtgcgccg ctggctgcac cggccccaag cacagcgatt gcctggcctg cctgcacttc 780

aaccacagcg gcatctgcga gctgcactgc cctgccctgg tgacatacaa caccgacacc 840

ttcgagagca tgcccaaccc cgagggccgg tacaccttcg gcgccagctg tgtgaccgcc 900

tgcccctaca actacctgag caccgacgtg ggcagctgca ccctggtgtg ccccctgcac 960

aaccaggaag tgaccgccga ggacggcacc cagagatgcg agaagtgcag caagccttgc 1020

gccagagtgt gctacggcct gggcatggaa cacctgagag aggccagagc catcaccagc 1080

gccaacgtgc aggacttcgt gggctgcaag aagattttcg gctccctggc cttcctgccc 1140

gagagcttcg acggcgatcc tgcctctggc accgcccctc tgcagcctga gcagctgcag 1200

gtcttcgaga cactggaaga gatcaccggc tacctgtaca tcagcgcctg gcccgacagc 1260

ttccccaacc tgagcgtgtt ccagaacctg agagtgatcc ggggcagaat cctgcacaac 1320

ggcgcctaca gcctgaccct gcagggcctg ggaatcagct ggctgggcct gcggagcctg 1380

caggaactgg gatctggcct ggctctggtg caccggaacg cccggctgtg cttcgtgcac 1440

accgtgccct gggaccagct gttcagaaac ccccaccagg ctctgctgca cagcggcaac 1500

cggcccgaag aggattgcgt gggcgagggc ttcgtgtgct actccctgtg cgcccacggc 1560

cactgttggg gacctggccc tacccagtgc gtgaactgca gccacttcct gcggggccaa 1620

gaatgcgtgg aagagtgccg ggtgctgcag ggactgcccc gggaatacgt gaacgccaga 1680

cactgcctgc cttgccaccc cgagtgccag ccccagaatg gcagcgtgac ctgcttcgga 1740

cccgaggccg atcagtgtgt ggcctgcgcc cactacaagg accccccatt ctgcgtggcc 1800

agatgcccca gcggcgtgaa gcccgacctg agctacatgc ccatctggaa gttccccgac 1860

gaggaaggcg cctgccagcc ttgccccatc aactgcaccc acagctgcgt ggacctggac 1920

gacaagggct gccctgccga gcagagagcc agccccctga ccagcatcat cagcgccgtg 1980

gtgggaatcc tgctggtggt ggtgctgggc gtggtgttcg gcatcctgat caagcggcgg 2040

cagcagaaga tccggaagta caccatgcgg cggaacgagg acctgggccc ctctagcccc 2100

atggacagca ccttctaccg gtccctgctg gaagatgagg acatgggcga gctggtggac 2160

gccgaggaat acctggtgcc tcagcagggc ttcttctgcc ccgaccctac ccctggcacc 2220

ggctctaccg cccacagacg gcacagaagc agcagcgcca gaaacggcgg aggcgacctg 2280

accctgggaa tggaacctag cggcgaggga cctcccagaa gccctagagc ccctagcgag 2340

ggcaccggca gcgacgtgtt cgatggcgat ctggccgtgg gcgtgaccaa gggactgcag 2400

agcctgagcc cccaggacct gtcccccctg cagagataca gcgaggaccc caccctgccc 2460

ctgcccagcg agacagatgg caaggtggcc cccctgagct gcagccctca gcccgagttc 2520

gtgaaccaga gcgacgtgca gcccaagtcc cccctgacac ccgagggacc tccaagccct 2580

gccagaccta ccggcgccac cctggaaaga gccaagaccc tgagccccgg caagaacggc 2640

gtggtgaaag acgtgttcac cttcggaggc gccgtggaaa accccgagtt cctggccccc 2700

agagagggca cagccagccc tccacacccc agcccagcct tctcccccgc cttcgacaac 2760

ctgttcttct gggaccagaa cagcagcgag cagggcccac cccccagcaa tttcgagggc 2820

acccccaccg ccgagaatcc tgagttcctg ggcctggacg tgcccgtgtg a 2871

<210> 40

<211> 471

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 40

Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly

1 5 10 15

Ala His Ser Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys

20 25 30

Pro Gly Ala Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Thr Phe

35 40 45

Thr Gly Tyr Tyr Met His Trp Val Arg Gln Ala Pro Gly Gln Gly Leu

50 55 60

Glu Trp Met Gly Trp Ile Asn Pro Asp Ser Gly Gly Thr Asn Tyr Ala

65 70 75 80

Gln Lys Phe Gln Gly Arg Val Thr Met Thr Arg Asp Thr Ser Ile Ser

85 90 95

Thr Ala Tyr Met Glu Leu Asn Arg Leu Arg Ser Asp Asp Thr Ala Val

100 105 110

Tyr Tyr Cys Ala Arg Asp Gln Pro Leu Gly Tyr Cys Thr Asn Gly Val

115 120 125

Cys Ser Tyr Phe Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser

130 135 140

Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser

145 150 155 160

Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp

165 170 175

Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr

180 185 190

Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr

195 200 205

Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Asn Phe Gly Thr Gln

210 215 220

Thr Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp

225 230 235 240

Lys Thr Val Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala

245 250 255

Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys

260 265 270

Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val

275 280 285

Asp Val Ser His Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp

290 295 300

Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe

305 310 315 320

Asn Ser Thr Phe Arg Val Val Ser Val Leu Thr Val Val His Gln Asp

325 330 335

Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu

340 345 350

Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg

355 360 365

Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys

370 375 380

Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp

385 390 395 400

Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys

405 410 415

Thr Thr Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser

420 425 430

Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser

435 440 445

Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser

450 455 460

Leu Ser Leu Ser Pro Gly Lys

465 470

<210> 41

<211> 234

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 41

Met Arg Leu Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Pro

1 5 10 15

Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Val Ser

20 25 30

Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly

35 40 45

Ile Tyr Ser Trp Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro

50 55 60

Asn Leu Leu Ile Tyr Thr Ala Ser Thr Leu Gln Ser Gly Val Pro Ser

65 70 75 80

Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser

85 90 95

Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ala Asn

100 105 110

Ile Phe Pro Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg

115 120 125

Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln

130 135 140

Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr

145 150 155 160

Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser

165 170 175

Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr

180 185 190

Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys

195 200 205

His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro

210 215 220

Val Thr Lys Ser Phe Asn Arg Gly Glu Cys

225 230

<210> 42

<211> 451

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 42

Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr

20 25 30

Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

35 40 45

Ala Val Ile Trp Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr

65 70 75 80

Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Ala Arg Asp Pro Arg Gly Ala Thr Leu Tyr Tyr Tyr Tyr Tyr Gly Met

100 105 110

Asp Val Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr

115 120 125

Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser

130 135 140

Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu

145 150 155 160

Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His

165 170 175

Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser

180 185 190

Val Val Thr Val Pro Ser Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys

195 200 205

Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Thr Val Glu

210 215 220

Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro Pro Val Ala

225 230 235 240

Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met

245 250 255

Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His

260 265 270

Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val

275 280 285

His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe

290 295 300

Arg Val Val Ser Val Leu Thr Val Val His Gln Asp Trp Leu Asn Gly

305 310 315 320

Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ala Pro Ile

325 330 335

Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg Glu Pro Gln Val

340 345 350

Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser

355 360 365

Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu

370 375 380

Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro

385 390 395 400

Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val

405 410 415

Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met

420 425 430

His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser

435 440 445

Pro Gly Lys

450

<210> 43

<211> 214

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 43

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Asn Ser Tyr

20 25 30

Leu Asp Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile

35 40 45

Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly

50 55 60

Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro

65 70 75 80

Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Tyr Ser Thr Pro Phe

85 90 95

Thr Phe Gly Pro Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala

100 105 110

Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly

115 120 125

Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala

130 135 140

Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln

145 150 155 160

Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser

165 170 175

Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr

180 185 190

Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser

195 200 205

Phe Asn Arg Gly Glu Cys

210

<210> 44

<211> 24

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 44

tcgtcgtttt gtcgttttgt cgtt 24

<210> 45

<211> 21

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 45

tcgtcgtttt tcggtgcttt t 21

<210> 46

<211> 21

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 46

tcgtcgtttt tcggtcgttt t 21

<210> 47

<211> 239

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 47

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly

20 25 30

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80

Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95

Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu

100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn

145 150 155 160

Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser

165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220

Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210> 48

<211> 185

<212> ПРТ

<213> Вирус гепатита B из рода ортогепандавирусов

<400> 48

Met Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Thr Val Glu Leu Leu

1 5 10 15

Ser Phe Leu Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp

20 25 30

Thr Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys

35 40 45

Ser Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu

50 55 60

Leu Met Thr Leu Ala Thr Trp Val Gly Asn Asn Leu Glu Asp Pro Ala

65 70 75 80

Ser Arg Asp Leu Val Val Asn Tyr Val Asn Thr Asn Met Gly Leu Lys

85 90 95

Ile Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg

100 105 110

Glu Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr

115 120 125

Pro Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro

130 135 140

Glu Thr Thr Val Val Arg Arg Arg Gly Arg Gly Arg Ser Pro Arg Arg

145 150 155 160

Arg Thr Pro Ser Pro Arg Arg Arg Arg Ser Gln Ser Pro Arg Arg Arg

165 170 175

Arg Ser Gln Ser Arg Glu Ser Gln Cys

180 185

<210> 49

<211> 226

<212> ПРТ

<213> Вирус гепатита B из рода ортогепандавирусов

<400> 49

Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln

1 5 10 15

Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu

20 25 30

Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Ser Pro Val Cys

35 40 45

Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser

50 55 60

Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe

65 70 75 80

Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val

85 90 95

Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly

100 105 110

Ser Thr Thr Thr Ser Thr Gly Pro Cys Lys Thr Cys Thr Thr Pro Ala

115 120 125

Gln Gly Asn Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Thr Asp

130 135 140

Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Lys

145 150 155 160

Tyr Leu Trp Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu

165 170 175

Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu

180 185 190

Ser Ala Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Ser Ile

195 200 205

Val Ser Pro Phe Ile Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val

210 215 220

Tyr Ile

225

<210> 50

<211> 737

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 50

Met Ala Ser Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp

1 5 10 15

Val Pro Gly Ser Thr Gly Asp Ala Ala His His His His His His Lys

20 25 30

Ser Ser Ser Glu Ala Thr Asn Ile Thr Pro Lys His Asn Met Lys Ala

35 40 45

Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu His Asn

50 55 60

Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln Leu

65 70 75 80

Ala Lys Gln Ile Gln Ser Gln Trp Lys Glu Phe Gly Leu Asp Ser Val

85 90 95

Glu Leu Thr His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Lys Thr His

100 105 110

Pro Asn Tyr Ile Ser Ile Ile Asn Glu Asp Gly Asn Glu Ile Phe Asn

115 120 125

Thr Ser Leu Phe Glu Pro Pro Pro Ala Gly Tyr Glu Asn Val Ser Asp

130 135 140

Ile Val Pro Pro Phe Ser Ala Phe Ser Pro Gln Gly Met Pro Glu Gly

145 150 155 160

Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys Leu

165 170 175

Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile Val Ile Ala Arg

180 185 190

Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu Ala

195 200 205

Gly Ala Thr Gly Val Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe Ala

210 215 220

Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly Gly

225 230 235 240

Val Gln Arg Gly Asn Ile Leu Asn Leu Asn Gly Ala Gly Asp Pro Leu

245 250 255

Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile Ala

260 265 270

Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr Tyr

275 280 285

Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser Ala Ser Pro Asp

290 295 300

Ser Ser Trp Arg Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro Gly

305 310 315 320

Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met His Ile His Ser

325 330 335

Thr Ser Glu Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Arg Gly

340 345 350

Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp Ser

355 360 365

Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val His

370 375 380

Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Glu Gly Trp Arg Pro

385 390 395 400

Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly Leu

405 410 415

Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln Glu

420 425 430

Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn Tyr

435 440 445

Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser Leu Val Tyr Asn

450 455 460

Leu Thr Lys Glu Leu Glu Ser Pro Asp Glu Gly Phe Glu Gly Lys Ser

465 470 475 480

Leu Tyr Glu Ser Trp Thr Lys Ser Pro Ser Pro Glu Phe Ser Gly Met

485 490 495

Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val Phe Phe

500 505 510

Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys Asn Trp

515 520 525

Glu Thr Asn Lys Phe Ser Ser Tyr Pro Leu Tyr His Ser Val Tyr Glu

530 535 540

Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys Tyr His

545 550 555 560

Leu Thr Val Ala Gln Val Arg Gly Gly Met Val Phe Glu Leu Ala Asn

565 570 575

Ser Val Val Leu Pro Phe Asp Cys Arg Asp Tyr Ala Val Val Leu Arg

580 585 590

Lys Tyr Ala Asp Lys Ile Tyr Asn Ile Ser Met Lys His Pro Gln Glu

595 600 605

Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala Val Lys

610 615 620

Asn Phe Thr Glu Ile Ala Ser Lys Phe Ser Glu Arg Leu Arg Asp Phe

625 630 635 640

Asp Lys Ser Asn Pro Ile Leu Leu Arg Met Met Asn Asp Gln Leu Met

645 650 655

Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp Arg Pro

660 665 670

Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys Tyr Ala

675 680 685

Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile Glu Ser

690 695 700

Lys Val Asp Pro Ser Gln Ala Trp Gly Glu Val Lys Arg Gln Ile Ser

705 710 715 720

Ile Ala Thr Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser Glu Val

725 730 735

Ala

<210> 51

<211> 9

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 51

Thr Tyr Val Pro Ala Asn Ala Ser Leu

1 5

<210> 52

<211> 15

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 52

Asp Met Val Leu Trp Lys Asp Val Phe Arg Lys Asn Asn Gln Leu

1 5 10 15

<210> 53

<211> 9

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 53

Ser Tyr Val Asn Thr Asn Met Gly Leu

1 5

<210> 54

<211> 957

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 54

Met Ala Ser Glu Leu Ala Ala Trp Cys Arg Trp Gly Phe Leu Leu Ala

1 5 10 15

Leu Leu Pro Pro Gly Ile Ala Gly Thr Gln Val Cys Thr Gly Thr Asp

20 25 30

Met Lys Leu Arg Leu Pro Ala Ser Pro Glu Thr His Leu Asp Met Leu

35 40 45

Arg His Leu Tyr Gln Gly Cys Gln Val Val Gln Gly Asn Leu Glu Leu

50 55 60

Thr Tyr Val Pro Ala Asn Ala Ser Leu Ser Phe Leu Gln Asp Ile Gln

65 70 75 80

Glu Val Gln Gly Tyr Met Leu Ile Ala His Asn Gln Val Lys Arg Val

85 90 95

Pro Leu Gln Arg Leu Arg Ile Val Arg Gly Thr Gln Leu Phe Glu Asp

100 105 110

Lys Tyr Ala Leu Ala Val Leu Asp Asn Arg Asp Pro Gln Asp Asn Val

115 120 125

Ala Ala Ser Thr Pro Gly Arg Thr Pro Glu Gly Leu Arg Glu Leu Gln

130 135 140

Leu Arg Ser Leu Thr Glu Ile Leu Lys Gly Gly Val Leu Ile Arg Gly

145 150 155 160

Asn Pro Gln Leu Cys Tyr Gln Asp Met Val Leu Trp Lys Asp Val Phe

165 170 175

Arg Lys Asn Asn Gln Leu Ala Pro Val Asp Ile Asp Thr Asn Arg Ser

180 185 190

Arg Ala Cys Pro Pro Cys Ala Pro Ala Cys Lys Asp Asn His Cys Trp

195 200 205

Gly Glu Ser Pro Glu Asp Cys Gln Ile Leu Thr Gly Thr Ile Cys Thr

210 215 220

Ser Gly Cys Ala Arg Cys Lys Gly Arg Leu Pro Thr Asp Cys Cys His

225 230 235 240

Glu Gln Cys Ala Ala Gly Cys Thr Gly Pro Lys His Ser Asp Cys Leu

245 250 255

Ala Cys Leu His Phe Asn His Ser Gly Ile Cys Glu Leu His Cys Pro

260 265 270

Ala Leu Val Thr Tyr Asn Thr Asp Thr Phe Glu Ser Met His Asn Pro

275 280 285

Glu Gly Arg Tyr Thr Phe Gly Ala Ser Cys Val Thr Thr Cys Pro Tyr

290 295 300

Asn Tyr Leu Ser Thr Glu Val Gly Ser Cys Thr Leu Val Cys Pro Pro

305 310 315 320

Asn Asn Gln Glu Val Thr Ala Glu Asp Gly Thr Gln Arg Cys Glu Lys

325 330 335

Cys Ser Lys Pro Cys Ala Arg Val Cys Tyr Gly Leu Gly Met Glu His

340 345 350

Leu Arg Gly Ala Arg Ala Ile Thr Ser Asp Asn Val Gln Glu Phe Asp

355 360 365

Gly Cys Lys Lys Ile Phe Gly Ser Leu Ala Phe Leu Pro Glu Ser Phe

370 375 380

Asp Gly Asp Pro Ser Ser Gly Ile Ala Pro Leu Arg Pro Glu Gln Leu

385 390 395 400

Gln Val Phe Glu Thr Leu Glu Glu Ile Thr Gly Tyr Leu Tyr Ile Ser

405 410 415

Ala Trp Pro Asp Ser Leu Arg Asp Leu Ser Val Phe Gln Asn Leu Arg

420 425 430

Ile Ile Arg Gly Arg Ile Leu His Asp Gly Ala Tyr Ser Leu Thr Leu

435 440 445

Gln Gly Leu Gly Ile His Ser Leu Gly Leu Arg Ser Leu Arg Glu Leu

450 455 460

Gly Ser Gly Leu Ala Leu Ile His Arg Asn Ala His Leu Cys Phe Val

465 470 475 480

His Thr Val Pro Trp Asp Gln Leu Phe Arg Asn Pro His Gln Ala Leu

485 490 495

Leu His Ser Gly Asn Arg Pro Glu Glu Asp Cys Gly Leu Glu Gly Leu

500 505 510

Val Cys Asn Ser Leu Cys Ala His Gly His Cys Trp Gly Pro Gly Pro

515 520 525

Thr Gln Cys Val Asn Cys Ser His Phe Leu Arg Gly Gln Glu Cys Val

530 535 540

Glu Glu Cys Arg Val Trp Lys Gly Leu Pro Arg Glu Tyr Val Ser Asp

545 550 555 560

Lys Arg Cys Leu Pro Cys His Pro Glu Cys Gln Pro Gln Asn Ser Ser

565 570 575

Glu Thr Cys Phe Gly Ser Glu Ala Asp Gln Cys Ala Ala Cys Ala His

580 585 590

Tyr Lys Asp Ser Ser Ser Cys Val Ala Arg Cys Pro Ser Gly Val Lys

595 600 605

Pro Asp Leu Ser Tyr Met Pro Ile Trp Lys Tyr Pro Asp Glu Glu Gly

610 615 620

Ile Cys Gln Pro Cys Pro Ile Asn Cys Thr His Ser Cys Val Asp Leu

625 630 635 640

Asp Glu Arg Gly Cys Pro Ala Glu Gln Arg Ala Ser Pro Val Thr Phe

645 650 655

Ile Ile Ala Thr Val Val Gly Val Leu Leu Phe Leu Ile Leu Val Val

660 665 670

Val Val Gly Ile Leu Ile Lys Arg Arg Arg Gln Lys Ile Arg Lys Tyr

675 680 685

Thr Met Arg Arg Asn Glu Asp Leu Gly Pro Ser Ser Pro Met Asp Ser

690 695 700

Thr Phe Tyr Arg Ser Leu Leu Glu Asp Asp Asp Met Gly Asp Leu Val

705 710 715 720

Asp Ala Glu Glu Tyr Leu Val Pro Gln Gln Gly Phe Phe Ser Pro Asp

725 730 735

Pro Thr Pro Gly Thr Gly Ser Thr Ala His Arg Arg His Arg Ser Ser

740 745 750

Ser Thr Arg Ser Gly Gly Gly Glu Leu Thr Leu Gly Leu Glu Pro Ser

755 760 765

Glu Glu Gly Pro Pro Arg Ser Pro Leu Ala Pro Ser Glu Gly Ala Gly

770 775 780

Ser Asp Val Phe Asp Gly Asp Leu Ala Met Gly Val Thr Lys Gly Leu

785 790 795 800

Gln Ser Leu Ser Pro His Asp Leu Ser Pro Leu Gln Arg Tyr Ser Glu

805 810 815

Asp Pro Thr Leu Pro Leu Pro Pro Glu Thr Asp Gly Tyr Val Ala Pro

820 825 830

Leu Ala Cys Ser Pro Gln Pro Glu Phe Val Asn Gln Ser Glu Val Gln

835 840 845

Pro Gln Pro Pro Leu Thr Pro Glu Gly Pro Leu Pro Pro Val Arg Pro

850 855 860

Ala Gly Ala Thr Leu Glu Arg Pro Lys Thr Leu Ser Pro Gly Lys Asn

865 870 875 880

Gly Val Val Lys Asp Val Phe Ala Phe Gly Gly Ala Val Glu Asn Pro

885 890 895

Glu Phe Leu Val Pro Arg Glu Gly Thr Ala Ser Pro Pro His Pro Ser

900 905 910

Pro Ala Phe Ser Pro Ala Phe Asp Asn Leu Phe Phe Trp Asp Gln Asn

915 920 925

Ser Ser Glu Gln Gly Pro Pro Pro Ser Asn Phe Glu Gly Thr Pro Thr

930 935 940

Ala Glu Asn Pro Glu Phe Leu Gly Leu Asp Val Pro Val

945 950 955

<210> 55

<211> 739

<212> ПРТ

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 55

Met Ala Ser Ala Arg Arg Pro Arg Trp Leu Cys Ala Gly Ala Leu Val

1 5 10 15

Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe Leu Phe Gly Trp Phe Ile

20 25 30

Lys Ser Ser Ser Glu Ala Thr Asn Ile Thr Pro Lys His Asn Met Lys

35 40 45

Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn Ile Lys Lys Phe Leu His

50 55 60

Asn Phe Thr Gln Ile Pro His Leu Ala Gly Thr Glu Gln Asn Phe Gln

65 70 75 80

Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys Glu Phe Gly Leu Asp Ser

85 90 95

Val Glu Leu Thr His Tyr Asp Val Leu Leu Ser Tyr Pro Asn Lys Thr

100 105 110

His Pro Asn Tyr Ile Ser Ile Ile Asn Glu Asp Gly Asn Glu Ile Phe

115 120 125

Asn Thr Ser Leu Phe Glu Pro Pro Pro Ala Gly Tyr Glu Asn Val Ser

130 135 140

Asp Ile Val Pro Pro Phe Ser Ala Phe Ser Pro Gln Gly Met Pro Glu

145 150 155 160

Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg Thr Glu Asp Phe Phe Lys

165 170 175

Leu Glu Arg Asp Met Lys Ile Asn Cys Ser Gly Lys Ile Val Ile Ala

180 185 190

Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys Val Lys Asn Ala Gln Leu

195 200 205

Ala Gly Ala Thr Gly Val Ile Leu Tyr Ser Asp Pro Ala Asp Tyr Phe

210 215 220

Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly Trp Asn Leu Pro Gly Gly

225 230 235 240

Gly Val Gln Arg Gly Asn Ile Leu Asn Leu Asn Gly Ala Gly Asp Pro

245 250 255

Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr Ala Tyr Arg Arg Gly Ile

260 265 270

Ala Glu Ala Val Gly Leu Pro Ser Ile Pro Val His Pro Ile Gly Tyr

275 280 285

Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met Gly Gly Ser Ala Ser Pro

290 295 300

Asp Ser Ser Trp Arg Gly Ser Leu Lys Val Pro Tyr Asn Val Gly Pro

305 310 315 320

Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys Val Lys Met His Ile His

325 330 335

Ser Thr Ser Glu Val Thr Arg Ile Tyr Asn Val Ile Gly Thr Leu Arg

340 345 350

Gly Ala Val Glu Pro Asp Arg Tyr Val Ile Leu Gly Gly His Arg Asp

355 360 365

Ser Trp Val Phe Gly Gly Ile Asp Pro Gln Ser Gly Ala Ala Val Val

370 375 380

His Glu Ile Val Arg Ser Phe Gly Thr Leu Lys Lys Glu Gly Trp Arg

385 390 395 400

Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp Asp Ala Glu Glu Phe Gly

405 410 415

Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu Asn Ser Arg Leu Leu Gln

420 425 430

Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp Ser Ser Ile Glu Gly Asn

435 440 445

Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu Met Tyr Ser Leu Val Tyr

450 455 460

Asn Leu Thr Lys Glu Leu Glu Ser Pro Asp Glu Gly Phe Glu Gly Lys

465 470 475 480

Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser Pro Ser Pro Glu Phe Ser

485 490 495

Gly Met Pro Arg Ile Ser Lys Leu Gly Ser Gly Asn Asp Phe Glu Val

500 505 510

Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly Arg Ala Arg Tyr Thr Lys

515 520 525

Asn Trp Glu Thr Asn Lys Phe Ser Ser Tyr Pro Leu Tyr His Ser Val

530 535 540

Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe Tyr Asp Pro Met Phe Lys

545 550 555 560

Tyr His Leu Thr Val Ala Gln Val Arg Gly Gly Met Val Phe Glu Leu

565 570 575

Ala Asn Ser Val Val Leu Pro Phe Asp Cys Arg Asp Tyr Ala Val Val

580 585 590

Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Asn Ile Ser Met Lys His Pro

595 600 605

Gln Glu Met Lys Thr Tyr Ser Val Ser Phe Asp Ser Leu Phe Ser Ala

610 615 620

Val Lys Asn Phe Thr Glu Ile Ala Ser Lys Phe Ser Glu Arg Leu Arg

625 630 635 640

Asp Phe Asp Lys Ser Asn Pro Ile Leu Leu Arg Met Met Asn Asp Gln

645 650 655

Leu Met Phe Leu Glu Arg Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp

660 665 670

Arg Pro Phe Tyr Arg His Val Ile Tyr Ala Pro Ser Ser His Asn Lys

675 680 685

Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile

690 695 700

Glu Ser Lys Val Asp Pro Ser Gln Ala Trp Gly Glu Val Lys Arg Gln

705 710 715 720

Ile Ser Ile Ala Thr Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser

725 730 735

Glu Val Ala

<210> 56

<211> 2217

<212> ДНК

<213> Искуственная

<220>

<223> Синтетическая конструкция

<400> 56

atggctagcg ctagaaggcc cagatggctg tgcgctggcg ccctggtgct ggctggcgga 60

ttcttcctgc tgggcttcct gttcggctgg ttcatcaagt cctccagcga ggccaccaac 120

atcaccccca agcacaacat gaaggccttt ctggacgagc tgaaggccga gaatatcaag 180

aagttcctgc acaacttcac ccagatcccc cacctggccg gcaccgagca gaacttccag 240

ctggccaagc agatccagtc ccagtggaaa gagttcggcc tggactccgt ggaactgacc 300

cactacgacg tgctgctgtc ctaccccaac aagacccacc ccaactacat ctccatcatc 360

aacgaggacg gcaacgaaat cttcaacacc tccctgttcg agcccccacc agccggctac 420

gagaacgtgt ccgacatcgt gcccccattc tccgcattca gtccacaagg catgcccgag 480

ggcgacctgg tgtacgtgaa ctacgccagg accgaggact tcttcaagct ggaaagggac 540

atgaagatca actgctccgg caagatcgtg atcgccagat acggcaaggt gttcaggggc 600

aacaaagtga agaacgctca gctggctggg gccaccggcg tgatcctgta ctctgacccc 660

gccgactact tcgccccagg cgtgaagtcc taccccgacg gctggaacct gccaggtggc 720

ggagtgcaga ggggcaacat cctgaacctg aacggcgctg gcgaccccct gaccccagga 780

taccccgcca acgagtacgc ctacagaaga ggaatcgccg aggccgtggg cctgccctct 840

atcccagtgc accccatcgg ctactacgac gcccagaaac tgctggaaaa gatgggcggc 900

tccgcctccc ccgactcctc ttggagaggc tccctgaagg tgccctacaa cgtgggccca 960

ggcttcaccg gcaacttctc cacccagaaa gtgaagatgc acatccactc cacctccgaa 1020

gtgaccagga tctacaacgt gatcggcacc ctgagaggcg ccgtggaacc cgacagatac 1080

gtgatcctgg gcggccacag ggacagctgg gtgttcggcg gcatcgaccc acagtctggc 1140

gccgctgtgg tgcacgagat cgtgcggtcc ttcggaaccc tgaagaaaga gggatggcgc 1200

cccagaagga caatcctgtt cgcctcctgg gacgccgagg aattcggcct gctgggatcc 1260

accgagtggg ccgaggaaaa ctccaggctg ctgcaggaaa ggggcgtcgc ctacatcaac 1320

gccgactcct ccatcgaggg caactacacc ctgagggtgg actgcacccc cctgatgtac 1380

tccctggtgt acaacctgac caaagagctg gaatcccccg acgagggctt cgagggcaag 1440

tccctgtacg agtcctggac caagaagtcc ccatcccccg agttctccgg catgcccagg 1500

atctccaagc tgggctccgg caacgacttc gaggtgttct tccagaggct gggaatcgcc 1560

tccggcaggg ccagatacac caagaactgg gagacaaaca agttctcctc ctaccccctg 1620

taccactccg tgtacgaaac ctacgagctg gtggaaaagt tctacgaccc catgttcaag 1680

taccacctga ccgtggccca ggtccgcgga ggcatggtgt tcgagctggc caactccgtg 1740

gtgctgccct tcgactgcag agactatgct gtggtgctga ggaagtacgc cgacaaaatc 1800

tacaacatct ccatgaagca cccccaggaa atgaagacct actccgtgtc cttcgactcc 1860

ctgttctccg ccgtgaagaa tttcaccgag atcgcctcca agttctccga gaggctgagg 1920

gacttcgaca agtccaaccc catcctgctg aggatgatga acgaccagct gatgttcctg 1980

gaaagggcct tcatcgaccc cctgggcctg ccagacaggc ccttctacag gcacgtgatc 2040

tacgccccat cctcccacaa caaatacgcc ggcgagtcct tccccggcat ctacgatgcc 2100

ctgttcgaca tcgagtccaa ggtggacccc tcccaggctt ggggcgaagt gaagaggcag 2160

atcagtatcg ccacattcac agtgcaggcc gctgccgaaa ccctgtccga ggtggcc 2217

<210> 57

<211> 36519

<212> ДНК

<213> Обезьяний аденовирус, тип 25

<400> 57

ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60

aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120

gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180

tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240

aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300

gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360

gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420

tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480

atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540

tcctccgcgc cgcgagtcag atctacactt tgaaagatga ggcacctgag agacctgccc 600

gatgagaaaa tcatcatcgc ttccgggaac gagattctgg aactggtggt aaatgccatg 660

atgggcgacg accctccgga gccccccacc ccatttgaga caccttcgct gcacgatttg 720

tatgatctgg aggtggatgt gcccgaggac gatcccaatg aggaggcggt aaatgatttt 780

tttagcgatg ccgcgctgct agctgccgag gaggcttcga gctctagctc agacagcgac 840

tcttcactgc atacccctag acccggcaga ggtgagaaaa agatccccga gcttaaaggg 900

gaagagatgg acttgcgctg ctatgaggaa tgcttgcccc cgagcgatga tgaggacgag 960

caggcgatcc agaacgcagc gagccaggga gtgcaagccg ccagcgagag ctttgcgctg 1020

gactgcccgc ctctgcccgg acacggctgt aagtcttgtg aatttcatcg catgaatact 1080

ggagataaag ctgtgttgtg tgcactttgc tatatgagag cttacaacca ttgtgtttac 1140

agtaagtgtg attaagttga actttagagg gaggcagaga gcagggtgac tgggcgatga 1200

ctggtttatt tatgtatata tgttctttat ataggtcccg tctctgacgc agatgatgag 1260

acccccacta caaagtccac ttcgtcaccc ccagaaattg gcacatctcc acctgagaat 1320

attgttagac cagttcctgt tagagccact gggaggagag cagctgtgga atgtttggat 1380

gacttgctac agggtggggt tgaacctttg gacttgtgta cccggaaacg ccccaggcac 1440

taagtgccac acatgtgtgt ttacttgagg tgatgtcagt atttataggg tgtggagtgc 1500

aataaaaaat gtgttgactt taagtgcgtg gtttatgact caggggtggg gactgtgagt 1560

atataagcag gtgcagacct gtgtggttag ctcagagcgg catggagatt tggacggtct 1620

tggaagactt tcacaagact agacagctgc tagagaacgc ctcgaacgga gtctcttacc 1680

tgtggagatt ctgcttcggt ggcgacctag ctaggctagt ctacagggcc aaacaggatt 1740

atagtgaaca atttgaggtt attttgagag agtgttctgg tctttttgac gctcttaact 1800

tgggccatca gtctcacttt aaccagagga tttcgagagc ccttgatttt actactcctg 1860

gcagaaccac tgcagcagta gccttttttg cttttattct tgacaaatgg agtcaagaaa 1920

cccatttcag cagggattac cagctggatt tcttagcagt agctttgtgg agaacatgga 1980

agtgccagcg cctgaatgca atctccggct acttgccggt acagccgcta gacactctga 2040

ggatcctgaa tctccaggag agtcccaggg cacgccaacg tcgccagcag cagcagcagg 2100

aggaggatca agaagagaac ccgagagccg gcctggaccc tccggcggag gaggaggagt 2160

agctgacctg tttcctgaac tgcgccgggt gctgactagg tcttcgagtg gtcgggagag 2220

ggggattaag cgggagaggc atgatgagac taatcacaga actgaactga ctgtgggtct 2280

gatgagtcgc aagcgcccag aaacagtgtg gtggcatgag gtgcagtcga ctggcacaga 2340

tgaggtgtcg gtgatgcatg agaggttttc tctagaacaa gtcaagactt gttggttaga 2400

gcctgaggat gattgggagg tagccatcag gaattatgcc aagctggctc tgaggccaga 2460

caagaagtac aagattacta agctgataaa tatcagaaat gcctgctaca tctcagggaa 2520

tggggctgaa gtggagatct gtctccagga aagggtggct ttcagatgct gcatgatgaa 2580

tatgtacccg ggagtggtgg gcatggatgg ggttaccttt atgaacatga ggttcagggg 2640

agatgggtat aatggcacgg tctttatggc caataccaag ctgacagtcc atggctgctc 2700

cttctttggg tttaataaca cctgcatcga ggcctggggt caggtcggtg tgaggggctg 2760

cagtttttca gccaactgga tgggggtcgt gggcaggacc aagagtatgc tgtccgtgaa 2820

gaaatgcttg tttgagaggt gccacctggg ggtgatgagc gagggcgaag ccagaatccg 2880

ccactgcgcc tctaccgaga cgggctgctt tgtgctgtgc aagggcaatg ctaagatcaa 2940

gcataatatg atctgtggag cctcggacga gcgcggctac cagatgctga cctgcgccgg 3000

cgggaacagc catatgctgg ccaccgtaca tgtggcttcc catgctcgca agccctggcc 3060

cgagttcgag cacaatgtca tgaccaggtg caatatgcat ctggggtccc gccgaggcat 3120

gttcatgccc taccagtgca acctgaatta tgtgaaggtg ctgctggagc ccgatgccat 3180

gtccagagtg agcctgacgg gggtgtttga catgaatgtg gaggtgtgga agattctgag 3240

atatgatgaa tccaagacca ggtgccgagc ctgcgagtgc ggagggaagc atgccaggtt 3300

ccagcccgtg tgtgtggatg tgacggagga cctgcgaccc gatcatttgg tgttgccctg 3360

caccgggacg gagttcggtt ccagcgggga agaatctgac tagagtgagt agtgttctgg 3420

ggcgggggag gacctgcatg agggccagaa taactgaaat ctgtgctttt ctgtgtgttg 3480

cagcagcatg agcggaagcg gctcctttga gggaggggta ttcagccctt atctgacggg 3540

gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg tggacggccg 3600

gcccgtgcag cccgcgaact cttcaaccct gacctatgca accctgagct cttcgtcgtt 3660

ggacgcagct gccgccgcag ctgctgcatc tgccgccagc gccgtgcgcg gaatggccat 3720

gggcgccggc tactacggca ctctggtggc caactcgagt tccaccaata atcccgccag 3780

cctgaacgag gagaagctgt tgctgctgat ggcccagctc gaggccttga cccagcgcct 3840

gggcgagctg acccagcagg tggctcagct gcaggagcag acgcgggccg cggttgccac 3900

ggtgaaatcc aaataaaaaa tgaatcaata aataaacgga gacggttgtt gattttaaca 3960

cagagtctga atctttattt gatttttcgc gcgcggtagg ccctggacca ccggtctcga 4020

tcattgagca cccggtggat cttttccagg acccggtaga ggtgggcttg gatgttgagg 4080

tacatgggca tgagcccgtc ccgggggtgg aggtagctcc attgcagggc ctcgtgctcg 4140

ggggtggtgt tgtaaatcac ccagtcatag caggggcgca gggcatggtg ttgcacaata 4200

tctttgagga ggagactgat ggccacgggc agccctttgg tgtaggtgtt tacaaatctg 4260

ttgagctggg agggatgcat gcggggggag atgaggtgca tcttggcctg gatcttgaga 4320

ttggcgatgt taccgcccag atcccgcctg gggttcatgt tgtgcaggac caccagcacg 4380

gtgtatccgg tgcacttggg gaatttatca tgcaacttgg aagggaaggc gtgaaagaat 4440

ttggcgacgc ctttgtgccc gcccaggttt tccatgcact catccatgat gatggcgatg 4500

ggcccgtggg cggcggcctg ggcaaagacg tttcgggggt cggacacatc atagttgtgg 4560

tcctgggtga ggtcatcata ggccatttta atgaatttgg ggcggagggt gccggactgg 4620

gggacaaagg taccctcgat cccgggggcg tagttcccct cacagatctg catctcccag 4680

gctttgagct cggagggggg gatcatgtcc acctgcgggg cgataaagaa cacggtttcc 4740

ggggcggggg agatgagctg ggccgaaagc aagttccgga gcagctggga cttgccgcag 4800

ccggtggggc cgtagatgac cccgatgacc ggctgcaggt ggtagttgag ggagagacag 4860

ctgccgtcct cccggaggag gggggccacc tcgttcatca tctcgcgcac gtgcatgttc 4920

tcgcgcacca gttccgccag gaggcgctct ccccccaggg ataggagctc ctggagcgag 4980

gcgaagtttt tcagcggctt gagtccgtcg gccatgggca ttttggagag ggtttgttgc 5040

aagagttcca ggcggtccca gagctcggtg atgtgctcta cggcatctcg atccagcaga 5100

cctcctcgtt tcgcgggttg ggacggctgc gggagtaggg caccagacga tgggcgtcca 5160

gcgcagccag ggtccggtcc ttccagggtc gcagcgtccg cgtcagggtg gtctccgtca 5220

cggtgaaggg gtgcgcgccg ggctgggcgc ttgcgagggt gcgcttcagg ctcatccggc 5280

tggtcgaaaa ccgctcccga tcggcgccct gcgcgtcggc caggtagcaa ttgaccatga 5340

gttcgtagtt gagcgcctcg gccgcgtggc ctttggcgcg gagcttacct ttggaagtct 5400

gcccgcaggc gggacagagg agggacttga gggcgtagag cttgggggcg aggaagacgg 5460

actcgggggc gtaggcgtcc gcgccgcagt gggcgcagac ggtctcgcac tccacgagcc 5520

aggtgaggtc gggctggtcg gggtcaaaaa ccagtttccc gccgttcttt ttgatgcgtt 5580

tcttaccttt ggtctccatg agctcgtgtc cccgctgggt gacaaagagg ctgtccgtgt 5640

ccccgtagac cgactttatg ggccggtcct cgagcggtgt gccgcggtcc tcctcgtaga 5700

ggaaccccgc ccactccgag acgaaagccc gggtccaggc cagcacgaag gaggccacgt 5760

gggacgggta gcggtcgttg tccaccagcg ggtccacctt ttccagggta tgcaaacaca 5820

tgtccccctc gtccacatcc aggaaggtga ttggcttgta agtgtaggcc acgtgaccgg 5880

gggtcccggc cgggggggta taaaagggtg cgggtccctg ctcgtcctca ctgtcttccg 5940

gatcgctgtc caggagcgcc agctgttggg gtaggtattc cctctcgaag gcgggcatga 6000

cctcggcact caggttgtca gtttctagaa acgaggagga tttgatattg acggtgccgg 6060

cggagatgcc tttcaagagc ccctcgtcca tctggtcaga aaagacgatc tttttgttgt 6120

cgagcttggt ggcgaaggag ccgtagaggg cgttggagag gagcttggcg atggagcgca 6180

tggtctggtt tttttccttg tcggcgcgct ccttggcggc gatgttgagc tgcacgtact 6240

cgcgcgccac gcacttccat tcggggaaga cggtggtcag ctcgtcgggc acgattctga 6300

cctgccagcc ccgattatgc agggtgatga ggtccacact ggtggccacc tcgccgcgca 6360

ggggctcatt agtccagcag aggcgtccgc ccttgcgcga gcagaagggg ggcagggggt 6420

ccagcatgac ctcgtcgggg gggtcggcat cgatggtgaa gatgccgggc aggaggtcgg 6480

ggtcaaagta gctgatggaa gtggccagat cgtccagggc agcttgccat tcgcgcacgg 6540

ccagcgcgcg ctcgtaggga ctgaggggcg tgccccaggg catgggatgg gtaagcgcgg 6600

aggcgtacat gccgcagatg tcgtagacgt agaggggctc ctcgaggatg ccgatgtagg 6660

tggggtagca gcgccccccg cggatgctgg cgcgcacgta gtcatacagc tcgtgcgagg 6720

gggcgaggag ccccgggccc aggttggtgc gactgggctt ttcggcgcgg tagacgatct 6780

ggcggaaaat ggcatgcgag ttggaggaga tggtgggcct ttggaagatg ttgaagtggg 6840

cgtggggcag tccgaccgag tcgcggatga agtgggcgta ggagtcttgc agcttggcga 6900

cgagctcggc ggtgactagg acgtccagag cgcagtagtc gagggtctcc tggatgatgt 6960

catacttgag ctgtcccttt tgtttccaca gctcgcggtt gagaaggaac tcttcgcggt 7020

ccttccagta ctcttcgagg gggaacccgt cctgatctgc acggtaagag cctagcatgt 7080

agaactggtt gacggccttg taggcgcagc agcccttctc cacggggagg gcgtaggcct 7140

gggcggcctt gcgcagggag gtgtgcgtga gggcgaaagt gtccctgacc atgaccttga 7200

ggaactggtg cttgaagtcg atatcgtcgc agcccccctg ctcccagagc tggaagtccg 7260

tgcgcttctt gtaggcgggg ttgggcaaag cgaaagtaac atcgttgaag aggatcttgc 7320

ccgcgcgggg cataaagttg cgagtgatgc ggaaaggttg gggcacctcg gcccggttgt 7380

tgatgacctg ggcggcgagc acgatctcgt cgaagccgtt gatgttgtgg cccacgatgt 7440

agagttccac gaatcgcgga cggcccttga cgtggggcag tttcttgagc tcctcgtagg 7500

tgagctcgtc ggggtcgctg agcccgtgct gctcgagcgc ccagtcggcg agatgggggt 7560

tggcgcggag gaaggaagtc cagagatcca cggccagggc ggtttgcaga cggtcccggt 7620

actgacggaa ctgctgcccg acggccattt tttcgggggt gacgcagtag aaggtgcggg 7680

ggtccccgtg ccagcgatcc catttgagct ggagggcgag atcgagggcg agctcgacga 7740

gccggtcgtc cccggagagt ttcatgacca gcatgaaggg gacgagctgc ttgccgaagg 7800

accccatcca ggtgtaggtt tccacatcgt aggtgaggaa gagcctttcg gtgcgaggat 7860

gcgagccgat ggggaagaac tggatctcct gccaccaatt ggaggaatgg ctgttgatgt 7920

gatggaagta gaaatgccga cggcgcgccg aacactcgtg cttgtgttta tacaagcggc 7980

cacagtgctc gcaacgctgc acgggatgca cgtgctgcac gagctgtacc tgagttcctt 8040

tgacgaggaa tttcagtggg aagtggagtc gtggcgcctg catctcgtgc tgtactacgt 8100

cgtggtggtc ggcctggccc tcttctgcct cgatggtggt catgctgacg agcccgcgcg 8160

ggaggcaggt ccagacctcg gcgcgagcgg gtcggagagc gaggacgagg gcgcgcaggc 8220

cggagctgtc cagggtcctg agacgctgcg gagtcaggtc agtgggcagc ggcggcgcgc 8280

ggttgacttg caggagtttt tccagggcgc gcgggaggtc cagatggtac ttgatctcca 8340

ccgcgccatt ggtggcgacg tcgatggctt gcagggtccc gtgcccctgg ggtgtgacca 8400

ccgtcccccg tttcttcttg ggcggctggg gcgacggggg cggtgcctct tccatggtta 8460

gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520

cggcaggggc acgtcggcgc cgcgcgcggg taggttctgg tactgcgccc ggagaagact 8580

ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640

gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700

ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760

catgaactgc tcgatctcct cctcttgaag gtctccgcgg ccggcgcgct ccacggtggc 8820

cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc ccgcctcgtt 8880

ccagacgcgg ctgtagacca cgacgccctc gggatcgccg gcgcgcatga ccacctgggc 8940

gaggttgagc tccacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000

gttgagcgtg gtggcgatgt gctcggtgac gaagaaatac atgatccagc ggcggagcgg 9060

catctcgctg acgtcgccca gcgcctccaa acgttccatg gcctcgtaaa agtccacggc 9120

gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180

gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc cccgggagtt cctccacttc 9240

ctcttcttcc tcctccacta acatctcttc tacttcctcc tcaggcggca gtggtggcgg 9300

gggagggggc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360

ctcgccgcgc cggcgtcgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420

cgtgaagacg ccgccgcgca tctccaggtg gccggggggg tccccgttgg gcagggagag 9480

ggcgctgacg atgcatctta tcaattgccc cgtagggact ccgcgcaagg acctgagcgt 9540

ctcgagatcc acgggatctg aaaaccgctg aacgaaggct tcgagccagt cgcagtcgca 9600

aggtaggctg agcacggttt cttctggcgg gtcatgttgg ttgggagcgg ggcgggcgat 9660

gctgctggtg atgaagttga aataggcggt tctgagacgg cggatggtgg cgaggagcac 9720

caggtctttg ggcccggctt gctggatgcg cagacggtcg gccatgcccc aggcgtggtc 9780

ctgacacctg gccaggtcct tgtagtagtc ctgcatgagc cgctccacgg gcacctcctc 9840

ctcgcccgcg cggccgtgca tgcgcgtgag cccgaagccg cgctggggct ggacgagcgc 9900

caggtcggcg acgacgcgct cggcgaggat ggcttgctgg atctgggtga gggtggtctg 9960

gaagtcatca aagtcgacga agcggtggta ggctccggtg ttgatggtgt aggagcagtt 10020

ggccatgacg gaccagttga cggtctggtg gcccggacgc acgagctcgt ggtacttgag 10080

gcgcgagtag gcgcgcgtgt cgaagatgta gtcgttgcag gtgcgcacca ggtactggta 10140

gccgatgagg aagtgcggcg gcggctggcg gtagagcggc catcgctcgg tggcgggggc 10200

gccgggcgcg aggtcctcga gcatggtgcg gtggtagccg tagatgtacc tggacatcca 10260

ggtgatgccg gcggcggtgg tggaggcgcg cgggaactcg cggacgcggt tccagatgtt 10320

gcgcagcggc aggaagtagt tcatggtggg cacggtctgg cccgtgaggc gcgcgcagtc 10380

gtggatgctc tatacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440

gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500

ccgcagctaa cgtggtattg gcactcccgt ctcgacccaa gcctgcacca accctccagg 10560

atacggaggc gggtcgtttt gcaacttttt tttggaggcc ggatgagact agtaagcgcg 10620

gaaagcggcc gaccgcgatg gctcgctgcc gtagtctgga gaagaatcgc cagggttgcg 10680

ttgcggtgtg ccccggttcg aggccggccg gattccgcgg ctaacgaggg cgtggctgcc 10740

ccgtcgtttc caagacccca tagccagccg acttctccag ttacggagcg agcccctctt 10800

ttgttttgtt tgtttttgcc agatgcatcc cgtactgcgg cagatgcgcc cccaccaccc 10860

tccaccgcaa caacagcccc ctccacagcc ggcgcttctg cccccgcccc agcagcaact 10920

tccagccacg accgccgcgg ccgccgtgag cggggctgga cagagttatg atcaccagct 10980

ggccttggaa gagggcgagg ggctggcgcg cctgggggcg tcgtcgccgg agcggcaccc 11040

gcgcgtgcag atgaaaaggg acgctcgcga ggcctacgtg cccaagcaga acctgttcag 11100

agacaggagc ggcgaggagc ccgaggagat gcgcgcggcc cggttccacg cggggcggga 11160

gctgcggcgc ggcctggacc gaaagagggt gctgagggac gaggatttcg aggcggacga 11220

gctgacgggg atcagccccg cgcgcgcgca cgtggccgcg gccaacctgg tcacggcgta 11280

cgagcagacc gtgaaggagg agagcaactt ccaaaaatcc ttcaacaacc acgtgcgcac 11340

cctgatcgcg cgcgaggagg tgaccctggg cctgatgcac ctgtgggacc tgctggaggc 11400

catcgtgcag aaccccacca gcaagccgct gacggcgcag ctgttcctgg tggtgcagca 11460

tagtcgggac aacgaagcgt tcagggaggc gctgctgaat atcaccgagc ccgagggccg 11520

ctggctcctg gacctggtga acattctgca gagcatcgtg gtgcaggagc gcgggctgcc 11580

gctgtccgag aagctggcgg ccatcaactt ctcggtgctg agtttgggca agtactacgc 11640

taggaagatc tacaagaccc cgtacgtgcc catagacaag gaggtgaaga tcgacgggtt 11700

ttacatgcgc atgaccctga aagtgctgac cctgagcgac gatctggggg tgtaccgcaa 11760

cgacaggatg caccgtgcgg tgagcgccag caggcggcgc gagctgagcg accaggagct 11820

gatgcatagt ctgcagcggg ccctgaccgg ggccgggacc gagggggaga gctactttga 11880

catgggcgcg gacctgcact ggcagcccag ccgccgggcc ttggaggcgg cggcaggacc 11940

ctacgtagaa gaggtggacg atgaggtgga cgaggagggc gagtacctgg aagactgatg 12000

gcgcgaccgt atttttgcta gatgcaacaa caacagccac ctcctgatcc cgcgatgcgg 12060

gcggcgctgc agagccagcc gtccggcatt aactcctcgg acgattggac ccaggccatg 12120

caacgcatca tggcgctgac gacccgcaac cccgaagcct ttagacagca gccccaggcc 12180

aaccggctct cggccatcct ggaggccgtg gtgccctcgc gctccaaccc cacgcacgag 12240

aaggtcctgg ccatcgtgaa cgcgctggtg gagaacaagg ccatccgcgg cgacgaggcc 12300

ggcctggtgt acaacgcgct gctggagcgc gtggcccgct acaacagcac caacgtgcag 12360

accaacctgg accgcatggt gaccgacgtg cgcgaggccg tggcccagcg cgagcggttc 12420

caccgcgagt ccaacctggg atccatggtg gcgctgaacg ccttcctcag cacccagccc 12480

gccaacgtgc cccggggcca ggaggactac accaacttca tcagcgccct gcgcctgatg 12540

gtgaccgagg tgccccagag cgaggtgtac cagtccgggc cggactactt cttccagacc 12600

agtcgccagg gcttgcagac cgtgaacctg agccaggctt tcaagaactt gcagggcctg 12660

tggggcgtgc aggccccggt cggggaccgc gcgacggtgt cgagcctgct gacgccgaac 12720

tcgcgcctgc tgctgctgct ggtggccccc ttcacggaca gcggcagcat caaccgcaac 12780

tcgtacctgg gctacctgat taacctgtac cgcgaggcca tcggccaggc gcacgtggac 12840

gagcagacct accaggagat cacccacgtg agccgcgccc tgggccagga cgacccgggc 12900

aacctggaag ccaccctgaa ctttttgctg accaaccggt cgcagaagat cccgccccag 12960

tacgcgctca gcaccgagga ggagcgcatc ctgcgttacg tgcagcagag cgtgggcctg 13020

ttcctgatgc aggagggggc cacccccagc gccgcgctcg acatgaccgc gcgcaacatg 13080

gagcccagca tgtacgccag caaccgcccg ttcatcaata aactgatgga ctacttgcat 13140

cgggcggccg ccatgaactc tgactatttc accaacgcca tcctgaatcc ccactggctc 13200

ccgccgccgg ggttctacac gggcgagtac gacatgcccg accccaatga cgggttcctg 13260

tgggacgatg tggacagcag cgtgttctcc ccccgaccgg gtgctaacga gcgccccttg 13320

tggaagaagg aaggcagcga ccgacgcccg tcctcggcgc tgtccggccg cgagggtgct 13380

gccgcggcgg tgcccgaggc cgccagtcct ttcccgagct tgcccttctc gctgaacagt 13440

atccgcagca gcgagctggg caggatcacg cgcccgcgct tgctgggcga agaggagtac 13500

ttgaatgact cgctgttgag acccgagcgg gagaagaact tccccaataa cgggatagaa 13560

agcctggtgg acaagatgag ccgctggaag acgtatgcgc aggagcacag ggacgatccc 13620

cgggcgtcgc agggggccac gagccggggc agcgccgccc gtaaacgccg gtggcacgac 13680

aggcagcggg gacagatgtg ggacgatgag gactccgccg acgacagcag cgtgttggac 13740

ttgggtggga gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg catgatgtaa 13800

gagaaaccga aaataaatga tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860

tctctgttgt tgttgtatct agtatgatga ggcgtgcgta cccggagggt cctcctccct 13920

cgtacgagag cgtgatgcag caggcgatgg cggcggcggc gatgcagccc ccgctggagg 13980

ctccttacgt gcccccgcgg tacctggcgc ctacggaggg gcggaacagc attcgttact 14040

cggagctggc acccttgtac gataccaccc ggttgtacct ggtggacaac aagtcggcgg 14100

acatcgcctc gctgaactac cagaacgacc acagcaactt cctgaccacc gtggtgcaga 14160

acaatgactt cacccccacg gaggccagca cccagaccat caactttgac gagcgctcgc 14220

ggtggggcgg ccagctgaaa accatcatgc acaccaacat gcccaacgtg aacgagttca 14280

tgtacagcaa caagttcaag gcgcgggtga tggtctcccg caagaccccc aatggggtga 14340

cagtgacaga ggattatgat ggtagtcagg atgagctgaa gtatgaatgg gtggaatttg 14400

agctgcccga aggcaacttc tcggtgacca tgaccatcga cctgatgaac aacgccatca 14460

tcgacaatta cttggcggtg gggcggcaga acggggtgct ggagagcgac atcggcgtga 14520

agttcgacac taggaacttc aggctgggct gggaccccgt gaccgagctg gtcatgcccg 14580

gggtgtacac caacgaggct ttccatcccg atattgtctt gctgcccggc tgcggggtgg 14640

acttcaccga gagccgcctc agcaacctgc tgggcattcg caagaggcag cccttccagg 14700

aaggcttcca gatcatgtac gaggatctgg aggggggcaa catccccgcg ctcctggatg 14760

tcgacgccta tgagaaaagc aaggaggatg cagcagctga agcaactgca gccgtagcta 14820

ccgcctctac cgaggtcagg ggcgataatt ttgcaagcgc cgcagcagtg gcagcggccg 14880

aggcggctga aaccgaaagt aagatagtca ttcagccggt ggagaaggat agcaagaaca 14940

ggagctacaa cgtactaccg gacaagataa acaccgccta ccgcagctgg tacctagcct 15000

acaactatgg cgaccccgag aagggcgtgc gctcctggac gctgctcacc acctcggacg 15060

tcacctgcgg cgtggagcaa gtctactggt cgctgcccga catgatgcaa gacccggtca 15120

ccttccgctc cacgcgtcaa gttagcaact acccggtggt gggcgccgag ctcctgcccg 15180

tctactccaa gagcttcttc aacgagcagg ccgtctactc gcagcagctg cgcgccttca 15240

cctcgcttac gcacgtcttc aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg 15300

cgcccaccat taccaccgtc agtgaaaacg ttcctgctct cacagatcac gggaccctgc 15360

cgctgcgcag cagtatccgg ggagtccagc gcgtgaccgt tactgacgcc agacgccgca 15420

cctgccccta cgtctacaag gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca 15480

ccttctaaat gtccattctc atctcgccca gtaataacac cggttggggc ctgcgcgcgc 15540

ccagcaagat gtacggaggc gctcgccaac gctccacgca acaccccgtg cgcgtgcgcg 15600

ggcacttccg cgctccctgg ggcgccctca agggccgcgt gcggtcgcgc accaccgtcg 15660

acgacgtgat cgaccaggtg gtggccgacg cgcgcaacta cacccccgcc gccgcgcccg 15720

tctccaccgt ggacgccgtc atcgacagcg tggtggcgga cgcgcgccgg tacgcccgcg 15780

ccaagagccg gcggcggcgc atcgcccggc ggcaccggag cacccccgcc atgcgcgcgg 15840

cgcgagcctt gctgcgcagg gccaggcgca cgggacgcag ggccatgctc agggcggcca 15900

gacgcgcggc ttcaggcgcc agcgccggca ggacccggag acgcgcggcc acggcggcgg 15960

cagcggccat cgccagcatg tcccgcccgc ggcgagggaa cgtgtactgg gtgcgcgacg 16020

ccgccaccgg tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgttcac 16080

ttcgcgatgt tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat tcaaggaaga 16140

gatgctccag gtcatcgcgc ctgagatcta cggccctgcg gtggtgaagg aggaaagaaa 16200

gccccgcaaa atcaagcggg tcaaaaagga caaaaaggaa gaagaaagtg atgtggacgg 16260

attggtggag tttgtgcgcg agttcgcccc ccggcggcgc gtgcagtggc gcgggcggaa 16320

ggtgcaaccg gtgctgagac ccggcaccac cgtggtcttc acgcccggcg agcgctccgg 16380

caccgcttcc aagcgctcct acgacgaggt gtacggggat gatgatattc tggagcaggc 16440

ggccgagcgc ctgggcgagt ttgcttacgg caagcgcagc cgttccgcac cgaaggaaga 16500

ggcggtgtcc atcccgctgg accacggcaa ccccacgccg agcctcaagc ccgtgacctt 16560

gcagcaggtg ctgccgaccg cggcgccgcg ccgggggttc aagcgcgagg gcgaggatct 16620

gtaccccacc atgcagctga tggtgcccaa gcgccagaag ctggaagacg tgctggagac 16680

catgaaggtg gacccggacg tgcagcccga ggtcaaggtg cggcccatca agcaggtggc 16740

cccgggcctg ggcgtgcaga ccgtggacat caagattccc acggagccca tggaaacgca 16800

gaccgagccc atgatcaagc ccagcaccag caccatggag gtgcagacgg atccctggat 16860

gccatcggct cctagtcgaa gaccccggcg caagtacggc gcggccagcc tgctgatgcc 16920

caactacgcg ctgcatcctt ccatcatccc cacgccgggc taccgcggca cgcgcttcta 16980

ccgcggtcat accagcagcc gccgccgcaa gaccaccact cgccgccgcc gtcgccgcac 17040

cgccgctgca accacccctg ccgccctggt gcggagagtg taccgccgcg gccgcgcacc 17100

tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaaactt tcgccagctt 17160

tgcagatcaa tggccctcac atgccgcctt cgcgttccca ttacgggcta ccgaggaaga 17220

aaaccgcgcc gtagaaggct ggcggggaac gggatgcgtc gccaccacca ccggcggcgg 17280

cgcgccatca gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc 17340

gcggcgatcg gggcgatccc cggcattgct tccgtggcgg tgcaggcctc tcagcgccac 17400

tgagacacac ttggaaacat cttgtaataa acccatggac tctgacgctc ctggtcctgt 17460

gatgtgtttt cgtagacaga tggaagacat caatttttcg tccctggctc cgcgacacgg 17520

cacgcggccg ttcatgggca cctggagcga catcggcacc agccaactga acgggggcgc 17580

cttcaattgg agcagtctct ggagcgggct taagaatttc gggtccacgc ttaaaaccta 17640

tggcagcaag gcgtggaaca gcaccacagg gcaggcgctg agggataagc tgaaagagca 17700

gaacttccag cagaaggtgg tcgatgggct cgcctcgggc atcaacgggg tggtggacct 17760

ggccaaccag gccgtgcagc ggcagatcaa cagccgcctg gacccggtgc cgcccgccgg 17820

ctccgtggag atgccgcagg tggaggagga gctgcctccc ctggacaagc ggggcgagaa 17880

gcgaccccgc cccgatgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta 17940

cgaggaggcg gtgaaactgg gtctgcccac cacgcggccc atcgcgcccc tggccaccgg 18000

ggtgctgaaa cccgaaaagc ccgcgaccct ggacttgcct cctccccagc cttcccgccc 18060

ctctacagtg gctaagcccc tgccgccggt ggccgtggcc cgcgcgcgac ccgggggcac 18120

cgcccgccct catgcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca 18180

gagtgtgaag cgccgccgct gctattaaac ctaccgtagc gcttaacttg cttgtctgtg 18240

tgtgtatgta ttatgtcgcc gccgccgctg tccaccagaa ggaggagtga agaggcgcgt 18300

cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg 18360

ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagtttgcc cgcgccacag 18420

acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg 18480

tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca 18540

acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca 18600

tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct 18660

actccggcac cgcctacaac agtctggccc ccaagggagc acccaacact tgtcagtgga 18720

catataaagc cgatggtgaa actgccacag aaaaaaccta tacatatgga aatgcacccg 18780

tgcagggcat taacatcaca aaagatggta ttcaacttgg aactgacacc gatgatcagc 18840

caatctacgc agataaaacc tatcagcctg aacctcaagt gggtgatgct gaatggcatg 18900

acatcactgg tactgatgaa aagtatggag gcagagctct taagcctgat accaaaatga 18960

agccttgtta tggttctttt gccaagccta ctaataaaga aggaggtcag gcaaatgtga 19020

aaacaggaac aggcactact aaagaatatg acatagacat ggctttcttt gacaacagaa 19080

gtgcggctgc tgctggccta gctccagaaa ttgttttgta tactgaaaat gtggatttgg 19140

aaactccaga tacccatatt gtatacaaag caggcacaga tgacagcagc tcttctatta 19200

atttgggtca gcaagccatg cccaacagac ctaactacat tggtttcaga gacaacttta 19260

tcgggctcat gtactacaac agcactggca atatgggggt gctggccggt caggcttctc 19320

agctgaatgc tgtggttgac ttgcaagaca gaaacaccga gctgtcctac cagctcttgc 19380

ttgactctct gggtgacaga acccggtatt tcagtatgtg gaatcaggcg gtggacagct 19440

atgatcctga tgtgcgcatt attgaaaatc atggtgtgga ggatgaactt cccaactatt 19500

gtttccctct ggatgctgtt ggcagaacag atacttatca gggaattaag gctaatggaa 19560

ctgatcaaac cacatggacc aaagatgaca gtgtcaatga tgctaatgag ataggcaagg 19620

gtaatccatt cgccatggaa atcaacatcc aagccaacct gtggaggaac ttcctctacg 19680

ccaacgtggc cctgtacctg cccgactctt acaagtacac gccggccaat gttaccctgc 19740

ccaccaacac caacacctac gattacatga acggccgggt ggtggcgccc tcgctggtgg 19800

actcctacat caacatcggg gcgcgctggt cgctggatcc catggacaac gtgaacccct 19860

tcaaccacca ccgcaatgcg gggctgcgct accgctccat gctcctgggc aacgggcgct 19920

acgtgccctt ccacatccag gtgccccaga aatttttcgc catcaagagc ctcctgctcc 19980

tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga 20040

gctccctcgg caacgacctg cgcacggacg gggcctccat ctccttcacc agcatcaacc 20100

tctacgccac cttcttcccc atggcgcaca acacggcctc cacgctcgag gccatgctgc 20160

gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc 20220

ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct 20280

tccgcggctg gtccttcacg cgtctcaaga ccaaggagac gccctcgctg ggctccgggt 20340

tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca 20400

accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg 20460

accggctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacggc gagggctaca 20520

acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca 20580

acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct 20640

tccgcaactt ccagcccatg agccgccagg tggtggacga ggtcaactac aaggactacc 20700

aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca 20760

ccatgcgcca gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg 20820

ccgtcaccag cgtcacccag aaaaagttcc tctgcgacag ggtcatgtgg cgcatcccct 20880

tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctatg 20940

ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc 21000

ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg 21060

tcatcgaggc cgtctacctg cgcaccccct tctcggccgg taacgccacc acctaagctc 21120

ttgcttcttg caagccatgg ccgcgggctc cggcgagcag gagctcaggg ccatcatccg 21180

cgacctgggc tgcgggccct acttcctggg caccttcgat aagcgcttcc cgggattcat 21240

ggccccgcac aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcga 21300

gcactggctg gccttcgcct ggaacccgcg ctcgaacacc tgctacctct tcgacccctt 21360

cgggttctcg gacgagcgcc tcaagcagat ctaccagttc gagtacgagg gcctgctgcg 21420

ccgcagcgcc ctggccaccg aggaccgctg cgtcaccctg gaaaagtcca cccagaccgt 21480

gcagggtccg cgctcggccg cctgcgggct cttctgctgc atgttcctgc acgccttcgt 21540

gcactggccc gaccgcccca tggacaagaa ccccaccatg aacttgctga cgggggtgcc 21600

caacggcatg ctccagtcgc cccaggtgga acccaccctg cgccgcaacc aggaggcgct 21660

ctaccgcttc ctcaactccc actccgccta ctttcgctcc caccgcgcgc gcatcgagaa 21720

ggccaccgcc ttcgaccgca tgaatcaaga catgtaaacc gtgtgtgtat gttaaatgtc 21780

tttaataaac agcactttca tgttacacat gcatctgaga tgatttattt agaaatcgaa 21840

agggttctgc cgggtctcgg catggcccgc gggcagggac acgttgcgga actggtactt 21900

ggccagccac ttgaactcgg ggatcagcag tttgggcagc ggggtgtcgg ggaaggagtc 21960

ggtccacagc ttccgcgtca gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa 22020

atcgcagttg ggacccgcgt tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg 22080

gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg tgatgctctc 22140

cacgtcgagg tcctcggcgt tggccatccc gaagggggtc atcttgcagg tctgccttcc 22200

catggtgggc acgcacccgg gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat 22260

ctgggcctgg tcggcgttca tccccgggta catggccttc atgaaagcct ccaattgcct 22320

gaacgcctgc tgggccttgg ctccctcggt gaagaagacc ccgcaggact tgctagagaa 22380

ctggttggtg gcgcacccgg cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg 22440

caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt tctccttcag 22500

cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc atgtgctcct tctggatcat 22560

ggtggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag 22620

cgcgcacccg gtgcactccc agttcttgtg ggcgatctgg gaatgcgcgt gcacgaagcc 22680

ctgcaggaag cggcccatca tggtggtcag ggtcttgttg ctagtgaagg tcagcggaat 22740

gccgcggtgc tcctcgttga tgtacaggtg gcagatgcgg cggtacacct cgccctgctc 22800

gggcatcagc tggaagttgg ctttcaggtc ggtctccacg cggtagcggt ccatcagcat 22860

agtcatgatt tccataccct tctcccaggc cgagacgatg ggcaggctca tagggttctt 22920

caccatcatc ttagcgctag cagccgcggc cagggggtcg ctctcgtcca gggtctcaaa 22980

gctccgcttg ccgtccttct cggtgatccg caccgggggg tagctgaagc ccacggccgc 23040

cagctcctcc tcggcctgtc tttcgtcctc gctgtcctgg ctgacgtcct gcaggaccac 23100

atgcttggtc ttgcggggtt tcttcttggg cggcagcggc ggcggagatg ttggagatgg 23160

cgagggggag cgcgagttct cgctcaccac tactatctct tcctcttctt ggtccgaggc 23220

cacgcggcgg taggtatgtc tcttcggggg cagaggcgga ggcgacgggc tctcgccgcc 23280

gcgacttggc ggatggctgg cagagcccct tccgcgttcg ggggtgcgct cccggcggcg 23340

ctctgactga cttcctccgc ggccggccat tgtgttctcc tagggaggaa caacaagcat 23400

ggagactcag ccatcgccaa cctcgccatc tgcccccacc gccgacgaga agcagcagca 23460

gcagaatgaa agcttaaccg ccccgccgcc cagccccgcc acctccgacg cggccgtccc 23520

agacatgcaa gagatggagg aatccatcga gattgacctg ggctatgtga cgcccgcgga 23580

gcacgaggag gagctggcag tgcgcttttc acaagaagag atacaccaag aacagccaga 23640

gcaggaagca gagaatgagc agagtcaggc tgggctcgag catgacggcg actacctcca 23700

cctgagcggg ggggaggacg cgctcatcaa gcatctggcc cggcaggcca ccatcgtcaa 23760

ggatgcgctg ctcgaccgca ccgaggtgcc cctcagcgtg gaggagctca gccgcgccta 23820

cgagttgaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaatg gcacctgcga 23880

gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc tggccaccta 23940

ccacatcttt ttcaagaacc aaaagatccc cgtctcctgc cgcgccaacc gcacccgcgc 24000

cgacgccctt ttcaacctgg gtcccggcgc ccgcctacct gatatcgcct ccttggaaga 24060

ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga acgctctgca 24120

aggagaagga ggagagcatg agcaccacag cgccctggtc gagttggaag gcgacaacgc 24180

gcggctggcg gtgctcaaac gcacggtcga gctgacccat ttcgcctacc cggctctgaa 24240

cctgcccccc aaagtcatga gcgcggtcat ggaccaggtg ctcatcaagc gcgcgtcgcc 24300

catctccgag gacgagggca tgcaagactc cgaggagggc aagcccgtgg tcagcgacga 24360

gcagctggcc cggtggctgg gtcctaatgc tagtccccag agtttggaag agcggcgcaa 24420

actcatgatg gccgtggtcc tggtgaccgt ggagctggag tgcctgcgcc gcttcttcgc 24480

cgacgcggag accctgcgca aggtcgagga gaacctgcac tacctcttca ggcacgggtt 24540

cgtgcgccag gcctgcaaga tctccaacgt ggagctgacc aacctggtct cctacatggg 24600

catcttgcac gagaaccgcc tggggcagaa cgtgctgcac accaccctgc gcggggaggc 24660

ccggcgcgac tacatccgcg actgcgtcta cctctacctc tgccacacct ggcagacggg 24720

catgggcgtg tggcagcagt gtctggagga gcagaacctg aaagagctct gcaagctcct 24780

gcagaagaac ctcaagggtc tgtggaccgg gttcgacgag cgcaccaccg cctcggacct 24840

ggccgacctc attttccccg agcgcctcag gctgacgctg cgcaacggcc tgcccgactt 24900

tatgagccaa agcatgttgc aaaactttcg ctctttcatc ctcgaacgct ccggaatcct 24960

gcccgccacc tgctccgcgc tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc 25020

cccgccgctg tggagccact gctacctgct gcgcctggcc aactacctgg cctaccactc 25080

ggacgtgatc gaggacgtca gcggcgaggg cctgctcgag tgccactgcc gctgcaacct 25140

ctgcacgccg caccgctccc tggcctgcaa cccccagctg ctgagcgaga cccagatcat 25200

cggcaccttc gagttgcaag ggcccagcga aggcgagggt tcagccgcca aggggggtct 25260

gaaactcacc ccggggctgt ggacctcggc ctacttgcgc aagttcgtgc ccgaggacta 25320

ccatcccttc gagatcaggt tctacgagga ccaatcccat ccgcccaagg ccgagctgtc 25380

ggcctgcgtc atcacccagg gggcgatcct ggcccaattg caagccatcc agaaatcccg 25440

ccaagaattc ttgctgaaaa agggccgcgg ggtctacctc gacccccaga ccggtgagga 25500

gctcaacccc ggcttccccc aggatgcccc gaggaaacaa gaagctgaaa gtggagctgc 25560

cgcccgtgga ggatttggag gaagactggg agaacagcag tcaggcagag gaggaggaga 25620

tggaggaaga ctgggacagc actcaggcag aggaggacag cctgcaagac agtctggagg 25680

aagacgagga ggaggcagag gaggaggtgg aagaagcagc cgccgccaga ccgtcgtcct 25740

cggcggggga gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcccgctc 25800

gaccacacag tagatgggac gagaccggac gattcccgaa ccccaccacc cagaccggta 25860

agaaggagcg gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct 25920

tgcaggcctg cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg 25980

tgaactttcc ccgcaacatc ttgcattact accgtcacct ccacagcccc tactacttcc 26040

aagaagaggc agcagcagca gaaaaagacc agcagaaaac cagcagctag aaaatccaca 26100

gcggcggcag caggtggact gaggatcgcg gcgaacgagc cggcgcaaac ccgggagctg 26160

aggaaccgga tctttcccac cctctatgcc atcttccagc agagtcgggg gcaggagcag 26220

gaactgaaag tcaagaaccg ttctctgcgc tcgctcaccc gcagttgtct gtatcacaag 26280

agcgaagacc aacttcagcg cactctcgag gacgccgagg ctctcttcaa caagtactgc 26340

gcgctcactc ttaaagagta gcccgcgccc gcccagtcgc agaaaaaggc gggaattacg 26400

tcacctgtgc ccttcgccct agccgcctcc acccatcatc atgagcaaag agattcccac 26460

gccttacatg tggagctacc agccccagat gggcctggcc gccggtgccg cccaggacta 26520

ctccacccgc atgaattggc tcagcgccgg gcccgcgatg atctcacggg tgaatgacat 26580

ccgcgcccac cgaaaccaga tactcctaga acagtcagcg ctcaccgcca cgccccgcaa 26640

tcacctcaat ccgcgtaatt ggcccgccgc cctggtgtac caggaaattc cccagcccac 26700

gaccgtacta cttccgcgag acgcccaggc cgaagtccag ctgactaact caggtgtcca 26760

gctggcgggc ggcgccaccc tgtgtcgtca ccgccccgct cagggtataa agcggctggt 26820

gatccggggc agaggcacac agctcaacga cgaggtggtg agctcttcgc tgggtctgcg 26880

acctgacgga gtcttccaac tcgccggatc ggggagatct tccttcacgc ctcgtcaggc 26940

cgtcctgact ttggagagtt cgtcctcgca gccccgctcg ggtggcatcg gcactctcca 27000

gttcgtggag gagttcactc cctcggtcta cttcaacccc ttctccggct cccccggcca 27060

ctacccggac gagttcatcc cgaacttcga cgccatcagc gagtcggtgg acggctacga 27120

ttgaatgtcc catggtggcg cagctgacct agctcggctt cgacacctgg accactgccg 27180

ccgcttccgc tgcttcgctc gggatctcgc cgagtttgcc tactttgagc tgcccgagga 27240

gcaccctcag ggcccggccc acggagtgcg gatcgtcgtc gaagggggcc tcgactccca 27300

cctgcttcgg atcttcagcc agcgtccgat cctggtcgag cgcgagcaag gacagaccct 27360

tctgactctg tactgcatct gcaaccaccc cggcctgcat gaaagtcttt gttgtctgct 27420

gtgtactgag tataataaaa gctgagatca gcgactactc cggacttccg tgtgttcctg 27480

aatccatcaa ccagtctttg ttcttcaccg ggaacgagac cgagctccag ctccagtgta 27540

agccccacaa gaagtacctc acctggctgt tccagggctc cccgatcgcc gttgtcaacc 27600

actgcgacaa cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca 27660

gaagcaagct ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac 27720

cctgccatca caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca 27780

accaaactaa cctccaccaa cgccaccgtc gcgacctttc tgaatctaat actaccaccc 27840

acaccggagg tgagctccga ggtcaaccaa cctctgggat ttactacggc ccctgggagg 27900

tggttgggtt aatagcgcta ggcctagttg cgggtgggct tttggttctc tgctacctat 27960

acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg gtttaagaaa tggggaagat 28020

caccctagtg agctgcggtg cgctggtggc ggtgttgctt tcgattgtgg gactgggcgg 28080

tgcggctgta gtgaaggaga aggccgatcc ctgcttgcat ttcaatccca acaaatgcca 28140

gctgagtttt cagcccgatg gcaatcggtg cgcggtactg atcaagtgcg gatgggaatg 28200

cgagaacgtg agaatcgagt acaataacaa gactcggaac aatactctcg cgtccgtgtg 28260

gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc ggtgctgacg gctccccgcg 28320

caccgtgaat aatactttca tttttgcgca catgtgcgac acggtcatgt ggatgagcaa 28380

gcagtacgat atgtggcccc ccacgaagga gaacatcgtg gtcttctcca tcgcttacag 28440

cctgtgcacg gcgctaatca ccgctatcgt gtgcctgagc attcacatgc tcatcgctat 28500

tcgccccaga aataatgccg aaaaagaaaa acagccataa cgtttttttt cacacctttt 28560

tcagaccatg gcctctgtta aatttttgct tttatttgcc agtctcattg ccgtcattca 28620

tggaatgagt aatgagaaaa ttactattta cactggcact aatcacacat tgaaaggtcc 28680

agaaaaagcc acagaagttt catggtattg ttattttaat gaatcagatg tatctactga 28740

actctgtgga aacaataaca aaaaaaatga gagcattact ctcatcaagt ttcaatgtgg 28800

atctgactta accctaatta acatcactag agactatgta ggtatgtatt atggaactac 28860

agcaggcatt tcggacatgg aattttatca agtttctgtg tctgaaccca ccacgcctag 28920

aatgaccaca accacaaaaa ctacacctgt taccactatg cagctcacta ccaataacat 28980

ttttgccatg cgtcaaatgg tcaacaatag cactcaaccc accccaccca gtgaggaaat 29040

tcccaaatcc atgattggca ttattgttgc tgtagtggtg tgcatgttga tcatcgcctt 29100

gtgcatggtg tactatgcct tctgctacag aaagcacaga ctgaacgaca agctggaaca 29160

cttactaagt gttgaatttt aattttttag aaccatgaag atcctaggcc ttttaatttt 29220

ttctatcatt acctctgctc tatgcaattc tgacaatgag gacgttactg tcgttgtcgg 29280

atcaaattat acactgaaag gtccagcgaa gggtatgctt tcgtggtatt gctattttgg 29340

atctgacact acagaaactg aattatgcaa tcttaagaat ggcaaaattc aaaattctaa 29400

aattaacaat tatatatgca atggtactga tctgatactc ctcaatatca cgaaatcata 29460

tgctggcagt tacacctgcc ctggagatga tgctgacagt atgatttttt acaaagtaac 29520

tgttgttgat cccactactc cacctccacc caccacaact actcacacca cacacacaga 29580

tcaaaccgca gcagaggagg cagcaaagtt agccttgcag gtccaagaca gttcatttgt 29640

tggcattacc cctacacctg atcagcggtg tccggggctg ctagtcagcg gcattgtcgg 29700

tgtgctttcg ggattagcag tcataatcat ctgcatgttc atttttgctt gctgctatag 29760

aaggctttac cgacaaaaat cagacccact gctgaacctc tatgtttaat tttttccaga 29820

gtcatgaagg cagttagcgc tctagttttt tgttctttga ttggcattgt tttttgcaat 29880

cctattccta aagttagctt tattaaagat gtgaatgtta ctgagggggg caatgtgaca 29940

ctggtaggtg tagagggtgc tgaaaacacc acctggacaa aataccacct caatgggtgg 30000

aaagatattt gcaattggag tgtattagtt tatacatgtg agggagttaa tcttaccatt 30060

gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgtcag tgtatctaat 30120

gggtatttta cccaacatac ttttatctat gacgttaaag tcataccact gcctacgcct 30180

agcccaccta gcactaccac acagacaacc cacactacac agacaaccac atacagtaca 30240

ttaaatcagc ctaccaccac tacagcagca gaggttgcca gctcgtctgg ggtccgagtg 30300

gcatttttga tgtgggcccc atctagcagt cccactgcta gtaccaatga gcagactact 30360

gaatttttgt ccactgtcga gagccacacc acagctacct ccagtgcctt ctctagcacc 30420

gccaatctct cctcgctttc ctctacacca atcagtcccg ctactactcc tagccccgct 30480

cctcttccca ctcccctgaa gcaaacagac ggcggcatgc aatggcagat caccctgctc 30540

attgtgatcg ggttggtcat cctggccgtg ttgctctact acatcttctg ccgccgcatt 30600

cccaacgcgc accgcaagcc ggtctacaag cccatcattg tcgggcagcc ggagccgctt 30660

caggtggaag ggggtctaag gaatcttctc ttctctttta cagtatggtg attgaactat 30720

gattcctaga caattcttga tcactattct tatctgcctc ctccaagtct gtgccaccct 30780

cgctctggtg gccaacgcca gtccagactg tattgggccc ttcgcctcct acgtgctctt 30840

tgccttcacc acctgcatct gctgctgtag catagtctgc ctgcttatca ccttcttcca 30900

gttcattgac tggatctttg tgcgcatcgc ctacctgcgc caccaccccc agtaccgcga 30960

ccagcgagtg gcgcggctgc tcaggctcct ctgataagca tgcgggctct gctacttctc 31020

gcgcttctgc tgttagtgct cccccgtccc gtcgaccccc ggtcccccac ccagtccccc 31080

gaggaggtcc gcaaatgcaa attccaagaa ccctggaaat tcctcaaatg ctaccgccaa 31140

aaatcagaca tgcatcccag ctggatcatg atcattggga tcgtgaacat tctggcctgc 31200

accctcatct cctttgtgat ttacccctgc tttgactttg gttggaactc gccagaggcg 31260

ctctatctcc cgcctgaacc tgacacacca ccacagcaac ctcaggcaca cgcactacca 31320

ccactacagc ctaggccaca atacatgccc atattagact atgaggccga gccacagcga 31380

cccatgctcc ccgctattag ttacttcaat ctaaccggcg gagatgactg acccactggc 31440

caacaacaac gtcaacgacc ttctcctgga catggacggc cgcgcctcgg agcagcgact 31500

cgcccaactt cgcattcgcc agcagcagga gagagccgtc aaggagctgc aggatgcggt 31560

ggccatccac cagtgcaaga gaggcatctt ctgcctggtg aaacaggcca agatctccta 31620

cgaggtcact ccaaacgacc atcgcctctc ctacgagctc ctgcagcagc gccagaagtt 31680

cacctgcctg gtcggagtca accccatcgt catcacccag cagtctggcg ataccaaggg 31740

gtgcatccac tgctcctgcg actcccccga ctgcgtccac actctgatca agaccctctg 31800

cggcctccgc gacctcctcc ccatgaacta atcaccccct tatccagtga aataaagatc 31860

atattgatga tgattttaca gaaataaaaa ataatcattt gatttgaaat aaagatacaa 31920

tcatattgat gatttgagtt taacaaaaaa ataaagaatc acttacttga aatctgatac 31980

caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32040

ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32100

ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32160

gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32220

aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gttgtccctg 32280

cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32340

gtggacctcg attcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32400

ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32460

ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32520

acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32580

ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32640

ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32700

tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32760

acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32820

tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 32880

acaacacctg atccatcacc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 32940

ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33000

agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33060

gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33120

cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33180

aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33240

atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33300

agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33360

gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33420

cccaccctgc atgccaaccc ttcccacccc actctgtgga acaaactctg aaacacaaaa 33480

taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33540

ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33600

tctgaatgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33660

gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33720

cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33780

agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33840

gccccgcagc agtcgctgcc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 33900

cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 33960

gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca gaaccaccag 34020

gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34080

acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggtgccccc tccagaacac 34140

gctgcccacg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34200

caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34260

cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34320

ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcatat 34380

gctcatgcat ctcttcagca ctctcaactc ctcgggggtc aaaaccatat cccagggcac 34440

ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34500

attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagagaagc 34560

gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34620

cgcggctgat cgtgttcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34680

tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tctcggcgct 34740

tggaacgctc ggtgttgaaa ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34800

gggcctcagg agtgatgaag atcccatcat gcctgatggc tctgatcaca tcgaccaccg 34860

tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggtg acggcggggg 34920

agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agtacttcaa 34980

aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35040

ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35100

gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35160

tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35220

ctagttcgtg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35280

ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35340

cagattgaca agcggaatat caaaatctct gccgcgatcc ctgagctcct ccctcagcaa 35400

taactgtaag tactctttca tatcctctcc gaaattttta gccataggac caccaggaat 35460

aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35520

tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35580

aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtggacgtt 35640

tagagcctcg ggaacaacga tgaagtaaat gcaagcggtg cgttccagca tggttagtta 35700

gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35760

gtaaatcgtt ctctccagca ccaggcaggc cacggggtct ccggcgcgac cctcgtaaaa 35820

attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 35880

tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 35940

gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36000

aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36060

agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36120

agcacacaac aggcgcaaga gtcagagaaa ggctgagctc taacctgtcc acccgctctc 36180

tgctcaatat atagcccaga tctacactga cgtaaaggcc aaagtctaaa aatacccgcc 36240

aaataatcac acacgcccag cacacgccca gaaaccggtg acacactcaa aaaaatacgc 36300

gcacttcctc aaacgcccaa aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 36360

acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 36420

cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 36480

aacgcgcaca aaaagtttga ggtatattat tgatgatgg 36519

<210> 58

<211> 34819

<212> ДНК

<213> Искуственная последовательность

<220>

<223> Синтетическая конструкция

<400> 58

ttaattaacc atcttcaata atatacctca aactttttgt gcgcgttaat atgcaaatga 60

ggcgtttgaa tttggggagg aagggcggtg attggtcgag ggatgagcga ccgttagggg 120

cggggcgagt gacgttttga tgacgtggtt gcgaggagga gccagtttgc aagttctcgt 180

gggaaaagtg acgtcaaacg aggtgtggtt tgaacacgga aatactcaat tttcccgcgc 240

tctctgacag gaaatgaggt gtttctgggc ggatgcaagt gaaaacgggc cattttcgcg 300

cgaaaactga atgaggaagt gaaaatctga gtaatttcgc gtttatggca gggaggagta 360

tttgccgagg gccgagtaga ctttgaccga ttacgtgggg gtttcgatta ccgtgttttt 420

cacctaaatt tccgcgtacg gtgtcaaagt ccggtgtttt tactactgta atagtaatca 480

attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 540

aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 600

gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 660

taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac 720

gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt 780

cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 840

cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 900

attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 960

aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 1020

agcagagctg tccctatcag tgatagagat ctccctatca gtgatagaga gtttagtgaa 1080

ccgtcagatc cgctagggta ccaacatggc tagcatcgtc ggagggtggg agtgcgaaaa 1140

gcactcacag ccatggcagg tcctggtcgc ctcgcgcgga cgcgccgtgt gtggaggtgt 1200

gctggtccac ccgcagtggg tgttgactgc ggcccattgc atcagaaata agtccgtgat 1260

cctcttgggg agacattccc tgtttcaccc cgaagatact ggacaggtgt tccaagtgag 1320

ccactccttc ccgcatccac tgtacgacat gagcctgctg aagaaccgct ttctgcggcc 1380

aggggacgac tcatcacacg atttgatgct gcttcggctc tcggaaccgg ccgagctcac 1440

cgacgcagtg aaggtcatgg acctccctac gcaagagcct gctctcggta ccacttgtta 1500

cgcatcggga tggggctcca tcgagccgga agaattcctg accccgaaaa agctgcagtg 1560

cgtggatctg cacgtgattt cgaatgacgt gtgcgcgcaa gtgcatccac aaaaggtcac 1620

taagttcatg ctgtgcgccg gaaggtggac cggcggaaaa tcgacctgtt ccggcgacag 1680

cggaggccca ctcgtgtgca acggtgtgct gcagggcatc actagctggg gatcagaacc 1740

gtgcgcgctt ccggagcggc cctcgctcta cacgaaggtg gtgcactacc gcaaatggat 1800

taaagatacc atcgtcgcaa accctggatc cgaaggtagg ggttcattat tgacctgtgg 1860

agatgtcgaa gaaaacccag gacccgctag caaagcagtg ctgctggcgc tcctgatggc 1920

tggactcgcg ctgcagcctg gaaccgccct gctctgttac tcgtgcaagg cccaagtctc 1980

gaatgaggac tgtttgcaag tggaaaactg cacccagctc ggagaacaat gctggactgc 2040

acggatccgc gctgtcggcc tgctgaccgt gatctccaaa gggtgctcat tgaactgcgt 2100

ggacgatagc caggactact acgtgggaaa gaagaatatc acttgttgcg acacggatct 2160

ttgcaacgcg tccggagcgc acgccctgca gccagcagcc gccattctgg ccctgcttcc 2220

ggccctgggg ttgctgctct ggggtccggg ccagctcgga tcccagaccc tgaactttga 2280

tctgctgaaa ctggcaggcg atgtggaaag caacccaggc ccaatggcta gcgctcgcag 2340

accgcggtgg ctgtgtgcag gggcgctcgt cctggcgggt ggcttctttt tgctcggctt 2400

tcttttcgga tggttcatca aatcgtcaaa cgaagctacc aatatcaccc cgaagcacaa 2460

catgaaggcc tttctggatg agctgaaggc tgagaacatt aagaagttcc tctacaactt 2520

cacccagatc ccacatttgg cgggcactga gcagaacttt cagttggcta agcagatcca 2580

gagccagtgg aaggaattcg gcctggactc cgtcgagctg gcgcattacg atgtgctgct 2640

gagctaccct aataagactc atccgaacta tatctcgatt atcaatgagg acggaaacga 2700

aatctttaac acgtccctct tcgagccgcc accgcctgga tacgagaacg tgtcagatat 2760

cgtgcctccg ttctcggcct tctcgcccca gggaatgccc gaaggggacc tggtgtacgt 2820

gaactacgca aggaccgagg acttcttcaa gttggagcgg gatatgaaga tcaattgcag 2880

cggaaagatc gtcatcgccc gctacggcaa agtgttccgc ggcaacaagg tgaagaatgc 2940

acagttggca ggcgccaagg gcgtcatcct ctactcggat cctgccgact acttcgctcc 3000

tggcgtgaaa tcctaccctg atggttggaa tctgccagga ggaggggtgc agaggggaaa 3060

tatcctgaac ctgaacggtg ccggtgaccc acttactccg ggttacccgg ccaacgaata 3120

cgcgtacagg cggggtatcg cggaagccgt cggactgccg tccatcccgg tccatccgat 3180

tggttactac gacgcccaga agctcctcga aaagatggga ggcagcgccc ctccggactc 3240

gtcatggaga ggctcgctga aggtgccata caacgtggga cccggattca ctggaaattt 3300

cagcactcaa aaagtgaaga tgcacattca ctccactaac gaagtcacca ggatctacaa 3360

cgtcatcgga accctccggg gagcggtgga accggaccgc tacgtgatcc tcggtggaca 3420

ccgggatagc tgggtgttcg gaggaatcga tcctcaatcg ggcgcagccg tcgtccatga 3480

aatcgtcagg tcctttggta ctcttaagaa ggagggctgg cgccctagac gcactattct 3540

gttcgcctcg tgggatgccg aagaatttgg tctgctcggc agcaccgaat gggctgagga 3600

aaactcccgc ctgctccaag aacgcggagt ggcgtacatc aatgccgact catccatcga 3660

aggaaactac acgctgcggg tggactgcac tccactgatg tactcgctcg tgcacaacct 3720

gaccaaagaa ctcaaatccc cagacgaagg attcgaggga aaatcgctgt acgagtcgtg 3780

gaccaagaag agcccatccc cggagttcag cgggatgccg cggatctcaa agctcggatc 3840

aggaaatgat ttcgaagtgt tctttcagag gctgggaatt gcgtcgggaa gggctcggta 3900

cacgaaaaac tgggaaacta acaagttctc gggatacccg ctgtaccact cggtgtatga 3960

aacttacgaa ctggtggaga aattctacga tcctatgttt aagtaccacc tgactgtggc 4020

ccaagtgaga ggcggaatgg tgttcgagtt ggccaattca attgtgctgc cattcgattg 4080

ccgcgactac gccgtggtgc tgagaaagta cgcagacaaa atctactcaa tcagcatgaa 4140

gcacccacaa gagatgaaaa cctactcagt ctccttcgac tccctcttct ccgcggtgaa 4200

gaacttcacc gagatcgcga gcaaattctc ggagcgcctt caagattttg acaaatccaa 4260

tccgatcgtc ctccgcatga tgaatgacca gctcatgttt ctcgaacggg ccttcatcga 4320

tccactggga cttccggacc ggccgtttta ccgccacgtg atctacgcgc cctcgtcgca 4380

taacaagtat gctggagaga gcttcccggg tatctacgac gcattgttcg acattgagtc 4440

caaggtggat ccgtccaaag cctggggtga agtgaagcgc caaatctacg tggcggcctt 4500

taccgtccag gcggcagcag aaaccttgag cgaggtggct tgactcgagc ctaagcttct 4560

agataagata tccgatccac cggatctaga taactgatca taatcagcca taccacattt 4620

gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa 4680

atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc 4740

aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 4800

tccaaactca tcaatgtatc ttatatgctg gccaccgtac atgtggcttc ccatgctcgc 4860

aagccctggc ccgagttcga gcacaatgtc atgaccaggt gcaatatgca tctggggtcc 4920

cgccgaggca tgttcatgcc ctaccagtgc aacctgaatt atgtgaaggt gctgctggag 4980

cccgatgcca tgtccagagt gagcctgacg ggggtgtttg acatgaatgt ggaggtgtgg 5040

aagattctga gatatgatga atccaagacc aggtgccgag cctgcgagtg cggagggaag 5100

catgccaggt tccagcccgt gtgtgtggat gtgacggagg acctgcgacc cgatcatttg 5160

gtgttgccct gcaccgggac ggagttcggt tccagcgggg aagaatctga ctagagtgag 5220

tagtgttctg gggcggggga ggacctgcat gagggccaga ataactgaaa tctgtgcttt 5280

tctgtgtgtt gcagcagcat gagcggaagc ggctcctttg agggaggggt attcagccct 5340

tatctgacgg ggcgtctccc ctcctgggcg ggagtgcgtc agaatgtgat gggatccacg 5400

gtggacggcc ggcccgtgca gcccgcgaac tcttcaaccc tgacctatgc aaccctgagc 5460

tcttcgtcgt tggacgcagc tgccgccgca gctgctgcat ctgccgccag cgccgtgcgc 5520

ggaatggcca tgggcgccgg ctactacggc actctggtgg ccaactcgag ttccaccaat 5580

aatcccgcca gcctgaacga ggagaagctg ttgctgctga tggcccagct cgaggccttg 5640

acccagcgcc tgggcgagct gacccagcag gtggctcagc tgcaggagca gacgcgggcc 5700

gcggttgcca cggtgaaatc caaataaaaa atgaatcaat aaataaacgg agacggttgt 5760

tgattttaac acagagtctg aatctttatt tgatttttcg cgcgcggtag gccctggacc 5820

accggtctcg atcattgagc acccggtgga tcttttccag gacccggtag aggtgggctt 5880

ggatgttgag gtacatgggc atgagcccgt cccgggggtg gaggtagctc cattgcaggg 5940

cctcgtgctc gggggtggtg ttgtaaatca cccagtcata gcaggggcgc agggcatggt 6000

gttgcacaat atctttgagg aggagactga tggccacggg cagccctttg gtgtaggtgt 6060

ttacaaatct gttgagctgg gagggatgca tgcgggggga gatgaggtgc atcttggcct 6120

ggatcttgag attggcgatg ttaccgccca gatcccgcct ggggttcatg ttgtgcagga 6180

ccaccagcac ggtgtatccg gtgcacttgg ggaatttatc atgcaacttg gaagggaagg 6240

cgtgaaagaa tttggcgacg cctttgtgcc cgcccaggtt ttccatgcac tcatccatga 6300

tgatggcgat gggcccgtgg gcggcggcct gggcaaagac gtttcggggg tcggacacat 6360

catagttgtg gtcctgggtg aggtcatcat aggccatttt aatgaatttg gggcggaggg 6420

tgccggactg ggggacaaag gtaccctcga tcccgggggc gtagttcccc tcacagatct 6480

gcatctccca ggctttgagc tcggaggggg ggatcatgtc cacctgcggg gcgataaaga 6540

acacggtttc cggggcgggg gagatgagct gggccgaaag caagttccgg agcagctggg 6600

acttgccgca gccggtgggg ccgtagatga ccccgatgac cggctgcagg tggtagttga 6660

gggagagaca gctgccgtcc tcccggagga ggggggccac ctcgttcatc atctcgcgca 6720

cgtgcatgtt ctcgcgcacc agttccgcca ggaggcgctc tccccccagg gataggagct 6780

cctggagcga ggcgaagttt ttcagcggct tgagtccgtc ggccatgggc attttggaga 6840

gggtttgttg caagagttcc aggcggtccc agagctcggt gatgtgctct acggcatctc 6900

gatccagcag acctcctcgt ttcgcgggtt gggacggctg cgggagtagg gcaccagacg 6960

atgggcgtcc agcgcagcca gggtccggtc cttccagggt cgcagcgtcc gcgtcagggt 7020

ggtctccgtc acggtgaagg ggtgcgcgcc gggctgggcg cttgcgaggg tgcgcttcag 7080

gctcatccgg ctggtcgaaa accgctcccg atcggcgccc tgcgcgtcgg ccaggtagca 7140

attgaccatg agttcgtagt tgagcgcctc ggccgcgtgg cctttggcgc ggagcttacc 7200

tttggaagtc tgcccgcagg cgggacagag gagggacttg agggcgtaga gcttgggggc 7260

gaggaagacg gactcggggg cgtaggcgtc cgcgccgcag tgggcgcaga cggtctcgca 7320

ctccacgagc caggtgaggt cgggctggtc ggggtcaaaa accagtttcc cgccgttctt 7380

tttgatgcgt ttcttacctt tggtctccat gagctcgtgt ccccgctggg tgacaaagag 7440

gctgtccgtg tccccgtaga ccgactttat gggccggtcc tcgagcggtg tgccgcggtc 7500

ctcctcgtag aggaaccccg cccactccga gacgaaagcc cgggtccagg ccagcacgaa 7560

ggaggccacg tgggacgggt agcggtcgtt gtccaccagc gggtccacct tttccagggt 7620

atgcaaacac atgtccccct cgtccacatc caggaaggtg attggcttgt aagtgtaggc 7680

cacgtgaccg ggggtcccgg ccgggggggt ataaaagggt gcgggtccct gctcgtcctc 7740

actgtcttcc ggatcgctgt ccaggagcgc cagctgttgg ggtaggtatt ccctctcgaa 7800

ggcgggcatg acctcggcac tcaggttgtc agtttctaga aacgaggagg atttgatatt 7860

gacggtgccg gcggagatgc ctttcaagag cccctcgtcc atctggtcag aaaagacgat 7920

ctttttgttg tcgagcttgg tggcgaagga gccgtagagg gcgttggaga ggagcttggc 7980

gatggagcgc atggtctggt ttttttcctt gtcggcgcgc tccttggcgg cgatgttgag 8040

ctgcacgtac tcgcgcgcca cgcacttcca ttcggggaag acggtggtca gctcgtcggg 8100

cacgattctg acctgccagc cccgattatg cagggtgatg aggtccacac tggtggccac 8160

ctcgccgcgc aggggctcat tagtccagca gaggcgtccg cccttgcgcg agcagaaggg 8220

gggcaggggg tccagcatga cctcgtcggg ggggtcggca tcgatggtga agatgccggg 8280

caggaggtcg gggtcaaagt agctgatgga agtggccaga tcgtccaggg cagcttgcca 8340

ttcgcgcacg gccagcgcgc gctcgtaggg actgaggggc gtgccccagg gcatgggatg 8400

ggtaagcgcg gaggcgtaca tgccgcagat gtcgtagacg tagaggggct cctcgaggat 8460

gccgatgtag gtggggtagc agcgcccccc gcggatgctg gcgcgcacgt agtcatacag 8520

ctcgtgcgag ggggcgagga gccccgggcc caggttggtg cgactgggct tttcggcgcg 8580

gtagacgatc tggcggaaaa tggcatgcga gttggaggag atggtgggcc tttggaagat 8640

gttgaagtgg gcgtggggca gtccgaccga gtcgcggatg aagtgggcgt aggagtcttg 8700

cagcttggcg acgagctcgg cggtgactag gacgtccaga gcgcagtagt cgagggtctc 8760

ctggatgatg tcatacttga gctgtccctt ttgtttccac agctcgcggt tgagaaggaa 8820

ctcttcgcgg tccttccagt actcttcgag ggggaacccg tcctgatctg cacggtaaga 8880

gcctagcatg tagaactggt tgacggcctt gtaggcgcag cagcccttct ccacggggag 8940

ggcgtaggcc tgggcggcct tgcgcaggga ggtgtgcgtg agggcgaaag tgtccctgac 9000

catgaccttg aggaactggt gcttgaagtc gatatcgtcg cagcccccct gctcccagag 9060

ctggaagtcc gtgcgcttct tgtaggcggg gttgggcaaa gcgaaagtaa catcgttgaa 9120

gaggatcttg cccgcgcggg gcataaagtt gcgagtgatg cggaaaggtt ggggcacctc 9180

ggcccggttg ttgatgacct gggcggcgag cacgatctcg tcgaagccgt tgatgttgtg 9240

gcccacgatg tagagttcca cgaatcgcgg acggcccttg acgtggggca gtttcttgag 9300

ctcctcgtag gtgagctcgt cggggtcgct gagcccgtgc tgctcgagcg cccagtcggc 9360

gagatggggg ttggcgcgga ggaaggaagt ccagagatcc acggccaggg cggtttgcag 9420

acggtcccgg tactgacgga actgctgccc gacggccatt ttttcggggg tgacgcagta 9480

gaaggtgcgg gggtccccgt gccagcgatc ccatttgagc tggagggcga gatcgagggc 9540

gagctcgacg agccggtcgt ccccggagag tttcatgacc agcatgaagg ggacgagctg 9600

cttgccgaag gaccccatcc aggtgtaggt ttccacatcg taggtgagga agagcctttc 9660

ggtgcgagga tgcgagccga tggggaagaa ctggatctcc tgccaccaat tggaggaatg 9720

gctgttgatg tgatggaagt agaaatgccg acggcgcgcc gaacactcgt gcttgtgttt 9780

atacaagcgg ccacagtgct cgcaacgctg cacgggatgc acgtgctgca cgagctgtac 9840

ctgagttcct ttgacgagga atttcagtgg gaagtggagt cgtggcgcct gcatctcgtg 9900

ctgtactacg tcgtggtggt cggcctggcc ctcttctgcc tcgatggtgg tcatgctgac 9960

gagcccgcgc gggaggcagg tccagacctc ggcgcgagcg ggtcggagag cgaggacgag 10020

ggcgcgcagg ccggagctgt ccagggtcct gagacgctgc ggagtcaggt cagtgggcag 10080

cggcggcgcg cggttgactt gcaggagttt ttccagggcg cgcgggaggt ccagatggta 10140

cttgatctcc accgcgccat tggtggcgac gtcgatggct tgcagggtcc cgtgcccctg 10200

gggtgtgacc accgtccccc gtttcttctt gggcggctgg ggcgacgggg gcggtgcctc 10260

ttccatggtt agaagcggcg gcgaggacgc gcgccgggcg gcaggggcgg ctcggggccc 10320

ggaggcaggg gcggcagggg cacgtcggcg ccgcgcgcgg gtaggttctg gtactgcgcc 10380

cggagaagac tggcgtgagc gacgacgcga cggttgacgt cctggatctg acgcctctgg 10440

gtgaaggcca cgggacccgt gagtttgaac ctgaaagaga gttcgacaga atcaatctcg 10500

gtatcgttga cggcggcctg ccgcaggatc tcttgcacgt cgcccgagtt gtcctggtag 10560

gcgatctcgg tcatgaactg ctcgatctcc tcctcttgaa ggtctccgcg gccggcgcgc 10620

tccacggtgg ccgcgaggtc gttggagatg cggcccatga gctgcgagaa ggcgttcatg 10680

cccgcctcgt tccagacgcg gctgtagacc acgacgccct cgggatcgcg ggcgcgcatg 10740

accacctggg cgaggttgag ctccacgtgg cgcgtgaaga ccgcgtagtt gcagaggcgc 10800

tggtagaggt agttgagcgt ggtggcgatg tgctcggtga cgaagaaata catgatccag 10860

cggcggagcg gcatctcgct gacgtcgccc agcgcctcca aacgttccat ggcctcgtaa 10920

aagtccacgg cgaagttgaa aaactgggag ttgcgcgccg agacggtcaa ctcctcctcc 10980

agaagacgga tgagctcggc gatggtggcg cgcacctcgc gctcgaaggc ccccgggagt 11040

tcctccactt cctcttcttc ctcctccact aacatctctt ctacttcctc ctcaggcggc 11100

agtggtggcg ggggaggggg cctgcgtcgc cggcggcgca cgggcagacg gtcgatgaag 11160

cgctcgatgg tctcgccgcg ccggcgtcgc atggtctcgg tgacggcgcg cccgtcctcg 11220

cggggccgca gcgtgaagac gccgccgcgc atctccaggt ggccgggggg gtccccgttg 11280

ggcagggaga gggcgctgac gatgcatctt atcaattgcc ccgtagggac tccgcgcaag 11340

gacctgagcg tctcgagatc cacgggatct gaaaaccgct gaacgaaggc ttcgagccag 11400

tcgcagtcgc aaggtaggct gagcacggtt tcttctggcg ggtcatgttg gttgggagcg 11460

gggcgggcga tgctgctggt gatgaagttg aaataggcgg ttctgagacg gcggatggtg 11520

gcgaggagca ccaggtcttt gggcccggct tgctggatgc gcagacggtc ggccatgccc 11580

caggcgtggt cctgacacct ggccaggtcc ttgtagtagt cctgcatgag ccgctccacg 11640

ggcacctcct cctcgcccgc gcggccgtgc atgcgcgtga gcccgaagcc gcgctggggc 11700

tggacgagcg ccaggtcggc gacgacgcgc tcggcgagga tggcttgctg gatctgggtg 11760

agggtggtct ggaagtcatc aaagtcgacg aagcggtggt aggctccggt gttgatggtg 11820

taggagcagt tggccatgac ggaccagttg acggtctggt ggcccggacg cacgagctcg 11880

tggtacttga ggcgcgagta ggcgcgcgtg tcgaagatgt agtcgttgca ggtgcgcacc 11940

aggtactggt agccgatgag gaagtgcggc ggcggctggc ggtagagcgg ccatcgctcg 12000

gtggcggggg cgccgggcgc gaggtcctcg agcatggtgc ggtggtagcc gtagatgtac 12060

ctggacatcc aggtgatgcc ggcggcggtg gtggaggcgc gcgggaactc gcggacgcgg 12120

ttccagatgt tgcgcagcgg caggaagtag ttcatggtgg gcacggtctg gcccgtgagg 12180

cgcgcgcagt cgtggatgct ctatacgggc aaaaacgaaa gcggtcagcg gctcgactcc 12240

gtggcctgga ggctaagcga acgggttggg ctgcgcgtgt accccggttc gaatctcgaa 12300

tcaggctgga gccgcagcta acgtggtatt ggcactcccg tctcgaccca agcctgcacc 12360

aaccctccag gatacggagg cgggtcgttt tgcaactttt ttttggaggc cggatgagac 12420

tagtaagcgc ggaaagcggc cgaccgcgat ggctcgctgc cgtagtctgg agaagaatcg 12480

ccagggttgc gttgcggtgt gccccggttc gaggccggcc ggattccgcg gctaacgagg 12540

gcgtggctgc cccgtcgttt ccaagacccc atagccagcc gacttctcca gttacggagc 12600

gagcccctct tttgttttgt ttgtttttgc cagatgcatc ccgtactgcg gcagatgcgc 12660

ccccaccacc ctccaccgca acaacagccc cctccacagc cggcgcttct gcccccgccc 12720

cagcagcaac ttccagccac gaccgccgcg gccgccgtga gcggggctgg acagagttat 12780

gatcaccagc tggccttgga agagggcgag gggctggcgc gcctgggggc gtcgtcgccg 12840

gagcggcacc cgcgcgtgca gatgaaaagg gacgctcgcg aggcctacgt gcccaagcag 12900

aacctgttca gagacaggag cggcgaggag cccgaggaga tgcgcgcggc ccggttccac 12960

gcggggcggg agctgcggcg cggcctggac cgaaagaggg tgctgaggga cgaggatttc 13020

gaggcggacg agctgacggg gatcagcccc gcgcgcgcgc acgtggccgc ggccaacctg 13080

gtcacggcgt acgagcagac cgtgaaggag gagagcaact tccaaaaatc cttcaacaac 13140

cacgtgcgca ccctgatcgc gcgcgaggag gtgaccctgg gcctgatgca cctgtgggac 13200

ctgctggagg ccatcgtgca gaaccccacc agcaagccgc tgacggcgca gctgttcctg 13260

gtggtgcagc atagtcggga caacgaagcg ttcagggagg cgctgctgaa tatcaccgag 13320

cccgagggcc gctggctcct ggacctggtg aacattctgc agagcatcgt ggtgcaggag 13380

cgcgggctgc cgctgtccga gaagctggcg gccatcaact tctcggtgct gagtttgggc 13440

aagtactacg ctaggaagat ctacaagacc ccgtacgtgc ccatagacaa ggaggtgaag 13500

atcgacgggt tttacatgcg catgaccctg aaagtgctga ccctgagcga cgatctgggg 13560

gtgtaccgca acgacaggat gcaccgtgcg gtgagcgcca gcaggcggcg cgagctgagc 13620

gaccaggagc tgatgcatag tctgcagcgg gccctgaccg gggccgggac cgagggggag 13680

agctactttg acatgggcgc ggacctgcac tggcagccca gccgccgggc cttggaggcg 13740

gcggcaggac cctacgtaga agaggtggac gatgaggtgg acgaggaggg cgagtacctg 13800

gaagactgat ggcgcgaccg tatttttgct agatgcaaca acaacagcca cctcctgatc 13860

ccgcgatgcg ggcggcgctg cagagccagc cgtccggcat taactcctcg gacgattgga 13920

cccaggccat gcaacgcatc atggcgctga cgacccgcaa ccccgaagcc tttagacagc 13980

agccccaggc caaccggctc tcggccatcc tggaggccgt ggtgccctcg cgctccaacc 14040

ccacgcacga gaaggtcctg gccatcgtga acgcgctggt ggagaacaag gccatccgcg 14100

gcgacgaggc cggcctggtg tacaacgcgc tgctggagcg cgtggcccgc tacaacagca 14160

ccaacgtgca gaccaacctg gaccgcatgg tgaccgacgt gcgcgaggcc gtggcccagc 14220

gcgagcggtt ccaccgcgag tccaacctgg gatccatggt ggcgctgaac gccttcctca 14280

gcacccagcc cgccaacgtg ccccggggcc aggaggacta caccaacttc atcagcgccc 14340

tgcgcctgat ggtgaccgag gtgccccaga gcgaggtgta ccagtccggg ccggactact 14400

tcttccagac cagtcgccag ggcttgcaga ccgtgaacct gagccaggct ttcaagaact 14460

tgcagggcct gtggggcgtg caggccccgg tcggggaccg cgcgacggtg tcgagcctgc 14520

tgacgccgaa ctcgcgcctg ctgctgctgc tggtggcccc cttcacggac agcggcagca 14580

tcaaccgcaa ctcgtacctg ggctacctga ttaacctgta ccgcgaggcc atcggccagg 14640

cgcacgtgga cgagcagacc taccaggaga tcacccacgt gagccgcgcc ctgggccagg 14700

acgacccggg caacctggaa gccaccctga actttttgct gaccaaccgg tcgcagaaga 14760

tcccgcccca gtacgcgctc agcaccgagg aggagcgcat cctgcgttac gtgcagcaga 14820

gcgtgggcct gttcctgatg caggaggggg ccacccccag cgccgcgctc gacatgaccg 14880

cgcgcaacat ggagcccagc atgtacgcca gcaaccgccc gttcatcaat aaactgatgg 14940

actacttgca tcgggcggcc gccatgaact ctgactattt caccaacgcc atcctgaatc 15000

cccactggct cccgccgccg gggttctaca cgggcgagta cgacatgccc gaccccaatg 15060

acgggttcct gtgggacgat gtggacagca gcgtgttctc cccccgaccg ggtgctaacg 15120

agcgcccctt gtggaagaag gaaggcagcg accgacgccc gtcctcggcg ctgtccggcc 15180

gcgagggtgc tgccgcggcg gtgcccgagg ccgccagtcc tttcccgagc ttgcccttct 15240

cgctgaacag tatccgcagc agcgagctgg gcaggatcac gcgcccgcgc ttgctgggcg 15300

aagaggagta cttgaatgac tcgctgttga gacccgagcg ggagaagaac ttccccaata 15360

acgggataga aagcctggtg gacaagatga gccgctggaa gacgtatgcg caggagcaca 15420

gggacgatcc ccgggcgtcg cagggggcca cgagccgggg cagcgccgcc cgtaaacgcc 15480

ggtggcacga caggcagcgg ggacagatgt gggacgatga ggactccgcc gacgacagca 15540

gcgtgttgga cttgggtggg agtggtaacc cgttcgctca cctgcgcccc cgtatcgggc 15600

gcatgatgta agagaaaccg aaaataaatg atactcacca aggccatggc gaccagcgtg 15660

cgttcgtttc ttctctgttg ttgttgtatc tagtatgatg aggcgtgcgt acccggaggg 15720

tcctcctccc tcgtacgaga gcgtgatgca gcaggcgatg gcggcggcgg cgatgcagcc 15780

cccgctggag gctccttacg tgcccccgcg gtacctggcg cctacggagg ggcggaacag 15840

cattcgttac tcggagctgg cacccttgta cgataccacc cggttgtacc tggtggacaa 15900

caagtcggcg gacatcgcct cgctgaacta ccagaacgac cacagcaact tcctgaccac 15960

cgtggtgcag aacaatgact tcacccccac ggaggccagc acccagacca tcaactttga 16020

cgagcgctcg cggtggggcg gccagctgaa aaccatcatg cacaccaaca tgcccaacgt 16080

gaacgagttc atgtacagca acaagttcaa ggcgcgggtg atggtctccc gcaagacccc 16140

caatggggtg acagtgacag aggattatga tggtagtcag gatgagctga agtatgaatg 16200

ggtggaattt gagctgcccg aaggcaactt ctcggtgacc atgaccatcg acctgatgaa 16260

caacgccatc atcgacaatt acttggcggt ggggcggcag aacggggtgc tggagagcga 16320

catcggcgtg aagttcgaca ctaggaactt caggctgggc tgggaccccg tgaccgagct 16380

ggtcatgccc ggggtgtaca ccaacgaggc tttccatccc gatattgtct tgctgcccgg 16440

ctgcggggtg gacttcaccg agagccgcct cagcaacctg ctgggcattc gcaagaggca 16500

gcccttccag gaaggcttcc agatcatgta cgaggatctg gaggggggca acatccccgc 16560

gctcctggat gtcgacgcct atgagaaaag caaggaggat gcagcagctg aagcaactgc 16620

agccgtagct accgcctcta ccgaggtcag gggcgataat tttgcaagcg ccgcagcagt 16680

ggcagcggcc gaggcggctg aaaccgaaag taagatagtc attcagccgg tggagaagga 16740

tagcaagaac aggagctaca acgtactacc ggacaagata aacaccgcct accgcagctg 16800

gtacctagcc tacaactatg gcgaccccga gaagggcgtg cgctcctgga cgctgctcac 16860

cacctcggac gtcacctgcg gcgtggagca agtctactgg tcgctgcccg acatgatgca 16920

agacccggtc accttccgct ccacgcgtca agttagcaac tacccggtgg tgggcgccga 16980

gctcctgccc gtctactcca agagcttctt caacgagcag gccgtctact cgcagcagct 17040

gcgcgccttc acctcgctta cgcacgtctt caaccgcttc cccgagaacc agatcctcgt 17100

ccgcccgccc gcgcccacca ttaccaccgt cagtgaaaac gttcctgctc tcacagatca 17160

cgggaccctg ccgctgcgca gcagtatccg gggagtccag cgcgtgaccg ttactgacgc 17220

cagacgccgc acctgcccct acgtctacaa ggccctgggc atagtcgcgc cgcgcgtcct 17280

ctcgagccgc accttctaaa tgtccattct catctcgccc agtaataaca ccggttgggg 17340

cctgcgcgcg cccagcaaga tgtacggagg cgctcgccaa cgctccacgc aacaccccgt 17400

gcgcgtgcgc gggcacttcc gcgctccctg gggcgccctc aagggccgcg tgcggtcgcg 17460

caccaccgtc gacgacgtga tcgaccaggt ggtggccgac gcgcgcaact acacccccgc 17520

cgccgcgccc gtctccaccg tggacgccgt catcgacagc gtggtggccg acgcgcgccg 17580

gtacgcccgc gccaagagcc ggcggcggcg catcgcccgg cggcaccgga gcacccccgc 17640

catgcgcgcg gcgcgagcct tgctgcgcag ggccaggcgc acgggacgca gggccatgct 17700

cagggcggcc agacgcgcgg cttcaggcgc cagcgccggc aggacccgga gacgcgcggc 17760

cacggcggcg gcagcggcca tcgccagcat gtcccgcccg cggcgaggga acgtgtactg 17820

ggtgcgcgac gccgccaccg gtgtgcgcgt gcccgtgcgc acccgccccc ctcgcacttg 17880

aagatgttca cttcgcgatg ttgatgtgtc ccagcggcga ggaggatgtc caagcgcaaa 17940

ttcaaggaag agatgctcca ggtcatcgcg cctgagatct acggccctgc ggtggtgaag 18000

gaggaaagaa agccccgcaa aatcaagcgg gtcaaaaagg acaaaaagga agaagaaagt 18060

gatgtggacg gattggtgga gtttgtgcgc gagttcgccc cccggcggcg cgtgcagtgg 18120

cgcgggcgga aggtgcaacc ggtgctgaga cccggcacca ccgtggtctt cacgcccggc 18180

gagcgctccg gcaccgcttc caagcgctcc tacgacgagg tgtacgggga tgatgatatt 18240

ctggagcagg cggccgagcg cctgggcgag tttgcttacg gcaagcgcag ccgttccgca 18300

ccgaaggaag aggcggtgtc catcccgctg gaccacggca accccacgcc gagcctcaag 18360

cccgtgacct tgcagcaggt gctgccgacc gcggcgccgc gccgggggtt caagcgcgag 18420

ggcgaggatc tgtaccccac catgcagctg atggtgccca agcgccagaa gctggaagac 18480

gtgctggaga ccatgaaggt ggacccggac gtgcagcccg aggtcaaggt gcggcccatc 18540

aagcaggtgg ccccgggcct gggcgtgcag accgtggaca tcaagattcc cacggagccc 18600

atggaaacgc agaccgagcc catgatcaag cccagcacca gcaccatgga ggtgcagacg 18660

gatccctgga tgccatcggc tcctagtcga agaccccggc gcaagtacgg cgcggccagc 18720

ctgctgatgc ccaactacgc gctgcatcct tccatcatcc ccacgccggg ctaccgcggc 18780

acgcgcttct accgcggtca taccagcagc cgccgccgca agaccaccac tcgccgccgc 18840

cgtcgccgca ccgccgctgc aaccacccct gccgccctgg tgcggagagt gtaccgccgc 18900

ggccgcgcac ctctgaccct gccgcgcgcg cgctaccacc cgagcatcgc catttaaact 18960

ttcgcctgct ttgcagatca atggccctca catgccgcct tcgcgttccc attacgggct 19020

accgaggaag aaaaccgcgc cgtagaaggc tggcggggaa cgggatgcgt cgccaccacc 19080

accggcggcg gcgcgccatc agcaagcggt tggggggagg cttcctgccc gcgctgatcc 19140

ccatcatcgc cgcggcgatc ggggcgatcc ccggcattgc ttccgtggcg gtgcaggcct 19200

ctcagcgcca ctgagacaca cttggaaaca tcttgtaata aaccaatgga ctctgacgct 19260

cctggtcctg tgatgtgttt tcgtagacag atggaagaca tcaatttttc gtccctggct 19320

ccgcgacacg gcacgcggcc gttcatgggc acctggagcg acatcggcac cagccaactg 19380

aacgggggcg ccttcaattg gagcagtctc tggagcgggc ttaagaattt cgggtccacg 19440

cttaaaacct atggcagcaa ggcgtggaac agcaccacag ggcaggcgct gagggataag 19500

ctgaaagagc agaacttcca gcagaaggtg gtcgatgggc tcgcctcggg catcaacggg 19560

gtggtggacc tggccaacca ggccgtgcag cggcagatca acagccgcct ggacccggtg 19620

ccgcccgccg gctccgtgga gatgccgcag gtggaggagg agctgcctcc cctggacaag 19680

cggggcgaga agcgaccccg ccccgatgcg gaggagacgc tgctgacgca cacggacgag 19740

ccgcccccgt acgaggaggc ggtgaaactg ggtctgccca ccacgcggcc catcgcgccc 19800

ctggccaccg gggtgctgaa acccgaaaag cccgcgaccc tggacttgcc tcctccccag 19860

ccttcccgcc cctctacagt ggctaagccc ctgccgccgg tggccgtggc ccgcgcgcga 19920

cccgggggca ccgcccgccc tcatgcgaac tggcagagca ctctgaacag catcgtgggt 19980

ctgggagtgc agagtgtgaa gcgccgccgc tgctattaaa cctaccgtag cgcttaactt 20040

gcttgtctgt gtgtgtatgt attatgtcgc cgccgccgct gtccaccaga aggaggagtg 20100

aagaggcgcg tcgccgagtt gcaagatggc caccccatcg atgctgcccc agtgggcgta 20160

catgcacatc gccggacagg acgcttcgga gtacctgagt ccgggtctgg tgcagtttgc 20220

ccgcgccaca gacacctact tcagtctggg gaacaagttt aggaacccca cggtggcgcc 20280

cacgcacgat gtgaccaccg accgcagcca gcggctgacg ctgcgcttcg tgcccgtgga 20340

ccgcgaggac aacacctact cgtacaaagt gcgctacacg ctggccgtgg gcgacaaccg 20400

cgtgctggac atggccagca cctactttga catccgcggc gtgctggatc ggggccctag 20460

cttcaaaccc tactccggca ccgcctacaa cagtctggcc cccaagggag cacccaacac 20520

ttgtcagtgg acatataaag ccgatggtga aactgccaca gaaaaaacct atacatatgg 20580

aaatgcaccc gtgcagggca ttaacatcac aaaagatggt attcaacttg gaactgacac 20640

cgatgatcag ccaatctacg cagataaaac ctatcagcct gaacctcaag tgggtgatgc 20700

tgaatggcat gacatcactg gtactgatga aaagtatgga ggcagagctc ttaagcctga 20760

taccaaaatg aagccttgtt atggttcttt tgccaagcct actaataaag aaggaggtca 20820

ggcaaatgtg aaaacaggaa caggcactac taaagaatat gacatagaca tggctttctt 20880

tgacaacaga agtgcggctg ctgctggcct agctccagaa attgttttgt atactgaaaa 20940

tgtggatttg gaaactccag atacccatat tgtatacaaa gcaggcacag atgacagcag 21000

ctcttctatt aatttgggtc agcaagccat gcccaacaga cctaactaca ttggtttcag 21060

agacaacttt atcgggctca tgtactacaa cagcactggc aatatggggg tgctggccgg 21120

tcaggcttct cagctgaatg ctgtggttga cttgcaagac agaaacaccg agctgtccta 21180

ccagctcttg cttgactctc tgggtgacag aacccggtat ttcagtatgt ggaatcaggc 21240

ggtggacagc tatgatcctg atgtgcgcat tattgaaaat catggtgtgg aggatgaact 21300

tcccaactat tgtttccctc tggatgctgt tggcagaaca gatacttatc agggaattaa 21360

ggctaatgga actgatcaaa ccacatggac caaagatgac agtgtcaatg atgctaatga 21420

gataggcaag ggtaatccat tcgccatgga aatcaacatc caagccaacc tgtggaggaa 21480

cttcctctac gccaacgtgg ccctgtacct gcccgactct tacaagtaca cgccggccaa 21540

tgttaccctg cccaccaaca ccaacaccta cgattacatg aacggccggg tggtggcgcc 21600

ctcgctggtg gactcctaca tcaacatcgg ggcgcgctgg tcgctggatc ccatggacaa 21660

cgtgaacccc ttcaaccacc accgcaatgc ggggctgcgc taccgctcca tgctcctggg 21720

caacgggcgc tacgtgccct tccacatcca ggtgccccag aaatttttcg ccatcaagag 21780

cctcctgctc ctgcccgggt cctacaccta cgagtggaac ttccgcaagg acgtcaacat 21840

gatcctgcag agctccctcg gcaacgacct gcgcacggac ggggcctcca tctccttcac 21900

cagcatcaac ctctacgcca ccttcttccc catggcgcac aacacggcct ccacgctcga 21960

ggccatgctg cgcaacgaca ccaacgacca gtccttcaac gactacctct cggcggccaa 22020

catgctctac cccatcccgg ccaacgccac caacgtgccc atctccatcc cctcgcgcaa 22080

ctgggccgcc ttccgcggct ggtccttcac gcgtctcaag accaaggaga cgccctcgct 22140

gggctccggg ttcgacccct acttcgtcta ctcgggctcc atcccctacc tcgacggcac 22200

cttctacctc aaccacacct tcaagaaggt ctccatcacc ttcgactcct ccgtcagctg 22260

gcccggcaac gaccggctcc tgacgcccaa cgagttcgaa atcaagcgca ccgtcgacgg 22320

cgagggctac aacgtggccc agtgcaacat gaccaaggac tggttcctgg tccagatgct 22380

ggcccactac aacatcggct accagggctt ctacgtgccc gagggctaca aggaccgcat 22440

gtactccttc ttccgcaact tccagcccat gagccgccag gtggtggacg aggtcaacta 22500

caaggactac caggccgtca ccctggccta ccagcacaac aactcgggct tcgtcggcta 22560

cctcgcgccc accatgcgcc agggccagcc ctaccccgcc aactacccct acccgctcat 22620

cggcaagagc gccgtcacca gcgtcaccca gaaaaagttc ctctgcgaca gggtcatgtg 22680

gcgcatcccc ttctccagca acttcatgtc catgggcgcg ctcaccgacc tcggccagaa 22740

catgctctat gccaactccg cccacgcgct agacatgaat ttcgaagtcg accccatgga 22800

tgagtccacc cttctctatg ttgtcttcga agtcttcgac gtcgtccgag tgcaccagcc 22860

ccaccgcggc gtcatcgagg ccgtctacct gcgcaccccc ttctcggccg gtaacgccac 22920

cacctaagct cttgcttctt gcaagccatg gccgcgggct ccggcgagca ggagctcagg 22980

gccatcatcc gcgacctggg ctgcgggccc tacttcctgg gcaccttcga taagcgcttc 23040

ccgggattca tggccccgca caagctggcc tgcgccatcg tcaacacggc cggccgcgag 23100

accgggggcg agcactggct ggccttcgcc tggaacccgc gctcgaacac ctgctacctc 23160

ttcgacccct tcgggttctc ggacgagcgc ctcaagcaga tctaccagtt cgagtacgag 23220

ggcctgctgc gccgcagcgc cctggccacc gaggaccgct gcgtcaccct ggaaaagtcc 23280

acccagaccg tgcagggtcc gcgctcggcc gcctgcgggc tcttctgctg catgttcctg 23340

cacgccttcg tgcactggcc cgaccgcccc atggacaaga accccaccat gaacttgctg 23400

acgggggtgc ccaacggcat gctccagtcg ccccaggtgg aacccaccct gcgccgcaac 23460

caggaggcgc tctaccgctt cctcaactcc cactccgcct actttcgctc ccaccgcgcg 23520

cgcatcgaga aggccaccgc cttcgaccgc atgaatcaag acatgtaaac cgtgtgtgta 23580

tgttaaatgt ctttaataaa cagcactttc atgttacaca tgcatctgag atgatttatt 23640

tagaaatcga aagggttctg ccgggtctcg gcatggcccg cgggcaggga cacgttgcgg 23700

aactggtact tggccagcca cttgaactcg gggatcagca gtttgggcag cggggtgtcg 23760

gggaaggagt cggtccacag cttccgcgtc agttgcaggg cgcccagcag gtcgggcgcg 23820

gagatcttga aatcgcagtt gggacccgcg ttctgcgcgc gggagttgcg gtacacgggg 23880

ttgcagcact ggaacaccat cagggccggg tgcttcacgc tcgccagcac cgtcgcgtcg 23940

gtgatgctct ccacgtcgag gtcctcggcg ttggccatcc cgaagggggt catcttgcag 24000

gtctgccttc ccatggtggg cacgcacccg ggcttgtggt tgcaatcgca gtgcaggggg 24060

atcagcatca tctgggcctg gtcggcgttc atccccgggt acatggcctt catgaaagcc 24120

tccaattgcc tgaacgcctg ctgggccttg gctccctcgg tgaagaagac cccgcaggac 24180

ttgctagaga actggttggt ggcgcacccg gcgtcgtgca cgcagcagcg cgcgtcgttg 24240

ttggccagct gcaccacgct gcgcccccag cggttctggg tgatcttggc ccggtcgggg 24300

ttctccttca gcgcgcgctg cccgttctcg ctcgccacat ccatctcgat catgtgctcc 24360

ttctggatca tggtggtccc gtgcaggcac cgcagcttgc cctcggcctc ggtgcacccg 24420

tgcagccaca gcgcgcaccc ggtgcactcc cagttcttgt gggcgatctg ggaatgcgcg 24480

tgcacgaagc cctgcaggaa gcggcccatc atggtggtca gggtcttgtt gctagtgaag 24540

gtcagcggaa tgccgcggtg ctcctcgttg atgtacaggt ggcagatgcg gcggtacacc 24600

tcgccctgct cgggcatcag ctggaagttg gctttcaggt cggtctccac gcggtagcgg 24660

tccatcagca tagtcatgat ttccataccc ttctcccagg ccgagacgat gggcaggctc 24720

atagggttct tcaccatcat cttagcgcta gcagccgcgg ccagggggtc gctctcgtcc 24780

agggtctcaa agctccgctt gccgtccttc tcggtgatcc gcaccggggg gtagctgaag 24840

cccacggccg ccagctcctc ctcggcctgt ctttcgtcct cgctgtcctg gctgacgtcc 24900

tgcaggacca catgcttggt cttgcggggt ttcttcttgg gcggcagcgg cggcggagat 24960

gttggagatg gcgaggggga gcgcgagttc tcgctcacca ctactatctc ttcctcttct 25020

tggtccgagg ccacgcggcg gtaggtatgt ctcttcgggg gcagaggcgg aggcgacggg 25080

ctctcgccgc cgcgacttgg cggatggctg gcagagcccc ttccgcgttc gggggtgcgc 25140

tcccggcggc gctctgactg acttcctccg cggccggcca ttgtgttctc ctagggagga 25200

acaacaagca tggagactca gccatcgcca acctcgccat ctgcccccac cgccgacgag 25260

aagcagcagc agcagaatga aagcttaacc gccccgccgc ccagccccgc cacctccgac 25320

gcggccgtcc cagacatgca agagatggag gaatccatcg agattgacct gggctatgtg 25380

acgcccgcgg agcacgagga ggagctggca gtgcgctttt cacaagaaga gatacaccaa 25440

gaacagccag agcaggaagc agagaatgag cagagtcagg ctgggctcga gcatgacggc 25500

gactacctcc acctgagcgg gggggaggac gcgctcatca agcatctggc ccggcaggcc 25560

accatcgtca aggatgcgct gctcgaccgc accgaggtgc ccctcagcgt ggaggagctc 25620

agccgcgcct acgagttgaa cctcttctcg ccgcgcgtgc cccccaagcg ccagcccaat 25680

ggcacctgcg agcccaaccc gcgcctcaac ttctacccgg tcttcgcggt gcccgaggcc 25740

ctggccacct accacatctt tttcaagaac caaaagatcc ccgtctcctg ccgcgccaac 25800

cgcacccgcg ccgacgccct tttcaacctg ggtcccggcg cccgcctacc tgatatcgcc 25860

tccttggaag aggttcccaa gatcttcgag ggtctgggca gcgacgagac tcgggccgcg 25920

aacgctctgc aaggagaagg aggagagcat gagcaccaca gcgccctggt cgagttggaa 25980

ggcgacaacg cgcggctggc ggtgctcaaa cgcacggtcg agctgaccca tttcgcctac 26040

ccggctctga acctgccccc caaagtcatg agcgcggtca tggaccaggt gctcatcaag 26100

cgcgcgtcgc ccatctccga ggacgagggc atgcaagact ccgaggaggg caagcccgtg 26160

gtcagcgacg agcagctggc ccggtggctg ggtcctaatg ctagtcccca gagtttggaa 26220

gagcggcgca aactcatgat ggccgtggtc ctggtgaccg tggagctgga gtgcctgcgc 26280

cgcttcttcg ccgacgcgga gaccctgcgc aaggtcgagg agaacctgca ctacctcttc 26340

aggcacgggt tcgtgcgcca ggcctgcaag atctccaacg tggagctgac caacctggtc 26400

tcctacatgg gcatcttgca cgagaaccgc ctggggcaga acgtgctgca caccaccctg 26460

cgcggggagg cccggcgcga ctacatccgc gactgcgtct acctctacct ctgccacacc 26520

tggcagacgg gcatgggcgt gtggcagcag tgtctggagg agcagaacct gaaagagctc 26580

tgcaagctcc tgcagaagaa cctcaagggt ctgtggaccg ggttcgacga gcgcaccacc 26640

gcctcggacc tggccgacct cattttcccc gagcgcctca ggctgacgct gcgcaacggc 26700

ctgcccgact ttatgagcca aagcatgttg caaaactttc gctctttcat cctcgaacgc 26760

tccggaatcc tgcccgccac ctgctccgcg ctgccctcgg acttcgtgcc gctgaccttc 26820

cgcgagtgcc ccccgccgct gtggagccac tgctacctgc tgcgcctggc caactacctg 26880

gcctaccact cggacgtgat cgaggacgtc agcggcgagg gcctgctcga gtgccactgc 26940

cgctgcaacc tctgcacgcc gcaccgctcc ctggcctgca acccccagct gctgagcgag 27000

acccagatca tcggcacctt cgagttgcaa gggcccagcg aaggcgaggg ttcagccgcc 27060

aaggggggtc tgaaactcac cccggggctg tggacctcgg cctacttgcg caagttcgtg 27120

cccgaggact accatccctt cgagatcagg ttctacgagg accaatccca tccgcccaag 27180

gccgagctgt cggcctgcgt catcacccag ggggcgatcc tggcccaatt gcaagccatc 27240

cagaaatccc gccaagaatt cttgctgaaa aagggccgcg gggtctacct cgacccccag 27300

accggtgagg agctcaaccc cggcttcccc caggatgccc cgaggaaaca agaagctgaa 27360

agtggagctg ccgcccgtgg aggatttgga ggaagactgg gagaacagca gtcaggcaga 27420

ggaggaggag atggaggaag actgggacag cactcaggca gaggaggaca gcctgcaaga 27480

cagtctggag gaagacgagg aggaggcaga ggaggaggtg gaagaagcag ccgccgccag 27540

accgtcgtcc tcggcggggg agaaagcaag cagcacggat accatctccg ctccgggtcg 27600

gggtcccgct cgaccacaca gtagatggga cgagaccgga cgattcccga accccaccac 27660

ccagaccggt aagaaggagc ggcagggata caagtcctgg cgggggcaca aaaacgccat 27720

cgtctcctgc ttgcaggcct gcgggggcaa catctccttc acccggcgct acctgctctt 27780

ccaccgcggg gtgaactttc cccgcaacat cttgcattac taccgtcacc tccacagccc 27840

ctactacttc caagaagagg cagcagcagc agaaaaagac cagcagaaaa ccagcagcta 27900

gaaaatccac agcggcggca gcaggtggac tgaggatcgc ggcgaacgag ccggcgcaaa 27960

cccgggagct gaggaaccgg atctttccca ccctctatgc catcttccag cagagtcggg 28020

ggcaggagca ggaactgaaa gtcaagaacc gttctctgcg ctcgctcacc cgcagttgtc 28080

tgtatcacaa gagcgaagac caacttcagc gcactctcga ggacgccgag gctctcttca 28140

acaagtactg cgcgctcact cttaaagagt agcccgcgcc cgcccagtcg cagaaaaagg 28200

cgggaattac gtcacctgtg cccttcgccc tagccgcctc cacccatcat catgagcaaa 28260

gagattccca cgccttacat gtggagctac cagccccaga tgggcctggc cgccggtgcc 28320

gcccaggact actccacccg catgaattgg ctcagcgccg ggcccgcgat gatctcacgg 28380

gtgaatgaca tccgcgccca ccgaaaccag atactcctag aacagtcagc gctcaccgcc 28440

acgccccgca atcacctcaa tccgcgtaat tggcccgccg ccctggtgta ccaggaaatt 28500

ccccagccca cgaccgtact acttccgcga gacgcccagg ccgaagtcca gctgactaac 28560

tcaggtgtcc agctggcggg cggcgccacc ctgtgtcgtc accgccccgc tcagggtata 28620

aagcggctgg tgatccgggg cagaggcaca cagctcaacg acgaggtggt gagctcttcg 28680

ctgggtctgc gacctgacgg agtcttccaa ctcgccggat cggggagatc ttccttcacg 28740

cctcgtcagg ccgtcctgac tttggagagt tcgtcctcgc agccccgctc gggtggcatc 28800

ggcactctcc agttcgtgga ggagttcact ccctcggtct acttcaaccc cttctccggc 28860

tcccccggcc actacccgga cgagttcatc ccgaacttcg acgccatcag cgagtcggtg 28920

gacggctacg attgaatgtc ccatggtggc gcagctgacc tagctcggct tcgacacctg 28980

gaccactgcc gccgcttccg ctgcttcgct cgggatctcg ccgagtttgc ctactttgag 29040

ctgcccgagg agcaccctca gggcccggcc cacggagtgc ggatcgtcgt cgaagggggc 29100

ctcgactccc acctgcttcg gatcttcagc cagcgtccga tcctggtcga gcgcgagcaa 29160

ggacagaccc ttctgactct gtactgcatc tgcaaccacc ccggcctgca tgaaagtctt 29220

tgttgtctgc tgtgtactga gtataataaa agctgagatc agcgactact ccggacttcc 29280

gtgtgttcct gaatccatca accagtcttt gttcttcacc gggaacgaga ccgagctcca 29340

gctccagtgt aagccccaca agaagtacct cacctggctg ttccagggct ccccgatcgc 29400

cgttgtcaac cactgcgaca acgacggagt cctgctgagc ggccctgcca accttacttt 29460

ttccacccgc agaagcaagc tccagctctt ccaacccttc ctccccggga cctatcagtg 29520

cgtctcggga ccctgccatc acaccttcca cctgatcccg aataccacag cgtcgctccc 29580

cgctactaac aaccaaacta acctccacca acgccaccgt cgctaggcca caatacatgc 29640

ccatattaga ctatgaggcc gagccacagc gacccatgct ccccgctatt agttacttca 29700

atctaaccgg cggagatgac tgacccactg gccaacaaca acgtcaacga ccttctcctg 29760

gacatggacg gccgcgcctc ggagcagcga ctcgcccaac ttcgcattcg ccagcagcag 29820

gagagagccg tcaaggagct gcaggatgcg gtggccatcc accagtgcaa gagaggcatc 29880

ttctgcctgg tgaaacaggc caagatctcc tacgaggtca ctccaaacga ccatcgcctc 29940

tcctacgagc tcctgcagca gcgccagaag ttcacctgcc tggtcggagt caaccccatc 30000

gtcatcaccc agcagtctgg cgataccaag gggtgcatcc actgctcctg cgactccccc 30060

gactgcgtcc acactctgat caagaccctc tgcggcctcc gcgacctcct ccccatgaac 30120

taatcacccc cttatccagt gaaataaaga tcatattgat gatgatttta cagaaataaa 30180

aaataatcat ttgatttgaa ataaagatac aatcatattg atgatttgag tttaacaaaa 30240

aaataaagaa tcacttactt gaaatctgat accaggtctc tgtccatgtt ttctgccaac 30300

accacttcac tcccctcttc ccagctctgg tactgcaggc cccggcgggc tgcaaacttc 30360

ctccacacgc tgaaggggat gtcaaattcc tcctgtccct caatcttcat tttatcttct 30420

atcagatgtc caaaaagcgc gtccgggtgg atgatgactt cgaccccgtc tacccctacg 30480

atgcagacaa cgcaccgacc gtgcccttca tcaacccccc cttcgtctct tcagatggat 30540

tccaagagaa gcccctgggg gtgttgtccc tgcgactggc cgaccccgtc accaccaaga 30600

acggggaaat caccctcaag ctgggagagg gggtggacct cgattcctcg ggaaaactca 30660

tctccaacac ggccaccaag gccgccgccc ctctcagttt ttccaacaac accatttccc 30720

ttaacatgga tcaccccttt tacactaaag atggaaaatt atccttacaa gtttctccac 30780

cattaaatat actgagaaca agcattctaa acacactagc tttaggtttt ggatcaggtt 30840

taggactccg tggctctgcc ttggcagtac agttagtctc tccacttaca tttgatactg 30900

atggaaacat aaagcttacc ttagacagag gtttgcatgt tacaacagga gatgcaattg 30960

aaagcaacat aagctgggct aaaggtttaa aatttgaaga tggagccata gcaaccaaca 31020

ttggaaatgg gttagagttt ggaagcagta gtacagaaac aggtgttgat gatgcttacc 31080

caatccaagt taaacttgga tctggcctta gctttgacag tacaggagcc ataatggctg 31140

gtaacaaaga agacgataaa ctcactttgt ggacaacacc tgatccatca ccaaactgtc 31200

aaatactcgc agaaaatgat gcaaaactaa cactttgctt gactaaatgt ggtagtcaaa 31260

tactggccac tgtgtcagtc ttagttgtag gaagtggaaa cctaaacccc attactggca 31320

ccgtaagcag tgctcaggtg tttctacgtt ttgatgcaaa cggtgttctt ttaacagaac 31380

attctacact aaaaaaatac tgggggtata ggcagggaga tagcatagat ggcactccat 31440

ataccaatgc tgtaggattc atgcccaatt taaaagctta tccaaagtca caaagttcta 31500

ctactaaaaa taatatagta gggcaagtat acatgaatgg agatgtttca aaacctatgc 31560

ttctcactat aaccctcaat ggtactgatg acagcaacag tacatattca atgtcatttt 31620

catacacctg gactaatgga agctatgttg gagcaacatt tggggctaac tcttatacct 31680

tctcatacat cgcccaagaa tgaacactgt atcccaccct gcatgccaac ccttcccacc 31740

ccactctgtg gaacaaactc tgaaacacaa aataaaataa agttcaagtg ttttattgat 31800

tcaacagttt tacaggattc gagcagttat ttttcctcca ccctcccagg acatggaata 31860

caccaccctc tccccccgca cagccttgaa catctgaatg ccattggtga tggacatgct 31920

tttggtctcc acgttccaca cagtttcaga gcgagccagt ctcgggtcgg tcagggagat 31980

gaaaccctcc gggcactccc gcatctgcac ctcacagctc aacagctgag gattgtcctc 32040

ggtggtcggg atcacggtta tctggaagaa gcagaagagc ggcggtggga atcatagtcc 32100

gcgaacggga tcggccggtg gtgtcgcatc aggccccgca gcagtcgctg ccgccgccgc 32160

tccgtcaagc tgctgctcag ggggtccggg tccagggact ccctcagcat gatgcccacg 32220

gccctcagca tcagtcgtct ggtgcggcgg gcgcagcagc gcatgcggat ctcgctcagg 32280

tcgctgcagt acgtgcaaca cagaaccacc aggttgttca acagtccata gttcaacacg 32340

ctccagccga aactcatcgc gggaaggatg ctacccacgt ggccgtcgta ccagatcctc 32400

aggtaaatca agtggtgccc cctccagaac acgctgccca cgtacatgat ctccttgggc 32460

atgtggcggt tcaccacctc ccggtaccac atcaccctct ggttgaacat gcagccccgg 32520

atgatcctgc ggaaccacag ggccagcacc gccccgcccg ccatgcagcg aagagacccc 32580

gggtcccggc aatggcaatg gaggacccac cgctcgtacc cgtggatcat ctgggagctg 32640

aacaagtcta tgttggcaca gcacaggcat atgctcatgc atctcttcag cactctcaac 32700

tcctcggggg tcaaaaccat atcccagggc acggggaact cttgcaggac agcgaacccc 32760

gcagaacagg gcaatcctcg cacagaactt acattgtgca tggacagggt atcgcaatca 32820

ggcagcaccg ggtgatcctc caccagagaa gcgcgggtct cggtctcctc acagcgtggt 32880

aagggggccg gccgatacgg gtgatggcgg gacgcggctg atcgtgttcg cgaccgtgtc 32940

atgatgcagt tgctttcgga cattttcgta cttgctgtag cagaacctgg tccgggcgct 33000

gcacaccgat cgccggcggc ggtctcggcg cttggaacgc tcggtgttga aattgtaaaa 33060

cagccactct ctcagaccgt gcagcagatc tagggcctca ggagtgatga agatcccatc 33120

atgcctgatg gctctgatca catcgaccac cgtggaatgg gccagaccca gccagatgat 33180

gcaattttgt tgggtttcgg tgacggcggg ggagggaaga acaggaagaa ccatgattaa 33240

cttttaatcc aaacggtctc ggagtacttc aaaatgaaga tcgcggagat ggcacctctc 33300

gcccccgctg tgttggtgga aaataacagc caggtcaaag gtgatacggt tctcgagatg 33360

ttccacggtg gcttccagca aagcctccac gcgcacatcc agaaacaaga caatagcgaa 33420

agcgggaggg ttctctaatt cctcaatcat catgttacac tcctgcacca tccccagata 33480

attttcattt ttccagcctt gaatgattcg aactagttcc tgaggtaaat ccaagccagc 33540

catgataaag agctcgcgca gagcgccctc caccggcatt cttaagcaca ccctcataat 33600

tccaagatat tctgctcctg gttcacctgc agcagattga caagcggaat atcaaaatct 33660

ctgccgcgat ccctgagctc ctccctcagc aataactgta agtactcttt catatcctct 33720

ccgaaatttt tagccatagg accaccagga ataagattag ggcaagccac agtacagata 33780

aaccgaagtc ctccccagtg agcattgcca aatgcaagac tgctataagc atgctggcta 33840

gacccggtga tatcttccag ataactggac agaaaatcgc ccaggcaatt tttaagaaaa 33900

tcaacaaaag aaaaatcctc caggtggacg tttagagcct cgggaacaac gatgaagtaa 33960

atgcaagcgg tgcgttccag catggttagt tagctgatct gtagaaaaaa caaaaatgaa 34020

cattaaacca tgctagcctg gcgaacaggt gggtaaatcg ttctctccag caccaggcag 34080

gccacggggt ctccggcgcg accctcgtaa aaattgtcgc tatgattgaa aaccatcaca 34140

gagagacgtt cccggtggcc ggcgtgaatg attcgacaag atgaatacac ccccggaaca 34200

ttggcgtccg cgagtgaaaa aaagcgcccg aggaagcaat aaggcactac aatgctcagt 34260

ctcaagtcca gcaaagcgat gccatgcgga tgaagcacaa aattctcagg tgcgtacaaa 34320

atgtaattac tcccctcctg cacaggcagc aaagcccccg atccctccag gtacacatac 34380

aaagcctcag cgtccatagc ttaccgagca gcagcacaca acaggcgcaa gagtcagaga 34440

aaggctgagc tctaacctgt ccacccgctc tctgctcaat atatagccca gatctacact 34500

gacgtaaagg ccaaagtcta aaaatacccg ccaaataatc acacacgccc agcacacgcc 34560

cagaaaccgg tgacacactc aaaaaaatac gcgcacttcc tcaaacgccc aaaactgccg 34620

tcatttccgg gttcccacgc tacgtcatca aaacacgact ttcaaattcc gtcgaccgtt 34680

aaaaacgtca cccgccccgc ccctaacggt cgcccgtctc tcagccaatc agcgccccgc 34740

atccccaaat tcaaacacct catttgcata ttaacgcgca caaaaagttt gaggtatatt 34800

attgatgatg gttaattaa 34819

<210> 59

<211> 568

<212> ДНК

<213> Искуственная последовательность

<220>

<223> Синтетическая конструкция

<400> 59

taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct atatgttatt 60

ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt 120

gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc tgttgaatgt 180

cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg tagcgaccct 240

ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa agccacgtgt 300

ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt ggatagttgt 360

ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg atgcccagaa 420

ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta catgtgttta 480

gtcgaggtta aaaaacgtct aggccccccg aaccacgggg acgtggtttt cctttgaaaa 540

acacgatgat aatatggcca caaccatg 568

<210> 60

<211> 1145

<212> ПРТ

<213> Искуственная последовательность

<220>

<223> Синтетическая конструкция

<400> 60

Met Ala Ser Ile Val Gly Gly Trp Glu Cys Glu Lys His Ser Gln Pro

1 5 10 15

Trp Gln Val Leu Val Ala Ser Arg Gly Arg Ala Val Cys Gly Gly Val

20 25 30

Leu Val His Pro Gln Trp Val Leu Thr Ala Ala His Cys Ile Arg Asn

35 40 45

Lys Ser Val Ile Leu Leu Gly Arg His Ser Leu Phe His Pro Glu Asp

50 55 60

Thr Gly Gln Val Phe Gln Val Ser His Ser Phe Pro His Pro Leu Tyr

65 70 75 80

Asp Met Ser Leu Leu Lys Asn Arg Phe Leu Arg Pro Gly Asp Asp Ser

85 90 95

Ser His Asp Leu Met Leu Leu Arg Leu Ser Glu Pro Ala Glu Leu Thr

100 105 110

Asp Ala Val Lys Val Met Asp Leu Pro Thr Gln Glu Pro Ala Leu Gly

115 120 125

Thr Thr Cys Tyr Ala Ser Gly Trp Gly Ser Ile Glu Pro Glu Glu Phe

130 135 140

Leu Thr Pro Lys Lys Leu Gln Cys Val Asp Leu His Val Ile Ser Asn

145 150 155 160

Asp Val Cys Ala Gln Val His Pro Gln Lys Val Thr Lys Phe Met Leu

165 170 175

Cys Ala Gly Arg Trp Thr Gly Gly Lys Ser Thr Cys Ser Gly Asp Ser

180 185 190

Gly Gly Pro Leu Val Cys Asn Gly Val Leu Gln Gly Ile Thr Ser Trp

195 200 205

Gly Ser Glu Pro Cys Ala Leu Pro Glu Arg Pro Ser Leu Tyr Thr Lys

210 215 220

Val Val His Tyr Arg Lys Trp Ile Lys Asp Thr Ile Val Ala Asn Pro

225 230 235 240

Gly Ser Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu

245 250 255

Asn Pro Gly Pro Ala Ser Lys Ala Val Leu Leu Ala Leu Leu Met Ala

260 265 270

Gly Leu Ala Leu Gln Pro Gly Thr Ala Leu Leu Cys Tyr Ser Cys Lys

275 280 285

Ala Gln Val Ser Asn Glu Asp Cys Leu Gln Val Glu Asn Cys Thr Gln

290 295 300

Leu Gly Glu Gln Cys Trp Thr Ala Arg Ile Arg Ala Val Gly Leu Leu

305 310 315 320

Thr Val Ile Ser Lys Gly Cys Ser Leu Asn Cys Val Asp Asp Ser Gln

325 330 335

Asp Tyr Tyr Val Gly Lys Lys Asn Ile Thr Cys Cys Asp Thr Asp Leu

340 345 350

Cys Asn Ala Ser Gly Ala His Ala Leu Gln Pro Ala Ala Ala Ile Leu

355 360 365

Ala Leu Leu Pro Ala Leu Gly Leu Leu Leu Trp Gly Pro Gly Gln Leu

370 375 380

Gly Ser Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val

385 390 395 400

Glu Ser Asn Pro Gly Pro Met Ala Ser Ala Arg Arg Pro Arg Trp Leu

405 410 415

Cys Ala Gly Ala Leu Val Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe

420 425 430

Leu Phe Gly Trp Phe Ile Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr

435 440 445

Pro Lys His Asn Met Lys Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn

450 455 460

Ile Lys Lys Phe Leu Tyr Asn Phe Thr Gln Ile Pro His Leu Ala Gly

465 470 475 480

Thr Glu Gln Asn Phe Gln Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys

485 490 495

Glu Phe Gly Leu Asp Ser Val Glu Leu Ala His Tyr Asp Val Leu Leu

500 505 510

Ser Tyr Pro Asn Lys Thr His Pro Asn Tyr Ile Ser Ile Ile Asn Glu

515 520 525

Asp Gly Asn Glu Ile Phe Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro

530 535 540

Gly Tyr Glu Asn Val Ser Asp Ile Val Pro Pro Phe Ser Ala Phe Ser

545 550 555 560

Pro Gln Gly Met Pro Glu Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg

565 570 575

Thr Glu Asp Phe Phe Lys Leu Glu Arg Asp Met Lys Ile Asn Cys Ser

580 585 590

Gly Lys Ile Val Ile Ala Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys

595 600 605

Val Lys Asn Ala Gln Leu Ala Gly Ala Lys Gly Val Ile Leu Tyr Ser

610 615 620

Asp Pro Ala Asp Tyr Phe Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly

625 630 635 640

Trp Asn Leu Pro Gly Gly Gly Val Gln Arg Gly Asn Ile Leu Asn Leu

645 650 655

Asn Gly Ala Gly Asp Pro Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr

660 665 670

Ala Tyr Arg Arg Gly Ile Ala Glu Ala Val Gly Leu Pro Ser Ile Pro

675 680 685

Val His Pro Ile Gly Tyr Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met

690 695 700

Gly Gly Ser Ala Pro Pro Asp Ser Ser Trp Arg Gly Ser Leu Lys Val

705 710 715 720

Pro Tyr Asn Val Gly Pro Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys

725 730 735

Val Lys Met His Ile His Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn

740 745 750

Val Ile Gly Thr Leu Arg Gly Ala Val Glu Pro Asp Arg Tyr Val Ile

755 760 765

Leu Gly Gly His Arg Asp Ser Trp Val Phe Gly Gly Ile Asp Pro Gln

770 775 780

Ser Gly Ala Ala Val Val His Glu Ile Val Arg Ser Phe Gly Thr Leu

785 790 795 800

Lys Lys Glu Gly Trp Arg Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp

805 810 815

Asp Ala Glu Glu Phe Gly Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu

820 825 830

Asn Ser Arg Leu Leu Gln Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp

835 840 845

Ser Ser Ile Glu Gly Asn Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu

850 855 860

Met Tyr Ser Leu Val His Asn Leu Thr Lys Glu Leu Lys Ser Pro Asp

865 870 875 880

Glu Gly Phe Glu Gly Lys Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser

885 890 895

Pro Ser Pro Glu Phe Ser Gly Met Pro Arg Ile Ser Lys Leu Gly Ser

900 905 910

Gly Asn Asp Phe Glu Val Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly

915 920 925

Arg Ala Arg Tyr Thr Lys Asn Trp Glu Thr Asn Lys Phe Ser Gly Tyr

930 935 940

Pro Leu Tyr His Ser Val Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe

945 950 955 960

Tyr Asp Pro Met Phe Lys Tyr His Leu Thr Val Ala Gln Val Arg Gly

965 970 975

Gly Met Val Phe Glu Leu Ala Asn Ser Ile Val Leu Pro Phe Asp Cys

980 985 990

Arg Asp Tyr Ala Val Val Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Ser

995 1000 1005

Ile Ser Met Lys His Pro Gln Glu Met Lys Thr Tyr Ser Val Ser

1010 1015 1020

Phe Asp Ser Leu Phe Ser Ala Val Lys Asn Phe Thr Glu Ile Ala

1025 1030 1035

Ser Lys Phe Ser Glu Arg Leu Gln Asp Phe Asp Lys Ser Asn Pro

1040 1045 1050

Ile Val Leu Arg Met Met Asn Asp Gln Leu Met Phe Leu Glu Arg

1055 1060 1065

Ala Phe Ile Asp Pro Leu Gly Leu Pro Asp Arg Pro Phe Tyr Arg

1070 1075 1080

His Val Ile Tyr Ala Pro Ser Ser His Asn Lys Tyr Ala Gly Glu

1085 1090 1095

Ser Phe Pro Gly Ile Tyr Asp Ala Leu Phe Asp Ile Glu Ser Lys

1100 1105 1110

Val Asp Pro Ser Lys Ala Trp Gly Glu Val Lys Arg Gln Ile Tyr

1115 1120 1125

Val Ala Ala Phe Thr Val Gln Ala Ala Ala Glu Thr Leu Ser Glu

1130 1135 1140

Val Ala

1145

<210> 61

<211> 3435

<212> ДНК

<213> Искуственная последовательность

<220>

<223> Синтетическая конструкция

<400> 61

atggctagca tcgtcggagg gtgggagtgc gaaaagcact cacagccatg gcaggtcctg 60

gtcgcctcgc gcggacgcgc cgtgtgtgga ggtgtgctgg tccacccgca gtgggtgttg 120

actgcggccc attgcatcag aaataagtcc gtgatcctct tggggagaca ttccctgttt 180

caccccgaag atactggaca ggtgttccaa gtgagccact ccttcccgca tccactgtac 240

gacatgagcc tgctgaagaa ccgctttctg cggccagggg acgactcatc acacgatttg 300

atgctgcttc ggctctcgga accggccgag ctcaccgacg cagtgaaggt catggacctc 360

cctacgcaag agcctgctct cggtaccact tgttacgcat cgggatgggg ctccatcgag 420

ccggaagaat tcctgacccc gaaaaagctg cagtgcgtgg atctgcacgt gatttcgaat 480

gacgtgtgcg cgcaagtgca tccacaaaag gtcactaagt tcatgctgtg cgccggaagg 540

tggaccggcg gaaaatcgac ctgttccggc gacagcggag gcccactcgt gtgcaacggt 600

gtgctgcagg gcatcactag ctggggatca gaaccgtgcg cgcttccgga gcggccctcg 660

ctctacacga aggtggtgca ctaccgcaaa tggattaaag ataccatcgt cgcaaaccct 720

ggatccgaag gtaggggttc attattgacc tgtggagatg tcgaagaaaa cccaggaccc 780

gctagcaaag cagtgctgct ggcgctcctg atggctggac tcgcgctgca gcctggaacc 840

gccctgctct gttactcgtg caaggcccaa gtctcgaatg aggactgttt gcaagtggaa 900

aactgcaccc agctcggaga acaatgctgg actgcacgga tccgcgctgt cggcctgctg 960

accgtgatct ccaaagggtg ctcattgaac tgcgtggacg atagccagga ctactacgtg 1020

ggaaagaaga atatcacttg ttgcgacacg gatctttgca acgcgtccgg agcgcacgcc 1080

ctgcagccag cagccgccat tctggccctg cttccggccc tggggttgct gctctggggt 1140

ccgggccagc tcggatccca gaccctgaac tttgatctgc tgaaactggc aggcgatgtg 1200

gaaagcaacc caggcccaat ggctagcgct cgcagaccgc ggtggctgtg tgcaggggcg 1260

ctcgtcctgg cgggtggctt ctttttgctc ggctttcttt tcggatggtt catcaaatcg 1320

tcaaacgaag ctaccaatat caccccgaag cacaacatga aggcctttct ggatgagctg 1380

aaggctgaga acattaagaa gttcctctac aacttcaccc agatcccaca tttggcgggc 1440

actgagcaga actttcagtt ggctaagcag atccagagcc agtggaagga attcggcctg 1500

gactccgtcg agctggcgca ttacgatgtg ctgctgagct accctaataa gactcatccg 1560

aactatatct cgattatcaa tgaggacgga aacgaaatct ttaacacgtc cctcttcgag 1620

ccgccaccgc ctggatacga gaacgtgtca gatatcgtgc ctccgttctc ggccttctcg 1680

ccccagggaa tgcccgaagg ggacctggtg tacgtgaact acgcaaggac cgaggacttc 1740

ttcaagttgg agcgggatat gaagatcaat tgcagcggaa agatcgtcat cgcccgctac 1800

ggcaaagtgt tccgcggcaa caaggtgaag aatgcacagt tggcaggcgc caagggcgtc 1860

atcctctact cggatcctgc cgactacttc gctcctggcg tgaaatccta ccctgatggt 1920

tggaatctgc caggaggagg ggtgcagagg ggaaatatcc tgaacctgaa cggtgccggt 1980

gacccactta ctccgggtta cccggccaac gaatacgcgt acaggcgggg tatcgcggaa 2040

gccgtcggac tgccgtccat cccggtccat ccgattggtt actacgacgc ccagaagctc 2100

ctcgaaaaga tgggaggcag cgcccctccg gactcgtcat ggagaggctc gctgaaggtg 2160

ccatacaacg tgggacccgg attcactgga aatttcagca ctcaaaaagt gaagatgcac 2220

attcactcca ctaacgaagt caccaggatc tacaacgtca tcggaaccct ccggggagcg 2280

gtggaaccgg accgctacgt gatcctcggt ggacaccggg atagctgggt gttcggagga 2340

atcgatcctc aatcgggcgc agccgtcgtc catgaaatcg tcaggtcctt tggtactctt 2400

aagaaggagg gctggcgccc tagacgcact attctgttcg cctcgtggga tgccgaagaa 2460

tttggtctgc tcggcagcac cgaatgggct gaggaaaact cccgcctgct ccaagaacgc 2520

ggagtggcgt acatcaatgc cgactcatcc atcgaaggaa actacacgct gcgggtggac 2580

tgcactccac tgatgtactc gctcgtgcac aacctgacca aagaactcaa atccccagac 2640

gaaggattcg agggaaaatc gctgtacgag tcgtggacca agaagagccc atccccggag 2700

ttcagcggga tgccgcggat ctcaaagctc ggatcaggaa atgatttcga agtgttcttt 2760

cagaggctgg gaattgcgtc gggaagggct cggtacacga aaaactggga aactaacaag 2820

ttctcgggat acccgctgta ccactcggtg tatgaaactt acgaactggt ggagaaattc 2880

tacgatccta tgtttaagta ccacctgact gtggcccaag tgagaggcgg aatggtgttc 2940

gagttggcca attcaattgt gctgccattc gattgccgcg actacgccgt ggtgctgaga 3000

aagtacgcag acaaaatcta ctcaatcagc atgaagcacc cacaagagat gaaaacctac 3060

tcagtctcct tcgactccct cttctccgcg gtgaagaact tcaccgagat cgcgagcaaa 3120

ttctcggagc gccttcaaga ttttgacaaa tccaatccga tcgtcctccg catgatgaat 3180

gaccagctca tgtttctcga acgggccttc atcgatccac tgggacttcc ggaccggccg 3240

ttttaccgcc acgtgatcta cgcgccctcg tcgcataaca agtatgctgg agagagcttc 3300

ccgggtatct acgacgcatt gttcgacatt gagtccaagg tggatccgtc caaagcctgg 3360

ggtgaagtga agcgccaaat ctacgtggcg gcctttaccg tccaggcggc agcagaaacc 3420

ttgagcgagg tggct 3435

<210> 62

<211> 7182

<212> ДНК

<213> Искуственная последовательность

<220>

<223> Синтетическая конструкция

<400> 62

ggcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 60

agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 120

agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 180

tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 240

tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 300

ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 360

tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 420

aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcaaatgcaa ccggcgcagg 480

aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 540

aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 600

aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 660

tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 720

ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 780

ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 840

tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacaggtcg 900

acaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 960

ttggctcatg tccaatatga ccgccatgtt gacattgatt attgactagt tattaatagt 1020

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 1080

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 1140

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1200

tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 1260

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 1320

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1380

tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1440

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1500

gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1560

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1620

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 1680

gaacgcggat tccccgtgcc aagagtgact caccgtccgg atctcagcaa gcaggtatgt 1740

actctccagg gtgggcctgg cttccccagt caagactcca gggatttgag ggacgctgtg 1800

ggctcttctc ttacatgtac cttttgcttg cctcaaccct gactatcttc caggtcagga 1860

tcccagagtc aggggtctgt attttcctgc tggtggctcc agttcaggaa cagtaaaccc 1920

tgctccgaat attgcctctc acatctcgtc aatctccgcg aggactgggg accctgtgac 1980

gaacatggct agcatcgtcg gagggtggga gtgcgaaaag cactcacagc catggcaggt 2040

cctggtcgcc tcgcgcggac gcgccgtgtg tggaggtgtg ctggtccacc cgcagtgggt 2100

gttgactgcg gcccattgca tcagaaataa gtccgtgatc ctcttgggga gacattccct 2160

gtttcacccc gaagatactg gacaggtgtt ccaagtgagc cactccttcc cgcatccact 2220

gtacgacatg agcctgctga agaaccgctt tctgcggcca ggggacgact catcacacga 2280

tttgatgctg cttcggctct cggaaccggc cgagctcacc gacgcagtga aggtcatgga 2340

cctccctacg caagagcctg ctctcggtac cacttgttac gcatcgggat ggggctccat 2400

cgagccggaa gaattcctga ccccgaaaaa gctgcagtgc gtggatctgc acgtgatttc 2460

gaatgacgtg tgcgcgcaag tgcatccaca aaaggtcact aagttcatgc tgtgcgccgg 2520

aaggtggacc ggcggaaaat cgacctgttc cggcgacagc ggaggcccac tcgtgtgcaa 2580

cggtgtgctg cagggcatca ctagctgggg atcagaaccg tgcgcgcttc cggagcggcc 2640

ctcgctctac acgaaggtgg tgcactaccg caaatggatt aaagatacca tcgtcgcaaa 2700

ccctggatcc gaaggtaggg gttcattatt gacctgtgga gatgtcgaag aaaacccagg 2760

acccgctagc aaagcagtgc tgctggcgct cctgatggct ggactcgcgc tgcagcctgg 2820

aaccgccctg ctctgttact cgtgcaaggc ccaagtctcg aatgaggact gtttgcaagt 2880

ggaaaactgc acccagctcg gagaacaatg ctggactgca cggatccgcg ctgtcggcct 2940

gctgaccgtg atctccaaag ggtgctcatt gaactgcgtg gacgatagcc aggactacta 3000

cgtgggaaag aagaatatca cttgttgcga cacggatctt tgcaacgcgt ccggagcgca 3060

cgccctgcag ccagcagccg ccattctggc cctgcttccg gccctggggt tgctgctctg 3120

gggtccgggc cagctcggat cccagaccct gaactttgat ctgctgaaac tggcaggcga 3180

tgtggaaagc aacccaggcc caatggctag cgctcgcaga ccgcggtggc tgtgtgcagg 3240

ggcgctcgtc ctggcgggtg gcttcttttt gctcggcttt cttttcggat ggttcatcaa 3300

atcgtcaaac gaagctacca atatcacccc gaagcacaac atgaaggcct ttctggatga 3360

gctgaaggct gagaacatta agaagttcct ctacaacttc acccagatcc cacatttggc 3420

gggcactgag cagaactttc agttggctaa gcagatccag agccagtgga aggaattcgg 3480

cctggactcc gtcgagctgg cgcattacga tgtgctgctg agctacccta ataagactca 3540

tccgaactat atctcgatta tcaatgagga cggaaacgaa atctttaaca cgtccctctt 3600

cgagccgcca ccgcctggat acgagaacgt gtcagatatc gtgcctccgt tctcggcctt 3660

ctcgccccag ggaatgcccg aaggggacct ggtgtacgtg aactacgcaa ggaccgagga 3720

cttcttcaag ttggagcggg atatgaagat caattgcagc ggaaagatcg tcatcgcccg 3780

ctacggcaaa gtgttccgcg gcaacaaggt gaagaatgca cagttggcag gcgccaaggg 3840

cgtcatcctc tactcggatc ctgccgacta cttcgctcct ggcgtgaaat cctaccctga 3900

tggttggaat ctgccaggag gaggggtgca gaggggaaat atcctgaacc tgaacggtgc 3960

cggtgaccca cttactccgg gttacccggc caacgaatac gcgtacaggc ggggtatcgc 4020

ggaagccgtc ggactgccgt ccatcccggt ccatccgatt ggttactacg acgcccagaa 4080

gctcctcgaa aagatgggag gcagcgcccc tccggactcg tcatggagag gctcgctgaa 4140

ggtgccatac aacgtgggac ccggattcac tggaaatttc agcactcaaa aagtgaagat 4200

gcacattcac tccactaacg aagtcaccag gatctacaac gtcatcggaa ccctccgggg 4260

agcggtggaa ccggaccgct acgtgatcct cggtggacac cgggatagct gggtgttcgg 4320

aggaatcgat cctcaatcgg gcgcagccgt cgtccatgaa atcgtcaggt cctttggtac 4380

tcttaagaag gagggctggc gccctagacg cactattctg ttcgcctcgt gggatgccga 4440

agaatttggt ctgctcggca gcaccgaatg ggctgaggaa aactcccgcc tgctccaaga 4500

acgcggagtg gcgtacatca atgccgactc atccatcgaa ggaaactaca cgctgcgggt 4560

ggactgcact ccactgatgt actcgctcgt gcacaacctg accaaagaac tcaaatcccc 4620

agacgaagga ttcgagggaa aatcgctgta cgagtcgtgg accaagaaga gcccatcccc 4680

ggagttcagc gggatgccgc ggatctcaaa gctcggatca ggaaatgatt tcgaagtgtt 4740

ctttcagagg ctgggaattg cgtcgggaag ggctcggtac acgaaaaact gggaaactaa 4800

caagttctcg ggatacccgc tgtaccactc ggtgtatgaa acttacgaac tggtggagaa 4860

attctacgat cctatgttta agtaccacct gactgtggcc caagtgagag gcggaatggt 4920

gttcgagttg gccaattcaa ttgtgctgcc attcgattgc cgcgactacg ccgtggtgct 4980

gagaaagtac gcagacaaaa tctactcaat cagcatgaag cacccacaag agatgaaaac 5040

ctactcagtc tccttcgact ccctcttctc cgcggtgaag aacttcaccg agatcgcgag 5100

caaattctcg gagcgccttc aagattttga caaatccaat ccgatcgtcc tccgcatgat 5160

gaatgaccag ctcatgtttc tcgaacgggc cttcatcgat ccactgggac ttccggaccg 5220

gccgttttac cgccacgtga tctacgcgcc ctcgtcgcat aacaagtatg ctggagagag 5280

cttcccgggt atctacgacg cattgttcga cattgagtcc aaggtggatc cgtccaaagc 5340

ctggggtgaa gtgaagcgcc aaatctacgt ggcggccttt accgtccagg cggcagcaga 5400

aaccttgagc gaggtggctt aaagatctgg gccctaacaa aacaaaaaga tggggttatt 5460

ccctaaactt catgggttac gtaattggaa gttgggggac attgccacaa gatcatattg 5520

tacaaaagat caaacactgt tttagaaaac ttcctgtaaa caggcctatt gattggaaag 5580

tatgtcaaag gattgtgggt cttttgggct ttgctgctcc atttacacaa tgtggatatc 5640

ctgccttaat gcctttgtat gcatgtatac aagctaaaca ggctttcact ttctcgccaa 5700

cttacaaggc ctttctaagt aaacagtaca tgaaccttta ccccgttgct cggcaacggc 5760

ctggtctgtg ccaagtgttt gctgacgcaa cccccactgg ctggggcttg gccataggcc 5820

atcagcgcat gcgtggaacc tttgtggctc ctctgccgat ccatactgcg gaactcctag 5880

ccgcttgttt tgctcgcagc cggtctggag caaagctcat aggaactgac aattctgtcg 5940

tcctctcgcg gaaatataca tcgtttcgat ctacgtatga tctttttccc tctgccaaaa 6000

attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 6060

ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcggaagg aattctgcat 6120

taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 6180

tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 6240

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 6300

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 6360

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 6420

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 6480

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 6540

tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 6600

tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 6660

gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 6720

agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 6780

tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 6840

agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 6900

tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 6960

acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 7020

tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 7080

agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 7140

tcagcgatct gtctatttcg ttcatccata gttgcctgac tc 7182

<210> 63

<211> 34803

<212> ДНК

<213> Искуственная последовательность

<220>

<223> Синтетическая конструкция

<400> 63

ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60

aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120

gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180

tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240

aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300

gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360

gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420

tttccgcgta cggtgtcaaa gtccggtgtt tttactactg taatagtaat caattacggg 480

gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 540

gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 600

agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 660

ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 720

cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 780

gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 840

caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 900

caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 960

cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1020

tgtccctatc agtgatagag atctccctat cagtgataga gagtttagtg aaccgtcaga 1080

tccgctaggg taccaacatg gctagcatcg tcggagggtg ggagtgcgaa aagcactcac 1140

agccatggca ggtcctggtc gcctcgcgcg gacgcgccgt gtgtggaggt gtgctggtcc 1200

acccgcagtg ggtgttgact gcggcccatt gcatcagaaa taagtccgtg atcctcttgg 1260

ggagacattc cctgtttcac cccgaagata ctggacaggt gttccaagtg agccactcct 1320

tcccgcatcc actgtacgac atgagcctgc tgaagaaccg ctttctgcgg ccaggggacg 1380

actcatcaca cgatttgatg ctgcttcggc tctcggaacc ggccgagctc accgacgcag 1440

tgaaggtcat ggacctccct acgcaagagc ctgctctcgg taccacttgt tacgcatcgg 1500

gatggggctc catcgagccg gaagaattcc tgaccccgaa aaagctgcag tgcgtggatc 1560

tgcacgtgat ttcgaatgac gtgtgcgcgc aagtgcatcc acaaaaggtc actaagttca 1620

tgctgtgcgc cggaaggtgg accggcggaa aatcgacctg ttccggcgac agcggaggcc 1680

cactcgtgtg caacggtgtg ctgcagggca tcactagctg gggatcagaa ccgtgcgcgc 1740

ttccggagcg gccctcgctc tacacgaagg tggtgcacta ccgcaaatgg attaaagata 1800

ccatcgtcgc aaaccctgga tccgaaggta ggggttcatt attgacctgt ggagatgtcg 1860

aagaaaaccc aggacccgct agcaaagcag tgctgctggc gctcctgatg gctggactcg 1920

cgctgcagcc tggaaccgcc ctgctctgtt actcgtgcaa ggcccaagtc tcgaatgagg 1980

actgtttgca agtggaaaac tgcacccagc tcggagaaca atgctggact gcacggatcc 2040

gcgctgtcgg cctgctgacc gtgatctcca aagggtgctc attgaactgc gtggacgata 2100

gccaggacta ctacgtggga aagaagaata tcacttgttg cgacacggat ctttgcaacg 2160

cgtccggagc gcacgccctg cagccagcag ccgccattct ggccctgctt ccggccctgg 2220

ggttgctgct ctggggtccg ggccagctcg gatcccagac cctgaacttt gatctgctga 2280

aactggcagg cgatgtggaa agcaacccag gcccaatggc tagcgctcgc agaccgcggt 2340

ggctgtgtgc aggggcgctc gtcctggcgg gtggcttctt tttgctcggc tttcttttcg 2400

gatggttcat caaatcgtca aacgaagcta ccaatatcac cccgaagcac aacatgaagg 2460

cctttctgga tgagctgaag gctgagaaca ttaagaagtt cctctacaac ttcacccaga 2520

tcccacattt ggcgggcact gagcagaact ttcagttggc taagcagatc cagagccagt 2580

ggaaggaatt cggcctggac tccgtcgagc tggcgcatta cgatgtgctg ctgagctacc 2640

ctaataagac tcatccgaac tatatctcga ttatcaatga ggacggaaac gaaatcttta 2700

acacgtccct cttcgagccg ccaccgcctg gatacgagaa cgtgtcagat atcgtgcctc 2760

cgttctcggc cttctcgccc cagggaatgc ccgaagggga cctggtgtac gtgaactacg 2820

caaggaccga ggacttcttc aagttggagc gggatatgaa gatcaattgc agcggaaaga 2880

tcgtcatcgc ccgctacggc aaagtgttcc gcggcaacaa ggtgaagaat gcacagttgg 2940

caggcgccaa gggcgtcatc ctctactcgg atcctgccga ctacttcgct cctggcgtga 3000

aatcctaccc tgatggttgg aatctgccag gaggaggggt gcagagggga aatatcctga 3060

acctgaacgg tgccggtgac ccacttactc cgggttaccc ggccaacgaa tacgcgtaca 3120

ggcggggtat cgcggaagcc gtcggactgc cgtccatccc ggtccatccg attggttact 3180

acgacgccca gaagctcctc gaaaagatgg gaggcagcgc ccctccggac tcgtcatgga 3240

gaggctcgct gaaggtgcca tacaacgtgg gacccggatt cactggaaat ttcagcactc 3300

aaaaagtgaa gatgcacatt cactccacta acgaagtcac caggatctac aacgtcatcg 3360

gaaccctccg gggagcggtg gaaccggacc gctacgtgat cctcggtgga caccgggata 3420

gctgggtgtt cggaggaatc gatcctcaat cgggcgcagc cgtcgtccat gaaatcgtca 3480

ggtcctttgg tactcttaag aaggagggct ggcgccctag acgcactatt ctgttcgcct 3540

cgtgggatgc cgaagaattt ggtctgctcg gcagcaccga atgggctgag gaaaactccc 3600

gcctgctcca agaacgcgga gtggcgtaca tcaatgccga ctcatccatc gaaggaaact 3660

acacgctgcg ggtggactgc actccactga tgtactcgct cgtgcacaac ctgaccaaag 3720

aactcaaatc cccagacgaa ggattcgagg gaaaatcgct gtacgagtcg tggaccaaga 3780

agagcccatc cccggagttc agcgggatgc cgcggatctc aaagctcgga tcaggaaatg 3840

atttcgaagt gttctttcag aggctgggaa ttgcgtcggg aagggctcgg tacacgaaaa 3900

actgggaaac taacaagttc tcgggatacc cgctgtacca ctcggtgtat gaaacttacg 3960

aactggtgga gaaattctac gatcctatgt ttaagtacca cctgactgtg gcccaagtga 4020

gaggcggaat ggtgttcgag ttggccaatt caattgtgct gccattcgat tgccgcgact 4080

acgccgtggt gctgagaaag tacgcagaca aaatctactc aatcagcatg aagcacccac 4140

aagagatgaa aacctactca gtctccttcg actccctctt ctccgcggtg aagaacttca 4200

ccgagatcgc gagcaaattc tcggagcgcc ttcaagattt tgacaaatcc aatccgatcg 4260

tcctccgcat gatgaatgac cagctcatgt ttctcgaacg ggccttcatc gatccactgg 4320

gacttccgga ccggccgttt taccgccacg tgatctacgc gccctcgtcg cataacaagt 4380

atgctggaga gagcttcccg ggtatctacg acgcattgtt cgacattgag tccaaggtgg 4440

atccgtccaa agcctggggt gaagtgaagc gccaaatcta cgtggcggcc tttaccgtcc 4500

aggcggcagc agaaaccttg agcgaggtgg cttgactcga gcctaagctt ctagataaga 4560

tatccgatcc accggatcta gataactgat cataatcagc cataccacat ttgtagaggt 4620

tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 4680

aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 4740

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 4800

catcaatgta tcttatatgc tggccaccgt acatgtggct tcccatgctc gcaagccctg 4860

gcccgagttc gagcacaatg tcatgaccag gtgcaatatg catctggggt cccgccgagg 4920

catgttcatg ccctaccagt gcaacctgaa ttatgtgaag gtgctgctgg agcccgatgc 4980

catgtccaga gtgagcctga cgggggtgtt tgacatgaat gtggaggtgt ggaagattct 5040

gagatatgat gaatccaaga ccaggtgccg agcctgcgag tgcggaggga agcatgccag 5100

gttccagccc gtgtgtgtgg atgtgacgga ggacctgcga cccgatcatt tggtgttgcc 5160

ctgcaccggg acggagttcg gttccagcgg ggaagaatct gactagagtg agtagtgttc 5220

tggggcgggg gaggacctgc atgagggcca gaataactga aatctgtgct tttctgtgtg 5280

ttgcagcagc atgagcggaa gcggctcctt tgagggaggg gtattcagcc cttatctgac 5340

ggggcgtctc ccctcctggg cgggagtgcg tcagaatgtg atgggatcca cggtggacgg 5400

ccggcccgtg cagcccgcga actcttcaac cctgacctat gcaaccctga gctcttcgtc 5460

gttggacgca gctgccgccg cagctgctgc atctgccgcc agcgccgtgc gcggaatggc 5520

catgggcgcc ggctactacg gcactctggt ggccaactcg agttccacca ataatcccgc 5580

cagcctgaac gaggagaagc tgttgctgct gatggcccag ctcgaggcct tgacccagcg 5640

cctgggcgag ctgacccagc aggtggctca gctgcaggag cagacgcggg ccgcggttgc 5700

cacggtgaaa tccaaataaa aaatgaatca ataaataaac ggagacggtt gttgatttta 5760

acacagagtc tgaatcttta tttgattttt cgcgcgcggt aggccctgga ccaccggtct 5820

cgatcattga gcacccggtg gatcttttcc aggacccggt agaggtgggc ttggatgttg 5880

aggtacatgg gcatgagccc gtcccggggg tggaggtagc tccattgcag ggcctcgtgc 5940

tcgggggtgg tgttgtaaat cacccagtca tagcaggggc gcagggcatg gtgttgcaca 6000

atatctttga ggaggagact gatggccacg ggcagccctt tggtgtaggt gtttacaaat 6060

ctgttgagct gggagggatg catgcggggg gagatgaggt gcatcttggc ctggatcttg 6120

agattggcga tgttaccgcc cagatcccgc ctggggttca tgttgtgcag gaccaccagc 6180

acggtgtatc cggtgcactt ggggaattta tcatgcaact tggaagggaa ggcgtgaaag 6240

aatttggcga cgcctttgtg cccgcccagg ttttccatgc actcatccat gatgatggcg 6300

atgggcccgt gggcggcggc ctgggcaaag acgtttcggg ggtcggacac atcatagttg 6360

tggtcctggg tgaggtcatc ataggccatt ttaatgaatt tggggcggag ggtgccggac 6420

tgggggacaa aggtaccctc gatcccgggg gcgtagttcc cctcacagat ctgcatctcc 6480

caggctttga gctcggaggg ggggatcatg tccacctgcg gggcgataaa gaacacggtt 6540

tccggggcgg gggagatgag ctgggccgaa agcaagttcc ggagcagctg ggacttgccg 6600

cagccggtgg ggccgtagat gaccccgatg accggctgca ggtggtagtt gagggagaga 6660

cagctgccgt cctcccggag gaggggggcc acctcgttca tcatctcgcg cacgtgcatg 6720

ttctcgcgca ccagttccgc caggaggcgc tctcccccca gggataggag ctcctggagc 6780

gaggcgaagt ttttcagcgg cttgagtccg tcggccatgg gcattttgga gagggtttgt 6840

tgcaagagtt ccaggcggtc ccagagctcg gtgatgtgct ctacggcatc tcgatccagc 6900

agacctcctc gtttcgcggg ttgggacggc tgcgggagta gggcaccaga cgatgggcgt 6960

ccagcgcagc cagggtccgg tccttccagg gtcgcagcgt ccgcgtcagg gtggtctccg 7020

tcacggtgaa ggggtgcgcg ccgggctggg cgcttgcgag ggtgcgcttc aggctcatcc 7080

ggctggtcga aaaccgctcc cgatcggcgc cctgcgcgtc ggccaggtag caattgacca 7140

tgagttcgta gttgagcgcc tcggccgcgt ggcctttggc gcggagctta cctttggaag 7200

tctgcccgca ggcgggacag aggagggact tgagggcgta gagcttgggg gcgaggaaga 7260

cggactcggg ggcgtaggcg tccgcgccgc agtgggcgca gacggtctcg cactccacga 7320

gccaggtgag gtcgggctgg tcggggtcaa aaaccagttt cccgccgttc tttttgatgc 7380

gtttcttacc tttggtctcc atgagctcgt gtccccgctg ggtgacaaag aggctgtccg 7440

tgtccccgta gaccgacttt atgggccggt cctcgagcgg tgtgccgcgg tcctcctcgt 7500

agaggaaccc cgcccactcc gagacgaaag cccgggtcca ggccagcacg aaggaggcca 7560

cgtgggacgg gtagcggtcg ttgtccacca gcgggtccac cttttccagg gtatgcaaac 7620

acatgtcccc ctcgtccaca tccaggaagg tgattggctt gtaagtgtag gccacgtgac 7680

cgggggtccc ggccgggggg gtataaaagg gtgcgggtcc ctgctcgtcc tcactgtctt 7740

ccggatcgct gtccaggagc gccagctgtt ggggtaggta ttccctctcg aaggcgggca 7800

tgacctcggc actcaggttg tcagtttcta gaaacgagga ggatttgata ttgacggtgc 7860

cggcggagat gcctttcaag agcccctcgt ccatctggtc agaaaagacg atctttttgt 7920

tgtcgagctt ggtggcgaag gagccgtaga gggcgttgga gaggagcttg gcgatggagc 7980

gcatggtctg gtttttttcc ttgtcggcgc gctccttggc ggcgatgttg agctgcacgt 8040

actcgcgcgc cacgcacttc cattcgggga agacggtggt cagctcgtcg ggcacgattc 8100

tgacctgcca gccccgatta tgcagggtga tgaggtccac actggtggcc acctcgccgc 8160

gcaggggctc attagtccag cagaggcgtc cgcccttgcg cgagcagaag gggggcaggg 8220

ggtccagcat gacctcgtcg ggggggtcgg catcgatggt gaagatgccg ggcaggaggt 8280

cggggtcaaa gtagctgatg gaagtggcca gatcgtccag ggcagcttgc cattcgcgca 8340

cggccagcgc gcgctcgtag ggactgaggg gcgtgcccca gggcatggga tgggtaagcg 8400

cggaggcgta catgccgcag atgtcgtaga cgtagagggg ctcctcgagg atgccgatgt 8460

aggtggggta gcagcgcccc ccgcggatgc tggcgcgcac gtagtcatac agctcgtgcg 8520

agggggcgag gagccccggg cccaggttgg tgcgactggg cttttcggcg cggtagacga 8580

tctggcggaa aatggcatgc gagttggagg agatggtggg cctttggaag atgttgaagt 8640

gggcgtgggg cagtccgacc gagtcgcgga tgaagtgggc gtaggagtct tgcagcttgg 8700

cgacgagctc ggcggtgact aggacgtcca gagcgcagta gtcgagggtc tcctggatga 8760

tgtcatactt gagctgtccc ttttgtttcc acagctcgcg gttgagaagg aactcttcgc 8820

ggtccttcca gtactcttcg agggggaacc cgtcctgatc tgcacggtaa gagcctagca 8880

tgtagaactg gttgacggcc ttgtaggcgc agcagccctt ctccacgggg agggcgtagg 8940

cctgggcggc cttgcgcagg gaggtgtgcg tgagggcgaa agtgtccctg accatgacct 9000

tgaggaactg gtgcttgaag tcgatatcgt cgcagccccc ctgctcccag agctggaagt 9060

ccgtgcgctt cttgtaggcg gggttgggca aagcgaaagt aacatcgttg aagaggatct 9120

tgcccgcgcg gggcataaag ttgcgagtga tgcggaaagg ttggggcacc tcggcccggt 9180

tgttgatgac ctgggcggcg agcacgatct cgtcgaagcc gttgatgttg tggcccacga 9240

tgtagagttc cacgaatcgc ggacggccct tgacgtgggg cagtttcttg agctcctcgt 9300

aggtgagctc gtcggggtcg ctgagcccgt gctgctcgag cgcccagtcg gcgagatggg 9360

ggttggcgcg gaggaaggaa gtccagagat ccacggccag ggcggtttgc agacggtccc 9420

ggtactgacg gaactgctgc ccgacggcca ttttttcggg ggtgacgcag tagaaggtgc 9480

gggggtcccc gtgccagcga tcccatttga gctggagggc gagatcgagg gcgagctcga 9540

cgagccggtc gtccccggag agtttcatga ccagcatgaa ggggacgagc tgcttgccga 9600

aggaccccat ccaggtgtag gtttccacat cgtaggtgag gaagagcctt tcggtgcgag 9660

gatgcgagcc gatggggaag aactggatct cctgccacca attggaggaa tggctgttga 9720

tgtgatggaa gtagaaatgc cgacggcgcg ccgaacactc gtgcttgtgt ttatacaagc 9780

ggccacagtg ctcgcaacgc tgcacgggat gcacgtgctg cacgagctgt acctgagttc 9840

ctttgacgag gaatttcagt gggaagtgga gtcgtggcgc ctgcatctcg tgctgtacta 9900

cgtcgtggtg gtcggcctgg ccctcttctg cctcgatggt ggtcatgctg acgagcccgc 9960

gcgggaggca ggtccagacc tcggcgcgag cgggtcggag agcgaggacg agggcgcgca 10020

ggccggagct gtccagggtc ctgagacgct gcggagtcag gtcagtgggc agcggcggcg 10080

cgcggttgac ttgcaggagt ttttccaggg cgcgcgggag gtccagatgg tacttgatct 10140

ccaccgcgcc attggtggcg acgtcgatgg cttgcagggt cccgtgcccc tggggtgtga 10200

ccaccgtccc ccgtttcttc ttgggcggct ggggcgacgg gggcggtgcc tcttccatgg 10260

ttagaagcgg cggcgaggac gcgcgccggg cggcaggggc ggctcggggc ccggaggcag 10320

gggcggcagg ggcacgtcgg cgccgcgcgc gggtaggttc tggtactgcg cccggagaag 10380

actggcgtga gcgacgacgc gacggttgac gtcctggatc tgacgcctct gggtgaaggc 10440

cacgggaccc gtgagtttga acctgaaaga gagttcgaca gaatcaatct cggtatcgtt 10500

gacggcggcc tgccgcagga tctcttgcac gtcgcccgag ttgtcctggt aggcgatctc 10560

ggtcatgaac tgctcgatct cctcctcttg aaggtctccg cggccggcgc gctccacggt 10620

ggccgcgagg tcgttggaga tgcggcccat gagctgcgag aaggcgttca tgcccgcctc 10680

gttccagacg cggctgtaga ccacgacgcc ctcgggatcg cgggcgcgca tgaccacctg 10740

ggcgaggttg agctccacgt ggcgcgtgaa gaccgcgtag ttgcagaggc gctggtagag 10800

gtagttgagc gtggtggcga tgtgctcggt gacgaagaaa tacatgatcc agcggcggag 10860

cggcatctcg ctgacgtcgc ccagcgcctc caaacgttcc atggcctcgt aaaagtccac 10920

ggcgaagttg aaaaactggg agttgcgcgc cgagacggtc aactcctcct ccagaagacg 10980

gatgagctcg gcgatggtgg cgcgcacctc gcgctcgaag gcccccggga gttcctccac 11040

ttcctcttct tcctcctcca ctaacatctc ttctacttcc tcctcaggcg gcagtggtgg 11100

cgggggaggg ggcctgcgtc gccggcggcg cacgggcaga cggtcgatga agcgctcgat 11160

ggtctcgccg cgccggcgtc gcatggtctc ggtgacggcg cgcccgtcct cgcggggccg 11220

cagcgtgaag acgccgccgc gcatctccag gtggccgggg gggtccccgt tgggcaggga 11280

gagggcgctg acgatgcatc ttatcaattg ccccgtaggg actccgcgca aggacctgag 11340

cgtctcgaga tccacgggat ctgaaaaccg ctgaacgaag gcttcgagcc agtcgcagtc 11400

gcaaggtagg ctgagcacgg tttcttctgg cgggtcatgt tggttgggag cggggcgggc 11460

gatgctgctg gtgatgaagt tgaaataggc ggttctgaga cggcggatgg tggcgaggag 11520

caccaggtct ttgggcccgg cttgctggat gcgcagacgg tcggccatgc cccaggcgtg 11580

gtcctgacac ctggccaggt ccttgtagta gtcctgcatg agccgctcca cgggcacctc 11640

ctcctcgccc gcgcggccgt gcatgcgcgt gagcccgaag ccgcgctggg gctggacgag 11700

cgccaggtcg gcgacgacgc gctcggcgag gatggcttgc tggatctggg tgagggtggt 11760

ctggaagtca tcaaagtcga cgaagcggtg gtaggctccg gtgttgatgg tgtaggagca 11820

gttggccatg acggaccagt tgacggtctg gtggcccgga cgcacgagct cgtggtactt 11880

gaggcgcgag taggcgcgcg tgtcgaagat gtagtcgttg caggtgcgca ccaggtactg 11940

gtagccgatg aggaagtgcg gcggcggctg gcggtagagc ggccatcgct cggtggcggg 12000

ggcgccgggc gcgaggtcct cgagcatggt gcggtggtag ccgtagatgt acctggacat 12060

ccaggtgatg ccggcggcgg tggtggaggc gcgcgggaac tcgcggacgc ggttccagat 12120

gttgcgcagc ggcaggaagt agttcatggt gggcacggtc tggcccgtga ggcgcgcgca 12180

gtcgtggatg ctctatacgg gcaaaaacga aagcggtcag cggctcgact ccgtggcctg 12240

gaggctaagc gaacgggttg ggctgcgcgt gtaccccggt tcgaatctcg aatcaggctg 12300

gagccgcagc taacgtggta ttggcactcc cgtctcgacc caagcctgca ccaaccctcc 12360

aggatacgga ggcgggtcgt tttgcaactt ttttttggag gccggatgag actagtaagc 12420

gcggaaagcg gccgaccgcg atggctcgct gccgtagtct ggagaagaat cgccagggtt 12480

gcgttgcggt gtgccccggt tcgaggccgg ccggattccg cggctaacga gggcgtggct 12540

gccccgtcgt ttccaagacc ccatagccag ccgacttctc cagttacgga gcgagcccct 12600

cttttgtttt gtttgttttt gccagatgca tcccgtactg cggcagatgc gcccccacca 12660

ccctccaccg caacaacagc cccctccaca gccggcgctt ctgcccccgc cccagcagca 12720

acttccagcc acgaccgccg cggccgccgt gagcggggct ggacagagtt atgatcacca 12780

gctggccttg gaagagggcg aggggctggc gcgcctgggg gcgtcgtcgc cggagcggca 12840

cccgcgcgtg cagatgaaaa gggacgctcg cgaggcctac gtgcccaagc agaacctgtt 12900

cagagacagg agcggcgagg agcccgagga gatgcgcgcg gcccggttcc acgcggggcg 12960

ggagctgcgg cgcggcctgg accgaaagag ggtgctgagg gacgaggatt tcgaggcgga 13020

cgagctgacg gggatcagcc ccgcgcgcgc gcacgtggcc gcggccaacc tggtcacggc 13080

gtacgagcag accgtgaagg aggagagcaa cttccaaaaa tccttcaaca accacgtgcg 13140

caccctgatc gcgcgcgagg aggtgaccct gggcctgatg cacctgtggg acctgctgga 13200

ggccatcgtg cagaacccca ccagcaagcc gctgacggcg cagctgttcc tggtggtgca 13260

gcatagtcgg gacaacgaag cgttcaggga ggcgctgctg aatatcaccg agcccgaggg 13320

ccgctggctc ctggacctgg tgaacattct gcagagcatc gtggtgcagg agcgcgggct 13380

gccgctgtcc gagaagctgg cggccatcaa cttctcggtg ctgagtttgg gcaagtacta 13440

cgctaggaag atctacaaga ccccgtacgt gcccatagac aaggaggtga agatcgacgg 13500

gttttacatg cgcatgaccc tgaaagtgct gaccctgagc gacgatctgg gggtgtaccg 13560

caacgacagg atgcaccgtg cggtgagcgc cagcaggcgg cgcgagctga gcgaccagga 13620

gctgatgcat agtctgcagc gggccctgac cggggccggg accgaggggg agagctactt 13680

tgacatgggc gcggacctgc actggcagcc cagccgccgg gccttggagg cggcggcagg 13740

accctacgta gaagaggtgg acgatgaggt ggacgaggag ggcgagtacc tggaagactg 13800

atggcgcgac cgtatttttg ctagatgcaa caacaacagc cacctcctga tcccgcgatg 13860

cgggcggcgc tgcagagcca gccgtccggc attaactcct cggacgattg gacccaggcc 13920

atgcaacgca tcatggcgct gacgacccgc aaccccgaag cctttagaca gcagccccag 13980

gccaaccggc tctcggccat cctggaggcc gtggtgccct cgcgctccaa ccccacgcac 14040

gagaaggtcc tggccatcgt gaacgcgctg gtggagaaca aggccatccg cggcgacgag 14100

gccggcctgg tgtacaacgc gctgctggag cgcgtggccc gctacaacag caccaacgtg 14160

cagaccaacc tggaccgcat ggtgaccgac gtgcgcgagg ccgtggccca gcgcgagcgg 14220

ttccaccgcg agtccaacct gggatccatg gtggcgctga acgccttcct cagcacccag 14280

cccgccaacg tgccccgggg ccaggaggac tacaccaact tcatcagcgc cctgcgcctg 14340

atggtgaccg aggtgcccca gagcgaggtg taccagtccg ggccggacta cttcttccag 14400

accagtcgcc agggcttgca gaccgtgaac ctgagccagg ctttcaagaa cttgcagggc 14460

ctgtggggcg tgcaggcccc ggtcggggac cgcgcgacgg tgtcgagcct gctgacgccg 14520

aactcgcgcc tgctgctgct gctggtggcc cccttcacgg acagcggcag catcaaccgc 14580

aactcgtacc tgggctacct gattaacctg taccgcgagg ccatcggcca ggcgcacgtg 14640

gacgagcaga cctaccagga gatcacccac gtgagccgcg ccctgggcca ggacgacccg 14700

ggcaacctgg aagccaccct gaactttttg ctgaccaacc ggtcgcagaa gatcccgccc 14760

cagtacgcgc tcagcaccga ggaggagcgc atcctgcgtt acgtgcagca gagcgtgggc 14820

ctgttcctga tgcaggaggg ggccaccccc agcgccgcgc tcgacatgac cgcgcgcaac 14880

atggagccca gcatgtacgc cagcaaccgc ccgttcatca ataaactgat ggactacttg 14940

catcgggcgg ccgccatgaa ctctgactat ttcaccaacg ccatcctgaa tccccactgg 15000

ctcccgccgc cggggttcta cacgggcgag tacgacatgc ccgaccccaa tgacgggttc 15060

ctgtgggacg atgtggacag cagcgtgttc tccccccgac cgggtgctaa cgagcgcccc 15120

ttgtggaaga aggaaggcag cgaccgacgc ccgtcctcgg cgctgtccgg ccgcgagggt 15180

gctgccgcgg cggtgcccga ggccgccagt cctttcccga gcttgccctt ctcgctgaac 15240

agtatccgca gcagcgagct gggcaggatc acgcgcccgc gcttgctggg cgaagaggag 15300

tacttgaatg actcgctgtt gagacccgag cgggagaaga acttccccaa taacgggata 15360

gaaagcctgg tggacaagat gagccgctgg aagacgtatg cgcaggagca cagggacgat 15420

ccccgggcgt cgcagggggc cacgagccgg ggcagcgccg cccgtaaacg ccggtggcac 15480

gacaggcagc ggggacagat gtgggacgat gaggactccg ccgacgacag cagcgtgttg 15540

gacttgggtg ggagtggtaa cccgttcgct cacctgcgcc cccgtatcgg gcgcatgatg 15600

taagagaaac cgaaaataaa tgatactcac caaggccatg gcgaccagcg tgcgttcgtt 15660

tcttctctgt tgttgttgta tctagtatga tgaggcgtgc gtacccggag ggtcctcctc 15720

cctcgtacga gagcgtgatg cagcaggcga tggcggcggc ggcgatgcag cccccgctgg 15780

aggctcctta cgtgcccccg cggtacctgg cgcctacgga ggggcggaac agcattcgtt 15840

actcggagct ggcacccttg tacgatacca cccggttgta cctggtggac aacaagtcgg 15900

cggacatcgc ctcgctgaac taccagaacg accacagcaa cttcctgacc accgtggtgc 15960

agaacaatga cttcaccccc acggaggcca gcacccagac catcaacttt gacgagcgct 16020

cgcggtgggg cggccagctg aaaaccatca tgcacaccaa catgcccaac gtgaacgagt 16080

tcatgtacag caacaagttc aaggcgcggg tgatggtctc ccgcaagacc cccaatgggg 16140

tgacagtgac agaggattat gatggtagtc aggatgagct gaagtatgaa tgggtggaat 16200

ttgagctgcc cgaaggcaac ttctcggtga ccatgaccat cgacctgatg aacaacgcca 16260

tcatcgacaa ttacttggcg gtggggcggc agaacggggt gctggagagc gacatcggcg 16320

tgaagttcga cactaggaac ttcaggctgg gctgggaccc cgtgaccgag ctggtcatgc 16380

ccggggtgta caccaacgag gctttccatc ccgatattgt cttgctgccc ggctgcgggg 16440

tggacttcac cgagagccgc ctcagcaacc tgctgggcat tcgcaagagg cagcccttcc 16500

aggaaggctt ccagatcatg tacgaggatc tggagggggg caacatcccc gcgctcctgg 16560

atgtcgacgc ctatgagaaa agcaaggagg atgcagcagc tgaagcaact gcagccgtag 16620

ctaccgcctc taccgaggtc aggggcgata attttgcaag cgccgcagca gtggcagcgg 16680

ccgaggcggc tgaaaccgaa agtaagatag tcattcagcc ggtggagaag gatagcaaga 16740

acaggagcta caacgtacta ccggacaaga taaacaccgc ctaccgcagc tggtacctag 16800

cctacaacta tggcgacccc gagaagggcg tgcgctcctg gacgctgctc accacctcgg 16860

acgtcacctg cggcgtggag caagtctact ggtcgctgcc cgacatgatg caagacccgg 16920

tcaccttccg ctccacgcgt caagttagca actacccggt ggtgggcgcc gagctcctgc 16980

ccgtctactc caagagcttc ttcaacgagc aggccgtcta ctcgcagcag ctgcgcgcct 17040

tcacctcgct tacgcacgtc ttcaaccgct tccccgagaa ccagatcctc gtccgcccgc 17100

ccgcgcccac cattaccacc gtcagtgaaa acgttcctgc tctcacagat cacgggaccc 17160

tgccgctgcg cagcagtatc cggggagtcc agcgcgtgac cgttactgac gccagacgcc 17220

gcacctgccc ctacgtctac aaggccctgg gcatagtcgc gccgcgcgtc ctctcgagcc 17280

gcaccttcta aatgtccatt ctcatctcgc ccagtaataa caccggttgg ggcctgcgcg 17340

cgcccagcaa gatgtacgga ggcgctcgcc aacgctccac gcaacacccc gtgcgcgtgc 17400

gcgggcactt ccgcgctccc tggggcgccc tcaagggccg cgtgcggtcg cgcaccaccg 17460

tcgacgacgt gatcgaccag gtggtggccg acgcgcgcaa ctacaccccc gccgccgcgc 17520

ccgtctccac cgtggacgcc gtcatcgaca gcgtggtggc cgacgcgcgc cggtacgccc 17580

gcgccaagag ccggcggcgg cgcatcgccc ggcggcaccg gagcaccccc gccatgcgcg 17640

cggcgcgagc cttgctgcgc agggccaggc gcacgggacg cagggccatg ctcagggcgg 17700

ccagacgcgc ggcttcaggc gccagcgccg gcaggacccg gagacgcgcg gccacggcgg 17760

cggcagcggc catcgccagc atgtcccgcc cgcggcgagg gaacgtgtac tgggtgcgcg 17820

acgccgccac cggtgtgcgc gtgcccgtgc gcacccgccc ccctcgcact tgaagatgtt 17880

cacttcgcga tgttgatgtg tcccagcggc gaggaggatg tccaagcgca aattcaagga 17940

agagatgctc caggtcatcg cgcctgagat ctacggccct gcggtggtga aggaggaaag 18000

aaagccccgc aaaatcaagc gggtcaaaaa ggacaaaaag gaagaagaaa gtgatgtgga 18060

cggattggtg gagtttgtgc gcgagttcgc cccccggcgg cgcgtgcagt ggcgcgggcg 18120

gaaggtgcaa ccggtgctga gacccggcac caccgtggtc ttcacgcccg gcgagcgctc 18180

cggcaccgct tccaagcgct cctacgacga ggtgtacggg gatgatgata ttctggagca 18240

ggcggccgag cgcctgggcg agtttgctta cggcaagcgc agccgttccg caccgaagga 18300

agaggcggtg tccatcccgc tggaccacgg caaccccacg ccgagcctca agcccgtgac 18360

cttgcagcag gtgctgccga ccgcggcgcc gcgccggggg ttcaagcgcg agggcgagga 18420

tctgtacccc accatgcagc tgatggtgcc caagcgccag aagctggaag acgtgctgga 18480

gaccatgaag gtggacccgg acgtgcagcc cgaggtcaag gtgcggccca tcaagcaggt 18540

ggccccgggc ctgggcgtgc agaccgtgga catcaagatt cccacggagc ccatggaaac 18600

gcagaccgag cccatgatca agcccagcac cagcaccatg gaggtgcaga cggatccctg 18660

gatgccatcg gctcctagtc gaagaccccg gcgcaagtac ggcgcggcca gcctgctgat 18720

gcccaactac gcgctgcatc cttccatcat ccccacgccg ggctaccgcg gcacgcgctt 18780

ctaccgcggt cataccagca gccgccgccg caagaccacc actcgccgcc gccgtcgccg 18840

caccgccgct gcaaccaccc ctgccgccct ggtgcggaga gtgtaccgcc gcggccgcgc 18900

acctctgacc ctgccgcgcg cgcgctacca cccgagcatc gccatttaaa ctttcgcctg 18960

ctttgcagat caatggccct cacatgccgc cttcgcgttc ccattacggg ctaccgagga 19020

agaaaaccgc gccgtagaag gctggcgggg aacgggatgc gtcgccacca ccaccggcgg 19080

cggcgcgcca tcagcaagcg gttgggggga ggcttcctgc ccgcgctgat ccccatcatc 19140

gccgcggcga tcggggcgat ccccggcatt gcttccgtgg cggtgcaggc ctctcagcgc 19200

cactgagaca cacttggaaa catcttgtaa taaaccaatg gactctgacg ctcctggtcc 19260

tgtgatgtgt tttcgtagac agatggaaga catcaatttt tcgtccctgg ctccgcgaca 19320

cggcacgcgg ccgttcatgg gcacctggag cgacatcggc accagccaac tgaacggggg 19380

cgccttcaat tggagcagtc tctggagcgg gcttaagaat ttcgggtcca cgcttaaaac 19440

ctatggcagc aaggcgtgga acagcaccac agggcaggcg ctgagggata agctgaaaga 19500

gcagaacttc cagcagaagg tggtcgatgg gctcgcctcg ggcatcaacg gggtggtgga 19560

cctggccaac caggccgtgc agcggcagat caacagccgc ctggacccgg tgccgcccgc 19620

cggctccgtg gagatgccgc aggtggagga ggagctgcct cccctggaca agcggggcga 19680

gaagcgaccc cgccccgatg cggaggagac gctgctgacg cacacggacg agccgccccc 19740

gtacgaggag gcggtgaaac tgggtctgcc caccacgcgg cccatcgcgc ccctggccac 19800

cggggtgctg aaacccgaaa agcccgcgac cctggacttg cctcctcccc agccttcccg 19860

cccctctaca gtggctaagc ccctgccgcc ggtggccgtg gcccgcgcgc gacccggggg 19920

caccgcccgc cctcatgcga actggcagag cactctgaac agcatcgtgg gtctgggagt 19980

gcagagtgtg aagcgccgcc gctgctatta aacctaccgt agcgcttaac ttgcttgtct 20040

gtgtgtgtat gtattatgtc gccgccgccg ctgtccacca gaaggaggag tgaagaggcg 20100

cgtcgccgag ttgcaagatg gccaccccat cgatgctgcc ccagtgggcg tacatgcaca 20160

tcgccggaca ggacgcttcg gagtacctga gtccgggtct ggtgcagttt gcccgcgcca 20220

cagacaccta cttcagtctg gggaacaagt ttaggaaccc cacggtggcg cccacgcacg 20280

atgtgaccac cgaccgcagc cagcggctga cgctgcgctt cgtgcccgtg gaccgcgagg 20340

acaacaccta ctcgtacaaa gtgcgctaca cgctggccgt gggcgacaac cgcgtgctgg 20400

acatggccag cacctacttt gacatccgcg gcgtgctgga tcggggccct agcttcaaac 20460

cctactccgg caccgcctac aacagtctgg cccccaaggg agcacccaac acttgtcagt 20520

ggacatataa agccgatggt gaaactgcca cagaaaaaac ctatacatat ggaaatgcac 20580

ccgtgcaggg cattaacatc acaaaagatg gtattcaact tggaactgac accgatgatc 20640

agccaatcta cgcagataaa acctatcagc ctgaacctca agtgggtgat gctgaatggc 20700

atgacatcac tggtactgat gaaaagtatg gaggcagagc tcttaagcct gataccaaaa 20760

tgaagccttg ttatggttct tttgccaagc ctactaataa agaaggaggt caggcaaatg 20820

tgaaaacagg aacaggcact actaaagaat atgacataga catggctttc tttgacaaca 20880

gaagtgcggc tgctgctggc ctagctccag aaattgtttt gtatactgaa aatgtggatt 20940

tggaaactcc agatacccat attgtataca aagcaggcac agatgacagc agctcttcta 21000

ttaatttggg tcagcaagcc atgcccaaca gacctaacta cattggtttc agagacaact 21060

ttatcgggct catgtactac aacagcactg gcaatatggg ggtgctggcc ggtcaggctt 21120

ctcagctgaa tgctgtggtt gacttgcaag acagaaacac cgagctgtcc taccagctct 21180

tgcttgactc tctgggtgac agaacccggt atttcagtat gtggaatcag gcggtggaca 21240

gctatgatcc tgatgtgcgc attattgaaa atcatggtgt ggaggatgaa cttcccaact 21300

attgtttccc tctggatgct gttggcagaa cagatactta tcagggaatt aaggctaatg 21360

gaactgatca aaccacatgg accaaagatg acagtgtcaa tgatgctaat gagataggca 21420

agggtaatcc attcgccatg gaaatcaaca tccaagccaa cctgtggagg aacttcctct 21480

acgccaacgt ggccctgtac ctgcccgact cttacaagta cacgccggcc aatgttaccc 21540

tgcccaccaa caccaacacc tacgattaca tgaacggccg ggtggtggcg ccctcgctgg 21600

tggactccta catcaacatc ggggcgcgct ggtcgctgga tcccatggac aacgtgaacc 21660

ccttcaacca ccaccgcaat gcggggctgc gctaccgctc catgctcctg ggcaacgggc 21720

gctacgtgcc cttccacatc caggtgcccc agaaattttt cgccatcaag agcctcctgc 21780

tcctgcccgg gtcctacacc tacgagtgga acttccgcaa ggacgtcaac atgatcctgc 21840

agagctccct cggcaacgac ctgcgcacgg acggggcctc catctccttc accagcatca 21900

acctctacgc caccttcttc cccatggcgc acaacacggc ctccacgctc gaggccatgc 21960

tgcgcaacga caccaacgac cagtccttca acgactacct ctcggcggcc aacatgctct 22020

accccatccc ggccaacgcc accaacgtgc ccatctccat cccctcgcgc aactgggccg 22080

ccttccgcgg ctggtccttc acgcgtctca agaccaagga gacgccctcg ctgggctccg 22140

ggttcgaccc ctacttcgtc tactcgggct ccatccccta cctcgacggc accttctacc 22200

tcaaccacac cttcaagaag gtctccatca ccttcgactc ctccgtcagc tggcccggca 22260

acgaccggct cctgacgccc aacgagttcg aaatcaagcg caccgtcgac ggcgagggct 22320

acaacgtggc ccagtgcaac atgaccaagg actggttcct ggtccagatg ctggcccact 22380

acaacatcgg ctaccagggc ttctacgtgc ccgagggcta caaggaccgc atgtactcct 22440

tcttccgcaa cttccagccc atgagccgcc aggtggtgga cgaggtcaac tacaaggact 22500

accaggccgt caccctggcc taccagcaca acaactcggg cttcgtcggc tacctcgcgc 22560

ccaccatgcg ccagggccag ccctaccccg ccaactaccc ctacccgctc atcggcaaga 22620

gcgccgtcac cagcgtcacc cagaaaaagt tcctctgcga cagggtcatg tggcgcatcc 22680

ccttctccag caacttcatg tccatgggcg cgctcaccga cctcggccag aacatgctct 22740

atgccaactc cgcccacgcg ctagacatga atttcgaagt cgaccccatg gatgagtcca 22800

cccttctcta tgttgtcttc gaagtcttcg acgtcgtccg agtgcaccag ccccaccgcg 22860

gcgtcatcga ggccgtctac ctgcgcaccc ccttctcggc cggtaacgcc accacctaag 22920

ctcttgcttc ttgcaagcca tggccgcggg ctccggcgag caggagctca gggccatcat 22980

ccgcgacctg ggctgcgggc cctacttcct gggcaccttc gataagcgct tcccgggatt 23040

catggccccg cacaagctgg cctgcgccat cgtcaacacg gccggccgcg agaccggggg 23100

cgagcactgg ctggccttcg cctggaaccc gcgctcgaac acctgctacc tcttcgaccc 23160

cttcgggttc tcggacgagc gcctcaagca gatctaccag ttcgagtacg agggcctgct 23220

gcgccgcagc gccctggcca ccgaggaccg ctgcgtcacc ctggaaaagt ccacccagac 23280

cgtgcagggt ccgcgctcgg ccgcctgcgg gctcttctgc tgcatgttcc tgcacgcctt 23340

cgtgcactgg cccgaccgcc ccatggacaa gaaccccacc atgaacttgc tgacgggggt 23400

gcccaacggc atgctccagt cgccccaggt ggaacccacc ctgcgccgca accaggaggc 23460

gctctaccgc ttcctcaact cccactccgc ctactttcgc tcccaccgcg cgcgcatcga 23520

gaaggccacc gccttcgacc gcatgaatca agacatgtaa accgtgtgtg tatgttaaat 23580

gtctttaata aacagcactt tcatgttaca catgcatctg agatgattta tttagaaatc 23640

gaaagggttc tgccgggtct cggcatggcc cgcgggcagg gacacgttgc ggaactggta 23700

cttggccagc cacttgaact cggggatcag cagtttgggc agcggggtgt cggggaagga 23760

gtcggtccac agcttccgcg tcagttgcag ggcgcccagc aggtcgggcg cggagatctt 23820

gaaatcgcag ttgggacccg cgttctgcgc gcgggagttg cggtacacgg ggttgcagca 23880

ctggaacacc atcagggccg ggtgcttcac gctcgccagc accgtcgcgt cggtgatgct 23940

ctccacgtcg aggtcctcgg cgttggccat cccgaagggg gtcatcttgc aggtctgcct 24000

tcccatggtg ggcacgcacc cgggcttgtg gttgcaatcg cagtgcaggg ggatcagcat 24060

catctgggcc tggtcggcgt tcatccccgg gtacatggcc ttcatgaaag cctccaattg 24120

cctgaacgcc tgctgggcct tggctccctc ggtgaagaag accccgcagg acttgctaga 24180

gaactggttg gtggcgcacc cggcgtcgtg cacgcagcag cgcgcgtcgt tgttggccag 24240

ctgcaccacg ctgcgccccc agcggttctg ggtgatcttg gcccggtcgg ggttctcctt 24300

cagcgcgcgc tgcccgttct cgctcgccac atccatctcg atcatgtgct ccttctggat 24360

catggtggtc ccgtgcaggc accgcagctt gccctcggcc tcggtgcacc cgtgcagcca 24420

cagcgcgcac ccggtgcact cccagttctt gtgggcgatc tgggaatgcg cgtgcacgaa 24480

gccctgcagg aagcggccca tcatggtggt cagggtcttg ttgctagtga aggtcagcgg 24540

aatgccgcgg tgctcctcgt tgatgtacag gtggcagatg cggcggtaca cctcgccctg 24600

ctcgggcatc agctggaagt tggctttcag gtcggtctcc acgcggtagc ggtccatcag 24660

catagtcatg atttccatac ccttctccca ggccgagacg atgggcaggc tcatagggtt 24720

cttcaccatc atcttagcgc tagcagccgc ggccaggggg tcgctctcgt ccagggtctc 24780

aaagctccgc ttgccgtcct tctcggtgat ccgcaccggg gggtagctga agcccacggc 24840

cgccagctcc tcctcggcct gtctttcgtc ctcgctgtcc tggctgacgt cctgcaggac 24900

cacatgcttg gtcttgcggg gtttcttctt gggcggcagc ggcggcggag atgttggaga 24960

tggcgagggg gagcgcgagt tctcgctcac cactactatc tcttcctctt cttggtccga 25020

ggccacgcgg cggtaggtat gtctcttcgg gggcagaggc ggaggcgacg ggctctcgcc 25080

gccgcgactt ggcggatggc tggcagagcc ccttccgcgt tcgggggtgc gctcccggcg 25140

gcgctctgac tgacttcctc cgcggccggc cattgtgttc tcctagggag gaacaacaag 25200

catggagact cagccatcgc caacctcgcc atctgccccc accgccgacg agaagcagca 25260

gcagcagaat gaaagcttaa ccgccccgcc gcccagcccc gccacctccg acgcggccgt 25320

cccagacatg caagagatgg aggaatccat cgagattgac ctgggctatg tgacgcccgc 25380

ggagcacgag gaggagctgg cagtgcgctt ttcacaagaa gagatacacc aagaacagcc 25440

agagcaggaa gcagagaatg agcagagtca ggctgggctc gagcatgacg gcgactacct 25500

ccacctgagc gggggggagg acgcgctcat caagcatctg gcccggcagg ccaccatcgt 25560

caaggatgcg ctgctcgacc gcaccgaggt gcccctcagc gtggaggagc tcagccgcgc 25620

ctacgagttg aacctcttct cgccgcgcgt gccccccaag cgccagccca atggcacctg 25680

cgagcccaac ccgcgcctca acttctaccc ggtcttcgcg gtgcccgagg ccctggccac 25740

ctaccacatc tttttcaaga accaaaagat ccccgtctcc tgccgcgcca accgcacccg 25800

cgccgacgcc cttttcaacc tgggtcccgg cgcccgccta cctgatatcg cctccttgga 25860

agaggttccc aagatcttcg agggtctggg cagcgacgag actcgggccg cgaacgctct 25920

gcaaggagaa ggaggagagc atgagcacca cagcgccctg gtcgagttgg aaggcgacaa 25980

cgcgcggctg gcggtgctca aacgcacggt cgagctgacc catttcgcct acccggctct 26040

gaacctgccc cccaaagtca tgagcgcggt catggaccag gtgctcatca agcgcgcgtc 26100

gcccatctcc gaggacgagg gcatgcaaga ctccgaggag ggcaagcccg tggtcagcga 26160

cgagcagctg gcccggtggc tgggtcctaa tgctagtccc cagagtttgg aagagcggcg 26220

caaactcatg atggccgtgg tcctggtgac cgtggagctg gagtgcctgc gccgcttctt 26280

cgccgacgcg gagaccctgc gcaaggtcga ggagaacctg cactacctct tcaggcacgg 26340

gttcgtgcgc caggcctgca agatctccaa cgtggagctg accaacctgg tctcctacat 26400

gggcatcttg cacgagaacc gcctggggca gaacgtgctg cacaccaccc tgcgcgggga 26460

ggcccggcgc gactacatcc gcgactgcgt ctacctctac ctctgccaca cctggcagac 26520

gggcatgggc gtgtggcagc agtgtctgga ggagcagaac ctgaaagagc tctgcaagct 26580

cctgcagaag aacctcaagg gtctgtggac cgggttcgac gagcgcacca ccgcctcgga 26640

cctggccgac ctcattttcc ccgagcgcct caggctgacg ctgcgcaacg gcctgcccga 26700

ctttatgagc caaagcatgt tgcaaaactt tcgctctttc atcctcgaac gctccggaat 26760

cctgcccgcc acctgctccg cgctgccctc ggacttcgtg ccgctgacct tccgcgagtg 26820

ccccccgccg ctgtggagcc actgctacct gctgcgcctg gccaactacc tggcctacca 26880

ctcggacgtg atcgaggacg tcagcggcga gggcctgctc gagtgccact gccgctgcaa 26940

cctctgcacg ccgcaccgct ccctggcctg caacccccag ctgctgagcg agacccagat 27000

catcggcacc ttcgagttgc aagggcccag cgaaggcgag ggttcagccg ccaagggggg 27060

tctgaaactc accccggggc tgtggacctc ggcctacttg cgcaagttcg tgcccgagga 27120

ctaccatccc ttcgagatca ggttctacga ggaccaatcc catccgccca aggccgagct 27180

gtcggcctgc gtcatcaccc agggggcgat cctggcccaa ttgcaagcca tccagaaatc 27240

ccgccaagaa ttcttgctga aaaagggccg cggggtctac ctcgaccccc agaccggtga 27300

ggagctcaac cccggcttcc cccaggatgc cccgaggaaa caagaagctg aaagtggagc 27360

tgccgcccgt ggaggatttg gaggaagact gggagaacag cagtcaggca gaggaggagg 27420

agatggagga agactgggac agcactcagg cagaggagga cagcctgcaa gacagtctgg 27480

aggaagacga ggaggaggca gaggaggagg tggaagaagc agccgccgcc agaccgtcgt 27540

cctcggcggg ggagaaagca agcagcacgg ataccatctc cgctccgggt cggggtcccg 27600

ctcgaccaca cagtagatgg gacgagaccg gacgattccc gaaccccacc acccagaccg 27660

gtaagaagga gcggcaggga tacaagtcct ggcgggggca caaaaacgcc atcgtctcct 27720

gcttgcaggc ctgcgggggc aacatctcct tcacccggcg ctacctgctc ttccaccgcg 27780

gggtgaactt tccccgcaac atcttgcatt actaccgtca cctccacagc ccctactact 27840

tccaagaaga ggcagcagca gcagaaaaag accagcagaa aaccagcagc tagaaaatcc 27900

acagcggcgg cagcaggtgg actgaggatc gcggcgaacg agccggcgca aacccgggag 27960

ctgaggaacc ggatctttcc caccctctat gccatcttcc agcagagtcg ggggcaggag 28020

caggaactga aagtcaagaa ccgttctctg cgctcgctca cccgcagttg tctgtatcac 28080

aagagcgaag accaacttca gcgcactctc gaggacgccg aggctctctt caacaagtac 28140

tgcgcgctca ctcttaaaga gtagcccgcg cccgcccagt cgcagaaaaa ggcgggaatt 28200

acgtcacctg tgcccttcgc cctagccgcc tccacccatc atcatgagca aagagattcc 28260

cacgccttac atgtggagct accagcccca gatgggcctg gccgccggtg ccgcccagga 28320

ctactccacc cgcatgaatt ggctcagcgc cgggcccgcg atgatctcac gggtgaatga 28380

catccgcgcc caccgaaacc agatactcct agaacagtca gcgctcaccg ccacgccccg 28440

caatcacctc aatccgcgta attggcccgc cgccctggtg taccaggaaa ttccccagcc 28500

cacgaccgta ctacttccgc gagacgccca ggccgaagtc cagctgacta actcaggtgt 28560

ccagctggcg ggcggcgcca ccctgtgtcg tcaccgcccc gctcagggta taaagcggct 28620

ggtgatccgg ggcagaggca cacagctcaa cgacgaggtg gtgagctctt cgctgggtct 28680

gcgacctgac ggagtcttcc aactcgccgg atcggggaga tcttccttca cgcctcgtca 28740

ggccgtcctg actttggaga gttcgtcctc gcagccccgc tcgggtggca tcggcactct 28800

ccagttcgtg gaggagttca ctccctcggt ctacttcaac cccttctccg gctcccccgg 28860

ccactacccg gacgagttca tcccgaactt cgacgccatc agcgagtcgg tggacggcta 28920

cgattgaatg tcccatggtg gcgcagctga cctagctcgg cttcgacacc tggaccactg 28980

ccgccgcttc cgctgcttcg ctcgggatct cgccgagttt gcctactttg agctgcccga 29040

ggagcaccct cagggcccgg cccacggagt gcggatcgtc gtcgaagggg gcctcgactc 29100

ccacctgctt cggatcttca gccagcgtcc gatcctggtc gagcgcgagc aaggacagac 29160

ccttctgact ctgtactgca tctgcaacca ccccggcctg catgaaagtc tttgttgtct 29220

gctgtgtact gagtataata aaagctgaga tcagcgacta ctccggactt ccgtgtgttc 29280

ctgaatccat caaccagtct ttgttcttca ccgggaacga gaccgagctc cagctccagt 29340

gtaagcccca caagaagtac ctcacctggc tgttccaggg ctccccgatc gccgttgtca 29400

accactgcga caacgacgga gtcctgctga gcggccctgc caaccttact ttttccaccc 29460

gcagaagcaa gctccagctc ttccaaccct tcctccccgg gacctatcag tgcgtctcgg 29520

gaccctgcca tcacaccttc cacctgatcc cgaataccac agcgtcgctc cccgctacta 29580

acaaccaaac taacctccac caacgccacc gtcgctaggc cacaatacat gcccatatta 29640

gactatgagg ccgagccaca gcgacccatg ctccccgcta ttagttactt caatctaacc 29700

ggcggagatg actgacccac tggccaacaa caacgtcaac gaccttctcc tggacatgga 29760

cggccgcgcc tcggagcagc gactcgccca acttcgcatt cgccagcagc aggagagagc 29820

cgtcaaggag ctgcaggatg cggtggccat ccaccagtgc aagagaggca tcttctgcct 29880

ggtgaaacag gccaagatct cctacgaggt cactccaaac gaccatcgcc tctcctacga 29940

gctcctgcag cagcgccaga agttcacctg cctggtcgga gtcaacccca tcgtcatcac 30000

ccagcagtct ggcgatacca aggggtgcat ccactgctcc tgcgactccc ccgactgcgt 30060

ccacactctg atcaagaccc tctgcggcct ccgcgacctc ctccccatga actaatcacc 30120

cccttatcca gtgaaataaa gatcatattg atgatgattt tacagaaata aaaaataatc 30180

atttgatttg aaataaagat acaatcatat tgatgatttg agtttaacaa aaaaataaag 30240

aatcacttac ttgaaatctg ataccaggtc tctgtccatg ttttctgcca acaccacttc 30300

actcccctct tcccagctct ggtactgcag gccccggcgg gctgcaaact tcctccacac 30360

gctgaagggg atgtcaaatt cctcctgtcc ctcaatcttc attttatctt ctatcagatg 30420

tccaaaaagc gcgtccgggt ggatgatgac ttcgaccccg tctaccccta cgatgcagac 30480

aacgcaccga ccgtgccctt catcaacccc cccttcgtct cttcagatgg attccaagag 30540

aagcccctgg gggtgttgtc cctgcgactg gccgaccccg tcaccaccaa gaacggggaa 30600

atcaccctca agctgggaga gggggtggac ctcgattcct cgggaaaact catctccaac 30660

acggccacca aggccgccgc ccctctcagt ttttccaaca acaccatttc ccttaacatg 30720

gatcacccct tttacactaa agatggaaaa ttatccttac aagtttctcc accattaaat 30780

atactgagaa caagcattct aaacacacta gctttaggtt ttggatcagg tttaggactc 30840

cgtggctctg ccttggcagt acagttagtc tctccactta catttgatac tgatggaaac 30900

ataaagctta ccttagacag aggtttgcat gttacaacag gagatgcaat tgaaagcaac 30960

ataagctggg ctaaaggttt aaaatttgaa gatggagcca tagcaaccaa cattggaaat 31020

gggttagagt ttggaagcag tagtacagaa acaggtgttg atgatgctta cccaatccaa 31080

gttaaacttg gatctggcct tagctttgac agtacaggag ccataatggc tggtaacaaa 31140

gaagacgata aactcacttt gtggacaaca cctgatccat caccaaactg tcaaatactc 31200

gcagaaaatg atgcaaaact aacactttgc ttgactaaat gtggtagtca aatactggcc 31260

actgtgtcag tcttagttgt aggaagtgga aacctaaacc ccattactgg caccgtaagc 31320

agtgctcagg tgtttctacg ttttgatgca aacggtgttc ttttaacaga acattctaca 31380

ctaaaaaaat actgggggta taggcaggga gatagcatag atggcactcc atataccaat 31440

gctgtaggat tcatgcccaa tttaaaagct tatccaaagt cacaaagttc tactactaaa 31500

aataatatag tagggcaagt atacatgaat ggagatgttt caaaacctat gcttctcact 31560

ataaccctca atggtactga tgacagcaac agtacatatt caatgtcatt ttcatacacc 31620

tggactaatg gaagctatgt tggagcaaca tttggggcta actcttatac cttctcatac 31680

atcgcccaag aatgaacact gtatcccacc ctgcatgcca acccttccca ccccactctg 31740

tggaacaaac tctgaaacac aaaataaaat aaagttcaag tgttttattg attcaacagt 31800

tttacaggat tcgagcagtt atttttcctc caccctccca ggacatggaa tacaccaccc 31860

tctccccccg cacagccttg aacatctgaa tgccattggt gatggacatg cttttggtct 31920

ccacgttcca cacagtttca gagcgagcca gtctcgggtc ggtcagggag atgaaaccct 31980

ccgggcactc ccgcatctgc acctcacagc tcaacagctg aggattgtcc tcggtggtcg 32040

ggatcacggt tatctggaag aagcagaaga gcggcggtgg gaatcatagt ccgcgaacgg 32100

gatcggccgg tggtgtcgca tcaggccccg cagcagtcgc tgccgccgcc gctccgtcaa 32160

gctgctgctc agggggtccg ggtccaggga ctccctcagc atgatgccca cggccctcag 32220

catcagtcgt ctggtgcggc gggcgcagca gcgcatgcgg atctcgctca ggtcgctgca 32280

gtacgtgcaa cacagaacca ccaggttgtt caacagtcca tagttcaaca cgctccagcc 32340

gaaactcatc gcgggaagga tgctacccac gtggccgtcg taccagatcc tcaggtaaat 32400

caagtggtgc cccctccaga acacgctgcc cacgtacatg atctccttgg gcatgtggcg 32460

gttcaccacc tcccggtacc acatcaccct ctggttgaac atgcagcccc ggatgatcct 32520

gcggaaccac agggccagca ccgccccgcc cgccatgcag cgaagagacc ccgggtcccg 32580

gcaatggcaa tggaggaccc accgctcgta cccgtggatc atctgggagc tgaacaagtc 32640

tatgttggca cagcacaggc atatgctcat gcatctcttc agcactctca actcctcggg 32700

ggtcaaaacc atatcccagg gcacggggaa ctcttgcagg acagcgaacc ccgcagaaca 32760

gggcaatcct cgcacagaac ttacattgtg catggacagg gtatcgcaat caggcagcac 32820

cgggtgatcc tccaccagag aagcgcgggt ctcggtctcc tcacagcgtg gtaagggggc 32880

cggccgatac gggtgatggc gggacgcggc tgatcgtgtt cgcgaccgtg tcatgatgca 32940

gttgctttcg gacattttcg tacttgctgt agcagaacct ggtccgggcg ctgcacaccg 33000

atcgccggcg gcggtctcgg cgcttggaac gctcggtgtt gaaattgtaa aacagccact 33060

ctctcagacc gtgcagcaga tctagggcct caggagtgat gaagatccca tcatgcctga 33120

tggctctgat cacatcgacc accgtggaat gggccagacc cagccagatg atgcaatttt 33180

gttgggtttc ggtgacggcg ggggagggaa gaacaggaag aaccatgatt aacttttaat 33240

ccaaacggtc tcggagtact tcaaaatgaa gatcgcggag atggcacctc tcgcccccgc 33300

tgtgttggtg gaaaataaca gccaggtcaa aggtgatacg gttctcgaga tgttccacgg 33360

tggcttccag caaagcctcc acgcgcacat ccagaaacaa gacaatagcg aaagcgggag 33420

ggttctctaa ttcctcaatc atcatgttac actcctgcac catccccaga taattttcat 33480

ttttccagcc ttgaatgatt cgaactagtt cctgaggtaa atccaagcca gccatgataa 33540

agagctcgcg cagagcgccc tccaccggca ttcttaagca caccctcata attccaagat 33600

attctgctcc tggttcacct gcagcagatt gacaagcgga atatcaaaat ctctgccgcg 33660

atccctgagc tcctccctca gcaataactg taagtactct ttcatatcct ctccgaaatt 33720

tttagccata ggaccaccag gaataagatt agggcaagcc acagtacaga taaaccgaag 33780

tcctccccag tgagcattgc caaatgcaag actgctataa gcatgctggc tagacccggt 33840

gatatcttcc agataactgg acagaaaatc gcccaggcaa tttttaagaa aatcaacaaa 33900

agaaaaatcc tccaggtgga cgtttagagc ctcgggaaca acgatgaagt aaatgcaagc 33960

ggtgcgttcc agcatggtta gttagctgat ctgtagaaaa aacaaaaatg aacattaaac 34020

catgctagcc tggcgaacag gtgggtaaat cgttctctcc agcaccaggc aggccacggg 34080

gtctccggcg cgaccctcgt aaaaattgtc gctatgattg aaaaccatca cagagagacg 34140

ttcccggtgg ccggcgtgaa tgattcgaca agatgaatac acccccggaa cattggcgtc 34200

cgcgagtgaa aaaaagcgcc cgaggaagca ataaggcact acaatgctca gtctcaagtc 34260

cagcaaagcg atgccatgcg gatgaagcac aaaattctca ggtgcgtaca aaatgtaatt 34320

actcccctcc tgcacaggca gcaaagcccc cgatccctcc aggtacacat acaaagcctc 34380

agcgtccata gcttaccgag cagcagcaca caacaggcgc aagagtcaga gaaaggctga 34440

gctctaacct gtccacccgc tctctgctca atatatagcc cagatctaca ctgacgtaaa 34500

ggccaaagtc taaaaatacc cgccaaataa tcacacacgc ccagcacacg cccagaaacc 34560

ggtgacacac tcaaaaaaat acgcgcactt cctcaaacgc ccaaaactgc cgtcatttcc 34620

gggttcccac gctacgtcat caaaacacga ctttcaaatt ccgtcgaccg ttaaaaacgt 34680

cacccgcccc gcccctaacg gtcgcccgtc tctcagccaa tcagcgcccc gcatccccaa 34740

attcaaacgc ctcatttgca tattaacgcg cacaaaaagt ttgaggtata ttattgatga 34800

tgg 34803

<210> 64

<211> 1145

<212> ПРТ

<213> Искуственная последовательность

<220>

<223> Синтетическая конструкция

<400> 64

Met Ala Ser Ile Val Gly Gly Trp Glu Cys Glu Lys His Ser Gln Pro

1 5 10 15

Trp Gln Val Leu Val Ala Ser Arg Gly Arg Ala Val Cys Gly Gly Val

20 25 30

Leu Val His Pro Gln Trp Val Leu Thr Ala Ala His Cys Ile Arg Asn

35 40 45

Lys Ser Val Ile Leu Leu Gly Arg His Ser Leu Phe His Pro Glu Asp

50 55 60

Thr Gly Gln Val Phe Gln Val Ser His Ser Phe Pro His Pro Leu Tyr

65 70 75 80

Asp Met Ser Leu Leu Lys Asn Arg Phe Leu Arg Pro Gly Asp Asp Ser

85 90 95

Ser His Asp Leu Met Leu Leu Arg Leu Ser Glu Pro Ala Glu Leu Thr

100 105 110

Asp Ala Val Lys Val Met Asp Leu Pro Thr Gln Glu Pro Ala Leu Gly

115 120 125

Thr Thr Cys Tyr Ala Ser Gly Trp Gly Ser Ile Glu Pro Glu Glu Phe

130 135 140

Leu Thr Pro Lys Lys Leu Gln Cys Val Asp Leu His Val Ile Ser Asn

145 150 155 160

Asp Val Cys Ala Gln Val His Pro Gln Lys Val Thr Lys Phe Met Leu

165 170 175

Cys Ala Gly Arg Trp Thr Gly Gly Lys Ser Thr Cys Ser Gly Asp Ser

180 185 190

Gly Gly Pro Leu Val Cys Asn Gly Val Leu Gln Gly Ile Thr Ser Trp

195 200 205

Gly Ser Glu Pro Cys Ala Leu Pro Glu Arg Pro Ser Leu Tyr Thr Lys

210 215 220

Val Val His Tyr Arg Lys Trp Ile Lys Asp Thr Ile Val Ala Asn Pro

225 230 235 240

Gly Ser Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val

245 250 255

Glu Ser Asn Pro Gly Pro Met Ala Ser Ala Arg Arg Pro Arg Trp Leu

260 265 270

Cys Ala Gly Ala Leu Val Leu Ala Gly Gly Phe Phe Leu Leu Gly Phe

275 280 285

Leu Phe Gly Trp Phe Ile Lys Ser Ser Asn Glu Ala Thr Asn Ile Thr

290 295 300

Pro Lys His Asn Met Lys Ala Phe Leu Asp Glu Leu Lys Ala Glu Asn

305 310 315 320

Ile Lys Lys Phe Leu Tyr Asn Phe Thr Gln Ile Pro His Leu Ala Gly

325 330 335

Thr Glu Gln Asn Phe Gln Leu Ala Lys Gln Ile Gln Ser Gln Trp Lys

340 345 350

Glu Phe Gly Leu Asp Ser Val Glu Leu Ala His Tyr Asp Val Leu Leu

355 360 365

Ser Tyr Pro Asn Lys Thr His Pro Asn Tyr Ile Ser Ile Ile Asn Glu

370 375 380

Asp Gly Asn Glu Ile Phe Asn Thr Ser Leu Phe Glu Pro Pro Pro Pro

385 390 395 400

Gly Tyr Glu Asn Val Ser Asp Ile Val Pro Pro Phe Ser Ala Phe Ser

405 410 415

Pro Gln Gly Met Pro Glu Gly Asp Leu Val Tyr Val Asn Tyr Ala Arg

420 425 430

Thr Glu Asp Phe Phe Lys Leu Glu Arg Asp Met Lys Ile Asn Cys Ser

435 440 445

Gly Lys Ile Val Ile Ala Arg Tyr Gly Lys Val Phe Arg Gly Asn Lys

450 455 460

Val Lys Asn Ala Gln Leu Ala Gly Ala Lys Gly Val Ile Leu Tyr Ser

465 470 475 480

Asp Pro Ala Asp Tyr Phe Ala Pro Gly Val Lys Ser Tyr Pro Asp Gly

485 490 495

Trp Asn Leu Pro Gly Gly Gly Val Gln Arg Gly Asn Ile Leu Asn Leu

500 505 510

Asn Gly Ala Gly Asp Pro Leu Thr Pro Gly Tyr Pro Ala Asn Glu Tyr

515 520 525

Ala Tyr Arg Arg Gly Ile Ala Glu Ala Val Gly Leu Pro Ser Ile Pro

530 535 540

Val His Pro Ile Gly Tyr Tyr Asp Ala Gln Lys Leu Leu Glu Lys Met

545 550 555 560

Gly Gly Ser Ala Pro Pro Asp Ser Ser Trp Arg Gly Ser Leu Lys Val

565 570 575

Pro Tyr Asn Val Gly Pro Gly Phe Thr Gly Asn Phe Ser Thr Gln Lys

580 585 590

Val Lys Met His Ile His Ser Thr Asn Glu Val Thr Arg Ile Tyr Asn

595 600 605

Val Ile Gly Thr Leu Arg Gly Ala Val Glu Pro Asp Arg Tyr Val Ile

610 615 620

Leu Gly Gly His Arg Asp Ser Trp Val Phe Gly Gly Ile Asp Pro Gln

625 630 635 640

Ser Gly Ala Ala Val Val His Glu Ile Val Arg Ser Phe Gly Thr Leu

645 650 655

Lys Lys Glu Gly Trp Arg Pro Arg Arg Thr Ile Leu Phe Ala Ser Trp

660 665 670

Asp Ala Glu Glu Phe Gly Leu Leu Gly Ser Thr Glu Trp Ala Glu Glu

675 680 685

Asn Ser Arg Leu Leu Gln Glu Arg Gly Val Ala Tyr Ile Asn Ala Asp

690 695 700

Ser Ser Ile Glu Gly Asn Tyr Thr Leu Arg Val Asp Cys Thr Pro Leu

705 710 715 720

Met Tyr Ser Leu Val His Asn Leu Thr Lys Glu Leu Lys Ser Pro Asp

725 730 735

Glu Gly Phe Glu Gly Lys Ser Leu Tyr Glu Ser Trp Thr Lys Lys Ser

740 745 750

Pro Ser Pro Glu Phe Ser Gly Met Pro Arg Ile Ser Lys Leu Gly Ser

755 760 765

Gly Asn Asp Phe Glu Val Phe Phe Gln Arg Leu Gly Ile Ala Ser Gly

770 775 780

Arg Ala Arg Tyr Thr Lys Asn Trp Glu Thr Asn Lys Phe Ser Gly Tyr

785 790 795 800

Pro Leu Tyr His Ser Val Tyr Glu Thr Tyr Glu Leu Val Glu Lys Phe

805 810 815

Tyr Asp Pro Met Phe Lys Tyr His Leu Thr Val Ala Gln Val Arg Gly

820 825 830

Gly Met Val Phe Glu Leu Ala Asn Ser Ile Val Leu Pro Phe Asp Cys

835 840 845

Arg Asp Tyr Ala Val Val Leu Arg Lys Tyr Ala Asp Lys Ile Tyr Ser

850 855 860

Ile Ser Met Lys His Pro Gln Glu Met Lys Thr Tyr Ser Val Ser Phe

865 870 875 880

Asp Ser Leu Phe Ser Ala Val Lys Asn Phe Thr Glu Ile Ala Ser Lys

885 890 895

Phe Ser Glu Arg Leu Gln Asp Phe Asp Lys Ser Asn Pro Ile Val Leu

900 905 910

Arg Met Met Asn Asp Gln Leu Met Phe Leu Glu Arg Ala Phe Ile Asp

915 920 925

Pro Leu Gly Leu Pro Asp Arg Pro Phe Tyr Arg His Val Ile Tyr Ala

930 935 940

Pro Ser Ser His Asn Lys Tyr Ala Gly Glu Ser Phe Pro Gly Ile Tyr

945 950 955 960

Asp Ala Leu Phe Asp Ile Glu Ser Lys Val Asp Pro Ser Lys Ala Trp

965 970 975

Gly Glu Val Lys Arg Gln Ile Tyr Val Ala Ala Phe Thr Val Gln Ala

980 985 990

Ala Ala Glu Thr Leu Ser Glu Val Ala Gly Ser Glu Gly Arg Gly Ser

995 1000 1005

Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Ala Ser

1010 1015 1020

Lys Ala Val Leu Leu Ala Leu Leu Met Ala Gly Leu Ala Leu Gln

1025 1030 1035

Pro Gly Thr Ala Leu Leu Cys Tyr Ser Cys Lys Ala Gln Val Ser

1040 1045 1050

Asn Glu Asp Cys Leu Gln Val Glu Asn Cys Thr Gln Leu Gly Glu

1055 1060 1065

Gln Cys Trp Thr Ala Arg Ile Arg Ala Val Gly Leu Leu Thr Val

1070 1075 1080

Ile Ser Lys Gly Cys Ser Leu Asn Cys Val Asp Asp Ser Gln Asp

1085 1090 1095

Tyr Tyr Val Gly Lys Lys Asn Ile Thr Cys Cys Asp Thr Asp Leu

1100 1105 1110

Cys Asn Ala Ser Gly Ala His Ala Leu Gln Pro Ala Ala Ala Ile

1115 1120 1125

Leu Ala Leu Leu Pro Ala Leu Gly Leu Leu Leu Trp Gly Pro Gly

1130 1135 1140

Gln Leu

1145

<210> 65

<211> 246

<212> ДНК

<213> Искуственная последовательность

<220>

<223> Синтетическая конструкция

<400> 65

atggctagca tcgtcggagg gtgggagtgc gaaaagcact cacagccatg gcaggtcctg 60

gtcgcctcgc gcggacgcgc cgtgtgtgga ggtgtgctgg tccacccgca gtgggtgttg 120

actgcggccc attgcatcag aaataagtcc gtgatcctct tggggagaca ttccctgttt 180

caccccgaag atactggaca ggtgttccaa gtgagccact ccttcccgca tccactgtac 240

gacatg 246

<210> 66

<211> 245

<212> ДНК

<213> Искуственная последовательность

<220>

<223> Синтетическая конструкция

<400> 66

atggctagca aagcagtgct gctggcgctc ctgatggctg gactcgcgct gcagcctgga 60

accgccctgc tctgttactc gtgcaaggcc caagtctcga atgaggactg tttgcaagtg 120

gaaaactgca cccagctcgg agaacaatgc tggactgcac ggatccgcgc tgtcggcctg 180

ctgaccgtga tctccaaagg gtgctcattg aactgcgtgg acgatagcca ggactactac 240

gtggg 245

Реферат

Изобретение относится к области биотехнологии, конкретно к получению вектора экспрессии, содержащего (а) нуклеотидную последовательность С68 и (б) мультиантигенную конструкцию ДНК, кодирующую иммуногенные полипептиды простатоассоциированных антигенов (РАА), что может быть использовано в медицине. Рекомбинантным путем получают вектор экспрессии С68, который используют в составе фармацевтической композиции для вызова иммунного ответа на РАА. Изобретение позволяет повысить эффективность лечения рака предстательной железы у человека. 5 н. и 19 з.п. ф-лы, 13 ил., 15 табл., 11 пр.

Формула

1. Вектор экспрессии С68, содержащий:
(а) нуклеотидную последовательность С68 и
(б) мультиантигенную конструкцию ДНК, которая содержит по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA (простатоспецифический антиген), по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA (антиген стволовых клеток простаты), и по меньшей мере одну нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA (простатоспецифический мембранный антиген), где иммуногенный полипептид PSA содержит аминокислоты 27-263 из SEQ ID NO: 15 или аминокислоты 4-240 из SEQ ID NO: 17.
2. Вектор С68 по п. 1, где нуклеотидная последовательность С68 представляет собой последовательность SEQ ID NO: 57, в которой отсутствует по меньшей мере один ген, выбранный из группы, состоящей из генов Е1А, Е1В, Е2А, Е2В, Е3, Е4, L1, L2, L3, L4 и L5, где иммуногенный полипептид PSCA содержит аминокислотную последовательность SEQ ID NO: 21 или аминокислоты 4-125 из SEQ ID NO: 21 и где иммуногенный полипептид PSMA выбран из группы, состоящей из:
1) полипептида, содержащего аминокислоты 15-750 из SEQ ID NO: 1;
2) полипептида, содержащего аминокислотную последовательность SEQ ID NO: 3;
3) полипептида, содержащего аминокислотную последовательность SEQ ID NO: 5;
4) полипептида, содержащего аминокислотную последовательность SEQ ID NO: 7;
5) полипептида, содержащего аминокислоты 4-739 из SEQ ID NO: 9;
6) полипептида, содержащего аминокислоты 4-739 из SEQ ID NO: 3;
7) полипептида, содержащего аминокислоты 4-739 из SEQ ID NO: 5;
8) полипептида, содержащего аминокислоты 4-739 из SEQ ID NO: 7, и
9) полипептида, содержащего аминокислотную последовательность SEQ ID NO: 9.
3. Вектор С68 по п. 2, где нуклеотидная последовательность С68 представляет собой последовательность SEQ ID NO: 57, в которой отсутствуют гены Е1А, Е1В и Е3, и где мультиантигенная конструкция дополнительно содержит разделяющую последовательность между двумя нуклеотидными последовательностями, кодирующими два разных иммуногенных полипептида, и имеет структуру формулы (I)
где в формуле (I):
(1) РАА1 (простатоассоциированный антиген 1), РАА2 и РАА3, каждый, представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, или нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, при условии, что РАА1, РАА2 и РАА3 кодируют разные полипептиды РАА, и
(2) SS1 и SS2 представляют собой разделяющие последовательности и могут быть одинаковыми или разными.
4. Вектор С68 по п. 3, где разделяющие последовательности выбраны из последовательностей 2А-пептидов и участков внутренней посадки рибосомы (IRES).
5. Вектор С68 по п. 4, где последовательность 2А-пептида выбрана из группы, состоящей из последовательности 2А-пептида из вируса ящура (FMDV), вируса А, вызывающего ринит у лошадей (ERAV), вируса 1 болезни Тешена у свиней (PTV1), вируса энцефаломиокардита, варианта В (ЕМС-В), вируса энцефаломиокардита (EMCV), вируса мышиного энцефаломиелита Тейлора GD7 (TME-GD7), вируса В, вызывающего ринит у лошадей (ERBV), вируса Thosea asigna (TaV), вируса С дрозофилы (DrosC), вируса паралича сверчка (CrPV), вируса острого паралича пчел (ABPV), вируса инфекционного заболевания тутового шелкопряда (IFV), ротавируса свиней, ротавируса человека, TSR1 Т. brucei и апуриновой/апиримидиновой (АР) эндонуклеазы Т. cruzi, и где IRES (участок внутренней посадки рибосомы) представляет собой IRES из EMCV.
6. Вектор С68 по п. 5, где РАА1 в формуле (I) представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, или нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA.
7. Вектор С68 по п. 6, где:
(1) РАА1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA;
(2) РАА2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA или PSMA;
(3) SS1 представляет собой последовательность 2А-пептида и
(4) SS2 представляет собой последовательность 2А-пептида или IRES из EMCV.
8. Вектор С68 по п. 7, где последовательность 2А-пептида представляет собой последовательность 2А-пептида FMDV или последовательность 2А-пептида TaV.
9. Вектор С68 по п. 8, где:
(1) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности SEQ ID NO: 18; (б) нуклеотидной последовательности SEQ ID NO: 20; (в) нуклеотидной последовательности, содержащей нуклеотиды 10-720 из SEQ ID NO: 18; (г) нуклеотидной последовательности, содержащей нуклеотиды 1115-1825 из SEQ ID NO: 58; и (д) нуклеотидной последовательности, содержащей нуклеотиды 1106-1825 из SEQ ID NO: 58;
(2) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSCA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности SEQ ID NO: 22; (б) нуклеотидной последовательности, содержащей нуклеотиды 10-372 из SEQ ID NO: 22; (в) нуклеотидной последовательности, содержащей нуклеотиды 1892-2257 из SEQ ID NO: 58; и (г) нуклеотидной последовательности, содержащей нуклеотиды 1886-2257 из SEQ ID NO: 58; и
(3) нуклеотидная последовательность, кодирующая иммуногенный полипептид PSMA, выбрана из группы, состоящей из: (а) нуклеотидной последовательности, содержащей нуклеотиды 43-2250 из SEQ ID NO: 2; (б) нуклеотидной последовательности SEQ ID NO: 4; (в) нуклеотидной последовательности SEQ ID NO: 6; (г) нуклеотидной последовательности SEQ ID NO: 8; (д) нуклеотидной последовательности SEQ ID NO: 10; (e) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 4; (ж) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 6; (з) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 8; (и) нуклеотидной последовательности, содержащей нуклеотиды 10-2217 из SEQ ID NO: 10; (к) нуклеотидной последовательности, содержащей нуклеотиды 2333-4543 из SEQ ID NO: 58; и (л) нуклеотидной последовательности, содержащей нуклеотиды 2324-4543 из SEQ ID NO: 58.
10. Вектор С68 по п. 3, где в формуле (I):
(1) РАА1 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSA, и содержит нуклеотиды 1115-1825 из SEQ ID NO: 58 или содержит нуклеотиды 1106-1114 из SEQ ID NO: 58;
(2) РАА2 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSCA, и содержит нуклеотиды 1892-2257 из SEQ ID NO: 58 или содержит нуклеотиды 1886-2257 из SEQ ID NO: 58;
(3) РАА3 представляет собой нуклеотидную последовательность, кодирующую иммуногенный полипептид PSMA, и содержит нуклеотиды 2333-4543 из SEQ ID NO: 58 или содержит нуклеотиды 2324-4543 из SEQ ID NO: 58;
(4) SS1 представляет собой нуклеотидную последовательность, кодирующую Т2А (2А-пептид TaV), и
(5) SS2 представляет собой нуклеотидную последовательность, кодирующую F2A (2А-пептид вируса ящура).
11. Вектор С68 по п. 1, где мультиантигенная конструкция содержит нуклеотидную последовательность, кодирующую аминокислотную последовательность SEQ ID NO: 60 или SEQ ID NO: 64.
12. Вектор C68 по п. 1, где мультиантигенная конструкция содержит нуклеотидную последовательность SEQ ID NO: 61, SEQ ID NO: 65, SEQ ID NO: 66 или вырожденный вариант нуклеотидной последовательности SEQ ID NO: 61, SEQ ID NO: 65, SEQ ID NO: 66.
13. Вектор C68 по п. 11 или 12, дополнительно содержащий промотор CMV.
14. Вектор С68 по п. 1, содержащий нуклеотидную последовательность SEQ ID NO: 58, нуклеотиды 9-34811 из SEQ ID NO: 58 или нуклеотидную последовательность SEQ ID NO: 63.
15. Композиция для вызова иммунного ответа на РАА (простатоассоциированный антиген), содержащая эффективное количество вектора С68 по любому из пп. 1-14.
16. Клетка для экспрессии вектора по п. 1, содержащая вектор С68 по любому из пп. 1-14.
17. Фармацевтическая композиция для лечения или предупреждения рака, ассоциированного со сверхэкспрессией РАА, содержащая эффективное количество вектора по любому из пп. 1-14 и фармацевтически приемлемый эксципиент.
18. Способ лечения рака предстательной железы у человека, включающий введение человеку эффективного количества фармацевтической композиции по п. 17.
19. Способ по п. 18, дополнительно включающий введение человеку эффективного количества иммуномодулятора.
20. Способ по п. 18, дополнительно включающий введение человеку (а) эффективного количества по меньшей мере одного ингибитора супрессорных клеток иммунной системы и (б) эффективного количества по меньшей мере одного усилителя эффекторных клеток иммунной системы.
21. Способ по п. 20, где ингибитор супрессорных клеток иммунной системы выбран из группы, состоящей из ингибитора протеинкиназы, ингибитора циклооксигеназы-2 (СОХ-2) и ингибитора фосфодиэстеразы типа 5 (PDE5), и где усилитель эффекторных клеток иммунной системы выбран из группы, состоящей из ингибитора цитотоксического Т-лимфоцитарного антигена-4 (CTLA-4), агониста CD40, агониста toll-подобного рецептора (TLR), агониста 4-1 ВВ, агониста ОХ40, агониста индуцированного глюкокортикоидами рецептора фактора некроза опухолей (GITR), антагониста белка 1 программируемой клеточной смерти (PD-1) и антагониста лиганда 1 PD-1 (PD-L1).
22. Способ по п. 21, где:
(1) ингибитор протеинкиназы выбран из группы, состоящей из иматиниба, сорафениба, лапатиниба, зактима, МР-412, дазатиниба, лестауртиниба, сунитиниба малата, акситиниба, эрлотиниба, гефитиниба, босутиниба, темсиролимуса и нилотиниба;
(2) ингибитор CTLA-4 выбран из группы, состоящей из ипилимумаба и тремелимумаба;
(3) агонист CD40 представляет собой антитело к CD40, выбранное из группы, состоящей из G28-5, mAb89, ЕА-5, S2C6, СР870893 и дацетузумаба, и
(4) агонист TLR представляет собой CpG-олигонуклеотид, выбранный из группы, состоящей из CpG 24555, CpG 10103, CpG7909 и CpG1018.
23. Способ по п. 22, где ингибитор супрессорных клеток иммунной системы представляет собой ингибитор протеинкиназы, выбранный из группы, состоящей из сорафениба, дазатиниба, иматиниба, акситиниба и сунитиниба малата, и где усилитель эффекторных клеток иммунной системы представляет собой тремелимумаб.
24. Способ по п. 22, где ингибитор супрессорных клеток иммунной системы представляет собой ингибитор протеинкиназы, выбранный из группы, состоящей из сорафениба, дазатиниба, иматиниба, акситиниба и сунитиниба малата, и где усилитель эффекторных клеток иммунной системы представляет собой CpG-олигонуклеотид, выбранный из группы, состоящей из CpG24555, CpG10103, CpG7909 и CpG1018.

Патенты аналоги

Авторы

Патентообладатели

Заявители

0
0
0
0
Невозможно загрузить содержимое всплывающей подсказки.
Поиск по товарам