Химерные белки на основе утрофина и дистрофина человека и их применение для лечения миодистрофии дюшенна - RU2767335C1

Код документа: RU2767335C1

Чертежи

Показать все 7 чертежа(ей)

Описание

Изобретение относится к области биотехнологии и медицины, в частности, к химерным белкам, содержащим последовательности дистрофина и утрофина человека, а также к последовательностям нуклеиновых кислот, кодирующим такие белки, и векторам, несущим такие последовательности. Генетические конструкции по настоящему изобретению могут использоваться для заместительной генной терапии миодистрофии Дюшенна при доставке в мышечные клетки пациентов с помощью известных экспрессионных векторов и дальнейшей экспрессии там химерного белка, способного функционально заменить отсутствующий дистрофии.

Уровень техники.

Миодистрофия Дюшенна занимает первое место среди мышечных дистрофий по распространенности. Одним из наиболее многообещающих способов ее лечения является заместительная терапия, а именно - доставка гена, кодирующего дистрофии либо его аналог, в мышцы. Среди самых популярных способов доставки генетического материалы следует выделить аденоассоциированные вирусные векторы (AAV) (Duan 2018). Преимущества AAV: вариабельность серотипа (что позволяет обеспечить таргетную доставку конструкции в целевую ткань), неспособность встраиваться в геном и низкая иммуногенность капсида. В то же время AAV имеют фундаментальное ограничение - с их помощью невозможна доставка генетической конструкции, длина которой превышает 4,7 тысяч пар оснований. Так как длина конструкции, кодирующий полноразмерный дистрофии, превышает 11 тысяч пар оснований, была предложена стратегия дизайна сокращенных вариантов дистрофина (т.н. микродистрофины), в которых отсутствует часть наименее критичных для функционирования исходного белка доменов. Этот подход имеет недостаток, связанный с иммуногенностью трансгена. Так как у большинства больных миодистрофией Дюшенна отсутствует полноразмерный дистрофии (хотя чаще всего присутствуют укороченные изоформы (Culligan et al. 1998), иммунная система может распознать трансген как чужеродный белок (Ferrer, Wells, and Wells 2000; Mendell et al. 2010). Для предотвращения иммунного ответа на трансген возможна разработка конструкций на основе ближайшего функционального и структурного гомолога дистрофина - утрофина (Tinsley and Davies 1993). Утрофин выполняет аналогичную дистрофину функцию, но в эмбриональном периоде развития, после чего заменяется дистрофином.

Все предложенные на данный момент варианты конструкций, способные быть доставленными с помощью AAV, и имеющие терапевтический потенциал, включают N-концевой домен (критически необходимый для связывания с актином) и цистеин-богатый домен (критически необходимый для связывания с белками сарколеммы). При этом возможно варьирование состава т.н. rod-домена, а именно - состава и количества спектрин-подобных повторов и неструктурированных пептидных доменов (т.н. доменов hinge - петля, стержень, далее - Н) (Duan 2018).

Из заявки WO2002029056A2 (дата публикации 11 апреля 2002) известны генетические конструкции, кодирующие «сокращенные» варианты дистрофина - микродистрофины. Сокращение происходит в основном за счет удаления из кодирующей последовательности фрагментов, кодирующих некоторые спектриновые повторы и неструктурированные линкеры. Авторы предлагают варианты ΔR4-R23 и ΔR2-R21 (указаны номера спектриновых повторов, отсутствующих в конечной конструкции). Конструкции, кодирующие такие белки, могут быть упакованы в аденоассоциированные вирусные векторы. Введение этих векторов мышам линии mdx (модельная линия, в которой не экспрессируется дистрофии, применяется для изучения и тестирования потенциальных препаратов для лечения миодистрофии Дюшенна) приводило к снижению негативных последствий делеции дистрофина.

В заявке WO2019078916A1 (дата публикации 16 мая 2018) раскрыт микродистрофии ΔR4-R23. Конструкцию, его кодирующую, доставляли с помощью аденоассоциированных векторов серотипа rAAVrh.74 под управлением промотора MHCK7. Авторы наблюдали восстановление мышечных функций и снижение тяжести симптомов дистрофии у мышей линии mdx. В Liu с соавторами (Liu, 2005) микродистрофин ΔR4-R23 доставляли в длинный разгибатель пальцев (extensior digitum longius) с помощью аденоассоциированного вектора серотипа 5. Работа проводилась на мышах линий В10 и mdx. Доставляемый микродистрофин локализуется в сарколеммах мышечных клеток аналогично полноразмерному нативному дистрофину. Отмечено уменьшение количества миофибрилл с центрально-локализованными ядрами, причем эффект был значительнее при доставке микродистрофина в мышцы молодых (пятинедельных) мышей по сравнению со взрослыми (девятимесячными). Частичная экспрессия микродистрофина ΔR4-R23 повышала специфическую сократительную силу мышц и предотвращала понижение сократительной способности мышцы под действием нескольких циклов электростимулированного сокращения.

В заявке US20180148488A1 (дата публикации 31 мая 2018) раскрыты 8 различных конструкций, кодирующих микродистрофины с 4-6 разными спектриновыми повторами и неструктурированными (hinge) доменами. Была продемонстрирована негативная роль неструктурированного домена 2 (hinge 2) в образовании кольцевых миотубул в мышцах (ringbinden). Были продемонстрированы преимущества микро дистрофинов, содержащих спектриновые повторы R15 и R16, обеспечивающие привлечение nNOS на мембрану. В целом, работа демонстрирует потенциал подхода по модификации микродистрофинов, заключающейся в замене/модификации отдельных спектриновых повторов.

Из заявки US20170368198A1 (дата публикации 28 декабря 2018) известны две конструкции минидистрофинов: первая включает N-концевой домен, «шарнирный» домен H1, спектриновые повторы 1, 2, «шарнирный» домен H3, спектриновые повторы 22, 23, 24, «шарнирный» домен Н4, цистеин-богатый домен и фрагмент С-концевого домена. Вторая конструкция аналогична первой, за исключением того, что в ней отсутствует «шарнирный» домен Н3. Применение AAV-векторов, кодирующих конструкцию с доменом Н3 ("miniDys3978") привело к предотвращению негативных последствий делеции дистрофина в мышиной (mdx), крысиной (Dmdmdx) и собачьей (DMD GRMD) модели миодистрофии Дюшенна. Авторы отдельно отмечают низкий иммунный ответ на трансген «miniDys3978». Однако эти данные были получены на крысах.

Все конструкции, основанные на модификации дистрофина, обладают общим недостатком: белок, кодируемый подобными конструкциями, отсутствует у значительной доли пациентов с миодистрофией Дюшенна, и его появление после введения аденоассоциированных вирусных векторов может привести к развитию иммунного ответа на трансген.

Этот недостаток был устранен в заявке WO2013009943A2 (дата публикации 17 января 2013), в которой была предложена конструкция, кодирующая микроутрофин. Этот белок представляет собой производное полноразмерного утрофина с делецией SR4-SR21. В этой работе белок доставлялся в виде микроутрофина, слитого с ТАТ-доменом, облегчающим транспорт белка в целевые ткани; либо с помощью нуклеотидной конструкции. Авторы отмечают положительные эффекты на мышах линии mdx. Однако выбранный способ доставки ограничивает возможности такого подхода.

В работе Song и соавторов (Song, 2019) был предложен ряд конструкций, основанных на утрофине человека (микроутрофин), содержащих N-терминальный, цистеин-богатый и некоторые спектриновые повторы исходного белка. Одним из требований к конструкциям была уменьшенная длина по сравнению с исходным утрофином, что должно было обеспечить сборку аденоассоциированного вектора, кодирующего такую конструкцию. Была предложена конструкция, включающая актин-связьгоающий домен 1, неструктурированный домен H1, спектриновые повторы 1-3, неструктурированный домен Н2, спектриновый домен 22, неструктурированный домен Н4 и цистеин-богатый домен. Данная конструкция продемонстрировала эффективность в предотвращении ряда проявлений миодистрофии Дюшенна в животной модели (дистрофин-дефицитная собака) и сниженную иммуногенность по сравнению с микродистрофином. Этот микроутрофин представляется наиболее близким аналогом заявленному изобретению.

По нашим данным, описанный выше микроутрофин уступает аналогичному по структурной композиции микродистрофину в эффективности, что может быть связано с различием в последовательностях и, соответственно, функциональности определенных доменов белков.

Задачей, на решение которой направлено настоящее изобретение, являлось расширение арсенала средств для заместительной генной терапии миодистрофии Дюшенна, а именно создание генетической конструкции, обеспечивающей равную или повышенную эффективность по сравнению с генетической конструкцией, кодирующей известный из уровня техники микроутрофин.

Задача решается тем, что созданы химерные белки на основе утрофина человека, в которых один или два функциональных домена утрофина заменены на соответствующие им домены дистрофина человека, а также генетические конструкции, кодирующие упомянутые химерные белки, и экспрессионные векторы для доставки упомянутых генетических конструкций в мышечные клетки пациентов. Для замены были выбраны наиболее значительно различающиеся между собой участки утрофина и дистрофина (короткий N-концевой пептид и так называемый «петлевой домен 1» (hinge 1).

Техническим результатом настоящего изобретения являются новые химерные белки для терапии миодистрофии Дюшенна с равной или повышенной эффективностью по сравнению с известным из уровня техники микроутрофином.

Сущность изобретения

Сущность созданного технического решения заключается в следующем:

Предлагаются химерные белки, имеющие в своем составе структурные домены дистрофина и утрофина человека; также предлагаются нуклеиновые кислоты, кодирующие упомянутые химерные белки. Упомянутые нуклеиновые кислоты могут быть доставлены в мышцы пациентов, страдающих от миодистрофии Дюшенна, с помощью известных из уровня техники экспрессионных векторов, например, аденоассоциированных вирусных векторов, плазмид, а также наночастиц и т.д.

В состав первого химерного белка входят следующие структурные домены:

- N-терминальный домен утрофина (здесь и далее человека);

- первый неструктурированный домен дистрофина (hinge 1);

- спектриновые повторы 1, 2, 3 утрофина;

- второй неструктурированный домен утрофина (hinge 2);

- спектриновый повтор 22 утрофина;

- четвертый неструктурированный домен утрофина (hinge 4);

- цистеин-богатый (CR) домен утрофина;

- олигопептид QAM, кодируемый экзоном 74 утрофина человека (Фиг. 1).

Конструкция первого химерного белка по настоящему изобретению отличается от конструкции, описанной в статье Song с соавторами, заменой домена H1. Последовательность известного из статьи Song с соавторами белка содержит домен H1 утрофина, а в последовательности химерного белка по настоящему изобретению домен H1 дистрофина. Дополнительно в химерном белке по настоящему изобретению присутствует олигопептид, кодируемый концевым экзоном утрофина: три аминокислоты QAM, находящиеся на С-конце утрофина.

В состав второго химерного белка входят следующие структурные домены:

- пептид, кодируемый первым экзоном дистрофина;

- N-терминальный домен утрофина, не включающий пептид, кодируемый первым экзоном утрофина;

- первый неструктурированный домен дистрофина (hinge 1);

- спектриновые повторы 1,2,3 утрофина;

- второй неструктурированный домен утрофина (hinge 2);

- спектриновый повтор 22 утрофина;

- четвертый неструктурированный домен утрофина (hinge 4);

- цистеин-богатый (CR) домен утрофина;

- олигопептид QAM, кодируемый экзоном 74 утрофина человека (Фиг. 1).

В отличие от конструкции первого химерного белка по настоящему изобретению, конструкция второго химерного белка содержит пептид, кодируемый первым экзоном дистрофина вместо пептида, кодируемого первым экзоном утрофина.

Предлагаемые химерные белки содержат актин-связывающий домен, цистеин-богатый домен и 4 спектриновых повтора утрофина, что позволяет им связываться с актином и белками сарколеммы и эффективно встраиваться в дистрофин-ассоциированный белковый комплекс, что уже ранее было показано для аналогичных по структурной композиции микроутрофинов (Song, 2019). Кроме того, в химерных белках по настоящему изобретению укороченный первый неструктурированный домен утрофина (hinge 1) заменен на более длинный первый неструктурированный домен дистрофина. В одном из вариантов осуществления изобретения дополнительно N-терминальный пептид утрофина заменен на более короткий N-терминальный пептид дистрофина, что может оптимизировать длину химерного белка. Так как основная часть (более 90%) белковой последовательности предлагаемых конструкций гомологична утрофину человека, который всегда экспрессируется в эмбриональной стадии, ожидается сниженный иммунный ответ на химерные белки по настоящему изобретению.

Ранее нами были проведены эксперименты, в которых мы сравнивали эффективность микродистрофина и микроутрофина, сходных по доменной структуре (микродистрофин, аналогичный описанному у Sarepta - NCT02376816 и микроутрофин, аналогичный описанному в Song et al, 2019). Каждая из этих конструкций содержит N-концевой домен, первый неструктурированный домен (H1), три первых спектриновых повтора, второй неструктурированный домен (Н2), последний (24й - для дистрофина, и 22й - для утрофина) спектриновый повтор, четвертый неструктурированный домен (Н4), и цистеин-богатый домен. N-концевой домен и цистеин-богатый домен являются абсолютно необходимыми для функционирования белка, в то время как центральная часть может быть более вариабельна. В наших экспериментах микроутрофин демонстрировал сниженную эффективность по сравнению с микродистрофином. Это проявлялось в менее выраженных «защитных» эффектах микроутрофина на мышах линии mdx. Сравнение последовательностей микродистрофина и микроутрофина, использованных в экспериментах, показало наибольшие различия в двух доменах этих конструкций. Это N-концевой пептид, кодируемый первым экзоном каждого гена и предшествующий функциональной части актин-связывающего домена. Второй домен - это неструктурированный шарнирный повтор 1 (hinge 1), который у дистрофина почти в два раза длиннее, чем у утрофина (97 аминокислотных остатков против 51). Необходимо отметить, что микродистрофин и микроутрофин значительно короче полноразмерных форм соответствующих белков. Вероятно, именно дополнительное сокращение физической длины белка и снижение его гибкости за счет значительного сокращения самого гибкого из доменов белка приводит к снижению эффективности микроутрофина. Замена его на аналог из дистрофина может увеличить эффективность микроутрофина.

В состав предлагаемых конструкций также вводится С-концевой олигопептид QAM, который кодируется последним, 74-м экзоном полноразмерного утрофина человека. Данная модификация вводится для стабилизации белка, так как имеются данные по нестабильности изоформ дистрофина, в которых последний трехаминокислотный олигопептид заменен (Greener, 2002). Аналогичная модификация для микродистрофина применялась в конструкции, предлагаемой в заявке WO2001083695A2.

Также в настоящей заявке предлагаются рекомбинантные нуклеиновые кислоты, кодирующие химерные белки по заявленному изобретению. Рекомбинантная нуклеиновая кислота доставляется в составе доступного экспрессионного вектора в клетки организма, которому требуется лечение, с упомянутой нуклеиновой кислоты экспрессируется химерный белок, включающий в себя как структурные домены утрофина человека, так и структурные элементы дистрофина человека.

Также в настоящей заявке предлагаются экспрессионные векторы на основе AAV, несущие ген, кодирующий одну из заявленных химерных конструкций на основе микроутрофина.

Последовательность предлагаемых в данной заявке конструкций более чем на 90% совпадает с последовательностью доменов утрофина человека, что обеспечивает ее низкую иммуногенность в соответствии с данными, известными из уровня техники. В то же время, конструкции по настоящему изобретению демонстрируют лучшую эффективность по сравнению с микроутрофином при введении в мышиную модель миодистрофии Дюшенна.

Детальное описание изобретения

Определения

Если не указано иначе, предполагается, что все термины данной области, обозначения и другие научные термины или терминология, используемая в данной заявке, имеют значения, которые обычно понимают специалисты в области, к которой относится настоящее изобретение. В некоторых случаях, определения терминов с общепринятыми значениями приведены в данной заявке для ясности и/или для быстрой справки и понимания, и включение таких определений в настоящее описание не обязательно должно истолковываться как наличие существенного отличия значения термина от обычно подразумеваемого в данной области.

Термин «химерный белок» обозначает белок, в аминокислотной последовательности которого присутствуют фрагменты

последовательностей как минимум двух различных белков. Белки могут быть из одного организма или из различных организмов.

Термин «экспрессионный вектор» обозначает вектор, содержащий нуклеиновую кислоту, содержащую промоторную область, необходимые регуляторные элементы и открытую рамку считывания. С экспрессионного вектора должен экспрессироваться функциональный белок. Экспрессионный вектор может быть вирусным или невирусным.

«N-терминальный домен», или «N-концевой домен» - структурный домен белка, расположенный на N-конце белка. Применительно к дистрофину, под N-терминальным доменом понимается фрагмент белка, начинающийся с аминокислоты 1 и заканчивающийся аминокислотой 240 (в соответствии с последовательностью, приведенной в базе Uniprot, ID P11532, https://www.uniprot.org/). Применительно к утрофину, под N-терминальным доменом понимается фрагмент белка, начинающийся с аминокислоты 1 и заканчивающийся аминокислотой 255 (в соответствии с последовательностью, приведенной в базе Uniprot, ID Р46939).

«актин-связывающий домен» - структурный и функциональный домен, присутствующий в дистрофине, утрофине и еще ряде белков. Основным свойством актин-связывающего домена является способность эффективно связывать актин. Применительно к дистрофину, актин-связывающим доменом называют фрагмент белка, начинающийся с аминокислоты 15 и заканчивающийся аминокислотой 240 (в соответствии с последовательностью, приведенной в базе Uniprot, ID P11532). Применительно к утрофину, актин-связьшающим доменом называют фрагмент белка, начинающийся с аминокислоты 31 и заканчивающийся аминокислотой 255 (в соответствии с последовательностью, приведенной в базе Uniprot, ID Р46939). Актин-связывающий домен практически полностью перекрывается с N-терминальным доменом, однако не является полностью ему тождественным, так как короткий N-концевой пептид (14 ак для дистрофина, 30 ак для утрофина), по всей видимости, не несет известной структурной и функциональной нагрузки, и не включается в состав актин-связывающего домена.

«центральный домен», или «стержневой домен» - структурный и функциональный домен белков дистрофина и утрофина. Применительно к дистрофину, центральным доменом называют фрагмент белка, начинающийся с аминокислоты 241 и заканчивающийся аминокислотой 3054 (в соответствии с последовательностью, приведенной в базе Uniprot, ID P11532). Применительно к утрофину, центральным доменом называют фрагмент белка, начинающийся с аминокислоты 256 и заканчивающийся аминокислотой 2811 (в соответствии с последовательностью, приведенной в базе Uniprot, ID Р46939). Центральный домен состоит из 24х (для дистрофина) или 22х (для утрофина) спектриновых повторов и четырех неструктурированных доменов.

«спектриновые повторы» - структурные домены, свойственные дистрофину, утрофину и еще ряду белков. Применительно к дистрофину и утрофину, включаются в состав центрального домена. Представляют собой обособленные домены, каждый из которых образован тремя альфа-спиралями, организованными в т.н. coiled coil структуру.

«неструктурированные домены», так же «hinge domains» («петлевые домены», «hinge» (англ.) - «петля») - домены, свойственные дистрофину и утрофину. Входят в состав центрального домена. Для каждого белка выделяют четыре неструктурированных домена, называемые H1, Н2, Н3, Н4. Третичная структура этих доменов на данный момент неизвестна, предполагается, что в них отсутствуют какие-либо стандартные элементы вторичной структуры, такие, как альфа-спирали или бета-листы. Функции этих доменов также доподлинно неизвестны, предполагается, что за счет отсутствия элементов вторичной структуры эти домены обеспечивают дополнительную гибкость молекуле дистрофина/утрофина. Применительно к дистрофину, доменом H1 называют фрагмент белка, начинающийся с аминокислоты 241 и заканчивающийся аминокислотой 338; доменом Н2 называют фрагмент белка, начинающийся с аминокислоты 668 и заканчивающийся аминокислотой 718; доменом Н3 называют фрагмент белка, начинающийся с аминокислоты 2427 и заканчивающийся аминокислотой 2468; доменом Н4 называют фрагмент белка, начинающийся с аминокислоты 3041 и заканчивающийся аминокислотой 3054 (в соответствии с последовательностью, приведенной в базе Uniprot, ID P11532). Применительно к утрофину, доменом H1 называют фрагмент белка, начинающийся с аминокислоты 256 и заканчивающийся аминокислотой 308; доменом Н2 называют фрагмент белка, начинающийся с аминокислоты 638 и заканчивающийся аминокислотой 686; доменом Н3 называют фрагмент белка, начинающийся с аминокислоты 2187 и заканчивающийся аминокислотой 2228; доменом Н4 называют фрагмент белка, начинающийся с аминокислоты 2798 и заканчивающийся аминокислотой 2811 (в соответствии с последовательностью, приведенной в базе Uniprot, ID Р46939).

«цистеин-богатый (CR) домен» - структурный и функциональный домен дистрофина и утрофина, обеспечивающий связывание этих белков с белками дистрофин-ассоциированного белкового комплекса на сарколемме миотубул. Применительно к дистрофину, цистеин-богатым доменом называют фрагмент белка, начинающийся с аминокислоты 3055 и заканчивающийся аминокислотой 3345 (в соответствии с последовательностью, приведенной в базе Uniprot, ID P11532). Применительно к утрофину, цистеин-богатым доменом называют фрагмент белка, начинающийся с аминокислоты 2812 и заканчивающийся аминокислотой 3102 (в соответствии с последовательностью, приведенной в базе Uniprot, ID Р46939).

Предлагаются генетические конструкции, позволяющие с помощью экспрессионного вектора доставлять в клетки генетический материал, кодирующий химерные белки, предназначенные для функциональной замены отсутствующего дистрофина у пациентов с миодистрофией Дюшенна. Настоящее изобретение может применяться для лечения этого заболевания.

В состав первого химерного белка, именуемого в дальнейшем Н1-Н-Comi-UTRN, входят следующие структурные домены:

- N-терминальный домен утрофина (аминокислоты 1-255 утрофина человека Р46939 (здесь и далее - по базе данных Uniprot:);

- первый неструктурированный домен дистрофина (hinge 1) (аминокислоты 241-342 дистрофина человека P11532);

- спектриновые повторы 1, 2, 3 утрофина - второй неструктурированный домен утрофина (hinge 2) (координаты аминокислот 312-685 утрофина человека Р46939);

- спектриновый повтор 22 утрофина - четвертый неструктурированный домен утрофина (hinge 4) - цистеин-богатый (CR) домен и фрагмент С-концевого домена утрофина человека (координаты аминокислот 2690-3165 утрофина человека Р46939);

- олигопептид QAM, кодируемый экзоном 74 утрофина человека (координаты аминокислот 3431-3433 утрофина человека Р46939).

В состав химерного белка 2 (именуемого в дальнейшем Н1-Ех1-Н-Comi-UTRN входят следующие структурные домены:

- пептид, кодируемый первым экзоном дистрофина человека (координаты аминокислот 1-14 дистрофина человека Р11532);

- актин-связывающий домен утрофина, не включающий пептид, кодируемый первым экзоном утрофина человека (координаты аминокислот 31-255 утрофина человека Р46939);

- первый неструктурированный домен дистрофина (hinge 1) (аминокислоты 241-342 дистрофина человека P11532);

- спектриновые повторы 1, 2, 3 утрофина - второй неструктурированный домен утрофина (hinge 2) (координаты аминокислот 312-685 утрофина человека Р46939);

- спектриновый повтор 22 утрофина - четвертый неструктурированный домен утрофина (hinge 4) - цистеин-богатый (CR) домен и фрагмент С-концевого домена утрофина человека (координаты аминокислот 2690-3165 утрофина человека Р46939);

- олигопептид QAM, кодируемый экзоном 74 утрофина человека (координаты аминокислот 3431-3433 утрофина человека Р46939).

Принципиальные схемы предлагаемых конструкций представлены на Фиг. 1.

Изобретение иллюстрируется следующими графическими материалами.

На Фиг. 1 представлена принципиальная схема предложенных конструкций. Темным отмечены домены полноразмерного человеческого утрофина, включенные в состав предлагаемых конструкций. Светлым отмечены домены человеческого утрофина, не включенные в предлагаемые конструкции. Штриховкой отмечены домены предлагаемых конструкций, соответствующие доменам человеческого дистрофина. Белок 1 - Н1-Н-Comi-UTRN; белок 2 - Ex1-H1-H-Comi-UTRN.

На Фиг. 2 представлено наличие геномных копий вектора AAV9 в передней большеберцовой мышце (tibialis anterior, ТА) и сердце мышей линии В10 (получали плацебо - DPBS), мышей линии mdx, получавших плацебо, и мышей линии mdx, получавших AAV9-H1-H-comi-UTRN.

На Фиг. 3 представлены уровни экспрессии мРНК H1-H-Comi-UTRN. Представлено количество копий транскрипта H1-H-Comi-UTRN на 100 нг кДНК в сердце, икроножной мышце (GAS), трицепсе, передней большеберцовой мышце (ТА) и диафрагме.

На Фиг. 4 представлена оценка содержания продукта трансляции H1-H-Comi-UTRN (белок H1-H-Comi-UTRN) с помощью вестерн блота в сердечной и передней большеберцовой мышцах мышей. Представлен анализ содержания тотального утрофина в сердце и передней большеберцовой мышце мыши дикого типа (В10), дистрофии-дефицитной мыши, получавшей плацебо (mdx), и двух дистрофии-дефицитных мышей, получавших AAV9-H1-H-Comi-UTRN (HI). Стрелкой указано расчетное положение полосы, соответствующей H1-H-Comi-UTRN (~139 кДа).

На Фиг. 5 представлено распределение альфа-саркогликана в большой передней большеберцовой мышце мыши линии В10 (А); мыши линии mdx, получавшей плацебо (Б) и мыши линии mdx, получавшей AAV9-H1-H-Comi-UTRN (В).

На Фиг. 6 представлены уровни креатинкиназы в сыворотке крови мышей. Измерение уровней креатинкиназы было проведено спустя 5 месяцев после введения тестируемых конструкций. Данные представлены в виде «ящика с усами». Представлены средние значения, квартили и предельные значения для каждой группы. Точками представлены единичные данные. В таблице представлены средние значения для каждой группы со стандартными отклонениями (U/L).

На Фиг. 7 представлена динамика изменения усредненного максимального времени висения на проволоке для мышей линии В10 (В10), получивших плацебо; мышей линии mdx, получивших плацебо (mdx); мышей линии mdx, получивших AAV9-miDMD (DMD); мышей линии mdx, получивших AAV9-H-Comi-UTRN (UTRN), мышей лиинии mdx, получивших AAV9-H1-H-Comi-UTRN (H1) и мышей линии mdx, получивших AAV9-H1-Exl-H-Comi-UTRN (Exl-H1). Представлены стандартные ошибки среднего для каждого измерения. * р-value<0.05 для групп "mdx+DPBS" и "mdx+AAV9-H1-H-Comi-UTRN"; | p-value<0.05 для групп "mdx+DPBS" и "mdx+AAV9-H-Comi-UTRN.

На Фиг. 8 представлены средние значения удельной силы передней большеберцовой мышцы для мышей линии В10; мышей линии mdx, получивших плацебо; мышей линии mdx, получивших AAV9-miDMD; мышей линии mdx, получивших AAV9-H-Comi-UTRN и мышей линии mdx, получивших AAV9-H1-H-Comi-UTRN. Указаны стандартные ошибки среднего для каждой группы.

На Фиг. 9 представлены средние значения площади поперечного сечения (CSA) передней большеберцовой мышцы для мышей линии В10; мышей линии mdx, получивших плацебо; мышей линии mdx, получивших AAV9-miDMD; мышей линии mdx, получивших AAV9-H-Comi-UTRN и мышей линии mdx, получивших AAV9-H1-H-Comi-UTRN. Указаны стандартные ошибки среднего для каждой группы.

На Фиг. 10 представлена динамика снижения силы передней большеберцовой мышцы при эксцентрических сокращениях передней большеберцовой мышцы мышей линии В10; мышей линии mdx, получивших плацебо; мышей линии mdx, получивших AAV9-miDMD (DMD); мышей линии mdx, получивших AAV9-H-Comi-UTRN (UTRN) и мышей линии mdx, получивших AAV9-H1-H-Comi-UTRN (H1). Указаны стандартные ошибки среднего для каждой группы.

Изобретение поясняется следующими примерами

Заявленные химерные белки синтезировались с генетических конструкций, доставленных с помощью аденоассоциированных вирусных экспрессионных векторов in vivo в животной модели миодистрофии Дюшенна: мышах линии mdx, которые не экспрессируют дистрофии и демонстрируют ряд фенотипических признаков, аналогичных симптомам у пациентов с миодистрофией Дюшенна (Bulfield et al. 1984).

Пример 1. Генетические конструкции.

Получение конструкций, использованных в данной работе, производилось с использованием стандартных методов клонирования.

Получение конструкций pAAV-miDMD и pAAV-H-Comi-UTRN. За основу были взяты последовательности, кодирующие полноразмерный дистрофии и полноразмерный утрофин, и представленные в базе данных NCBI: ID NM_004006.3 (Homo sapiens dystrophin (DMD), transcript variant Dp427m, mRNA) и ID: NM_007124.3 (Homo sapiens utrophin (UTRN), transcript variant 1, mRNA). На базе этих последовательностей были получены последовательности, кодирующие «укороченные» варианты дистрофина (ΔR4-R23/ΔCT) из статьи Liu et al., 2005, и утрофина (ΔR2-R21/ΔCT). Для этих последовательностей была проведена оптимизация кодонов (Foster at al, 2008). Синтез последовательностей, фланкированных сайтами рестрикции, заказывали в компании Shanghai ShineGene Molecular Bio-Technologies, Китай. В результате были получены конструкции pMV-miDMD и pMV-H-Comi-UTRN. Далее последовательности, кодирующие miDMD и H-Comi-UTRN, были лигированы в плазмиду pAAV-CMV-eGFP-sv40polyA вместо гена eGFP.

Получение pAAV-H1-H-Comi-UTRN и pAAV-H1-Exl-H-Comi-UTRN. Для получения последовательностей, кодирующих химерные белки Н-Comi-UTRN-H1 и Exl-H-Comi-UTRN-H1, плазмиду pAAV-CMV-H-Comi-UTRN разрезали по сайтам рестрикции BamHI/Eco72I. Фрагмент гена микродистрофина, кодирующий Hinge 1, аплифицировали с матрицы pAAV-CMV-miDMD. Оставшиеся фрагменты гена микроутрофина амплифицировали с матрицы pAAV-CMV-H-Comi-UTRN. Для создания конструкции pAAV-Exl-H1-H-Comi-UTRN амплифицировали фрагмент гена микродистрофина, кодирующий Exon 1. Цитирование всех фрагментов осуществляли по методу Гибсона с использованием набора NEBuilder® HiFi DNA Assembly Cloning Kit.

Аденоассоциированные вирусные экспрессионные векторы серотипа 9 были получены с помощью тройной трансфекции клеток HEK293T (метод широко применяется для получения AAV и многократно описан, например, в работе Xiao et al, 1998. Вкратце, готовится эквимолярная смесь трех плазмид: целевая плазмида, кодирующая одну из вышеуказанных генетических конструкций; плазмида, кодирующая белки аденоассоциированного вируса Rep и Сар; плазмида, кодирующая вспомогательные белки аденовируса (pHelper). Адгезионные клетки линии HEK293T трансфецируются указанной смесью в присутствии линейного полиэтиленимина). Аденоассоциированный вектор был очищен с помощью ультрацентрифугирования в градиенте иодиксанола с последующим диализом.

Для анализа результатов применялись стандартные методы. Для оценки содержания геномной ДНК и копий мРНК трансгена использовалась количественная ПЦР в реальном времени, для оценки содержания химерных белков - продуктов экспрессии, - использовался иммуноблотинг, для оценки содержания и локализации белка дистрофин-ассоциированного протеинового комплекса альфа-саркогликана использовалась иммуногистохимия. Для оценки функциональной эффективности тестируемых конструкций использовались стандартные методы физиологии - оценка уровня креатинфосфокиназы (СК), силы сокращения мышц, поперечного сечения мышц, среднего времени зависания на проволоке.

Пример 2. Использование экспрессионных векторов в мышиной модели миодистрофии Дюшенна.

Аденоассоциированный вирусный вектор, кодирующий химерный белок H1-H-Comi-UTRN (AAV9-H1-H-Comi-UTRN), был введен внутривенно 5-недельным мышам линии mdx в концентрации 6,414 гк/кг. Второй группе мышей линии mdx вводили аденоассоциированный вектор, кодирующий другой химерный белок: H1-Exl-H-Comi-UTRN (AAV9-H1-Exl-H-Comi-UTRN). Третьей группе мышей введен аденоассоциированный вектор, кодирующий H-Comi-UTRN (AAV9-HComi-UTRN). Четвертой группе был введен аденоассоциированный вектор, кодирующий микродистрофин (AAV9-miDMD), аналогичный микродистрофину компании Sarepta). Во всех случаях доза вектора составляла 6,414 гк/кг. Группа мышей линий В10 и еще одна группа мышей линии mdx использовались как контрольные, им было введено плацебо (DPBS). Эксперимент был терминирован через 19 недель после введения.

Пример 3. Эффективность химерных белков.

Эффективность доставки и наличие трансгена оценивалось для контрольных групп и группы мышей, получавших AAV9-H1-H-Comi-UTRN; функциональные параметры оценивались для контрольных групп, группы, получавшей AAV9-H-Comi-UTRN, AAV9-H1-H-Comi-UTRN, AAV9-Exl-H1-H-Comi-UTRN и AAV9-miDMD.

Пример 3.1 Оценка уровня экспрессии генетической конструкции.

В сердце и передней большеберцовой мышце (ТА) методом ПЦР в реальном времени было оценено количество копий вирусного генома. Оно превышало 105 на 1 мкг геномной ДНК для обеих мышц. Так же было оценено количество молекул мРНК трансгена на 100 нг кДНК в сердце, икроножной, передней большеберцовой мышцах, трицепсе и диафрагме. Наибольшее количество копий трансгена было обнаружено в трицепсе и передней большеберцовой мышцах (более 106 копий на 100 нг кДНК). Значительное количество копий целевого транскрипта было зафиксировано в икроножной мышце и сердце (более 105 копий на 100 нг кДНК). Более 103 копий на 100 нг кДНК трансгена было также зафиксировано в диафрагме (Фиг. 3). Таким образом, трансген был обнаружен в пяти различных мышцах, представляющих все три значимых типа мышц, испытывающих деградацию при миодистрофии Дюшенна (сердце, диафрагма, скелетные мышцы).

С помощью метода вестерн-блот было показано наличие белка весом 139 kDa в сердце и большой переднеберцовой мышцах (Фиг. 4). С помощью метода иммуногистохимии с применением антител против мышиного альфа-саркогликана у мышей линии mdx, получивших AAV9-H1-H-comi-UTRN детектировались волокна, в которых наблюдался мембранно-ассоциированный компонент дистрофин-ассоциированного протеинового комплекса альфа-саркогликан, в то время как у мышей линии mdx, получивших плацебо, альфа-саркогликан не детектировался (Фиг. 5). Это указывает на частичное восстановление дистрофин-ассоциированного протеинового комплекса в присутствии трансгена H1-H-comi-UTRN.

Пример 3.2. Оценка функционального состояния мышц в мышиной модели миодистрофии Дюшенна.

Введение конструкции, кодирующей химерный белок - аналог дистрофина, должно приводить к улучшению состояния модельных мышей. Анализ активности креатининфосфокиназы (маркера повреждения мышц при миодистрофии Дюшенна) в сыворотке крови мышей после терминации показал незначительное снижение активности CK у мышей, получивших AAV9-H1-H-comi-UTRN (Фиг. 6).

На всем протяжении эксперимента проводились еженедельные (кроме недели 2 и 9) оценки выносливости мышей - определение времени виса на проволоке (идентификатор СОП по TREAT-NMD: DMD_M.2.1.004). Мыши, получавшие AAV9-H1-H-comi-UTRN, уже с десятой недели эксперимента могли провисеть на проволоке в среднем дольше, чем мыши из группы mdx, получившие плацебо, что говорит о функциональном улучшении состояния мышц животных под действием AAV9-H1-H-comi-UTRN. Аналогичные результаты, однако с несколько меньшей эффективностью, были показаны и для группы мышей, получавшей AAV9-H-Comi-UTRN. Интересно, что мыши, получавшие AAV9-miDMD, демонстрировали лучшие результаты в течение первой половины эксперимента, однако несколько ухудшили результаты ближе к концу эксперимента (при сравнении с AAV9-H-Comi-UTRN). Мыши, получавшие AAV9-H1-Exl-H-comi-UTRN, также демонстрировали несколько лучшее среднее время висения по сравнению с мышами mdx, получавшими плацебо (наиболее заметна эта разница для 15 и 17 недели эксперимента), что позволяет нам уверенно говорить о тренде улучшения функциональности мышц после введения генетических конструкций по настоящему изобретению (Фиг. 7).

После окончания эксперимента была оценена удельная сила передней большеберцовой мышцы (ТА). Удельная сила ТА у мышей, получивших AAV9-H1-H-comi-UTRN (43 кН/мм2), превышала удельную силу ТА контрольных мышей линии mdx (33 кН/мм2), однако была значительно ниже удельной силы ТА мышей В10 (82 кН/мм2). Удельная сила ТА у мышей, получавших AAV9-H-Comi-UTRN (47 кН/мм2), так же превышала удельную силу у мышей линии mdx, получавших плацебо, и незначительно превышала удельную силу ТА у мышей, получивших AAV9-H1-H-comi-UTRN. Удельная сила ТА у мышей, получавших AAV9-miDMD (57 кН/мм2) значительно превышала удельную силу у мышей линии mdx, получавших плацебо, и превышала удельную силу ТА у мышей, получивших AAV9-H1-H-comi-UTRN и AAV9-H-Comi-UTRN (Фиг. 8). При этом в среднем площадь поперечного сечения мышцы ТА у мышей, получивших AAV9-H1-H-comi-UTRN (9.12 мм2) и AAV9-H-comi-UTRN (9.10 мм2) была меньше, чем у мышей линии mdx, получивших DPBS (10.73 мм2). Площадь поперечного сечения ТА у мышей линии mdx, получивших AAV9-miDMD, составляла 8,5 мм2 - несколько ниже, чем у групп, получавших AAV9-H1-H-comi-UTRN и AAV9-H-comi-UTRN. Площадь поперечного сечения ТА мышей линии В10 составила 6,23 мм2 (Фиг. 9).

Была также оценена относительная потеря силы мышцы ТА после серии из 7 эксцентрических сокращений. В то время, как относительная потеря в группе В10 составила примерно 1/3 (31%) от исходной, в группе мышей линии mdx потеря составила 2/3 (69%). Потеря силы мышц в группе мышей, получивших AAV9-H1-H-comi-UTRN (47%), была меньше, чем в группе контрольных линии mdx и незначительно меньше, чем в группе мышей, получавших AAV9-H-comi-UTRN (58%). Интересно, что в группе мышей, получавших AAV9-miDMD, потеря силы мышцы составила 80% (Фиг. 10).

Таким образом, экспериментально было показано, что с экспрессиоиного вектора AAV9-H1-H-Comi-UTRN экспрессируется РНК и белок, частично гомологичный утрофину. Было проведено сравнение функциональности векторов, кодирующих белки микродистрофин (miDMD) и микроутрофин (UTRN), обладающие сходной доменной организацией и в настоящее время рассматриваемые как кандидаты для заместительной терапии, и вектора, кодирующего химерный белок H1-H-Comi-UTRN. Все указанные белки частично снижали степень проявления дистрофии в мышах линии mdx. При оценке удельной силы сокращения мышцы ТА наилучший результат показала конструкция miDMD, в то время как H1 и UTRN были практически идентичны. При оценке снижения эффективности сокращения мышцы в результате эксцентрического сокращения наилучший результат продемонстрировала конструкция H1. Аналогично, H1 продемонстрировала лучший результат при длительной оценке общего физического состояния животных - теста зависания на проволоке. Это достаточно интересное наблюдение, которое может объясняться разной эффективностью встраивания и функционирования этих конструкций в клетках различных мышц и при различных типах нагрузки, так как распределение, экспрессия и стабильность, предположительно, у этих конструкций одинакова (выбраны одинаковый вектор и промотор, концентрации и способы введения идентичны). В тесте зависания на проволоке был также исследован экспрессионный вектор, кодирующий химерный белок Exl-H1-H-Comi-UTRN, который показал эффективность наравне с белком H1-H-Comi-UTRN.

Наиболее важным нам представляется тест зависания на проволоке, так как он является, во-первых, динамическим тестом, позволяющим оценить состояние тестируемых животных на протяжении длительного периода времени, и во-вторых, он является своеобразным отдаленным аналогом физических тестов, применяемых для оценки результатов терапии в клинических испытаниях. При прохождении этого теста задействуются разные группы мышц, к тому же, его результаты зависят и от общего состояния организма (хотя в некоторых случаях это может и нарушить результаты теста).

Таким образом, у мышей линии mdx, получивших AAV9-H1-H-comi-UTRN и AAV9-Exl-H1-H-Comi-UTRN, отмечалось снижение остроты проявления признаков, соответствующих миодистрофии Дюшенна. Белки H1-H-comi-UTRN и Exl-H1-H-Comi-UTRN превосходили по своей эффективности «стандартный» микроутрофин H-comi-UTRN и незначительно уступали, а в некоторых тестах и превосходили «стандартный» микродистрофин miDMD. Это подтверждает возможность применения конструкции H1-H-comi-UTRN или Exl-H1-H-Comi-UTRN для заместительной терапии у пациентов с миодистрофией Дюшенна. Полученные данные подтверждают решение настоящим изобретением поставленной технической задачи, поскольку полученные химерные белки более эффективны, чем микроутрофин, в комплексном тесте на выносливость в мышиной модели миодистрофии Дюшенна.

СПИСОК ЛИТЕРАТУРЫ

Bulfield, G., W.G. Siller, P.A. Wight, and K.J. Moore (1984) X Chromosome-Linked Muscular Dystrophy (mdx) in the Mouse // Proceedings of the National Academy of Sciences of the United States of America 81 (4): 1189-92.

Culligan, K.G., A.J. Mackey, D.M. Finn, P.B. Maguire, and K. Ohlendieck (1998) Role of Dystrophin Isoforms and Associated Proteins in Muscular Dystrophy (review) // International Journal of Molecular Medicine 2 (6): 639-48.

Duan, Dongsheng (2018) Systemic AAV Micro-Dystrophin Gene Therapy for Duchenne Muscular Dystrophy // Molecular Therapy: The Journal of the American Society of Gene Therapy 26 (10): 2337-56.

Ferrer, А., K.E. Wells, and D.J. Wells (2000) Immune Responses to Dystrophin: Implications for Gene Therapy of Duchenne Muscular Dystrophy // Gene Therapy 7 (17): 1439-46.

Foster H, Sharp PS, Athanasopoulos T, Trollet C, Graham IR, Foster K, Wells DJ, Dickson G. Codon and mRNA sequence optimization of microdystrophin transgenes improves expression and physiological outcome in dystrophic mdx mice following AAV2/8 gene transfer. Mol Ther. 2008 Nov; 16(11):1825-32. doi: 10.1038/mt.2008.186. Epub 2008 Sep 2. PMID: 18766174.

Greener MJ, Sewry CA, Muntoni F, Roberts RG. The 3'-untranslated region of the dystrophin gene - conservation and consequences of loss. Eur J Hum Genet. 2002 Jul; 10(7):413-20. doi: 10.1038/sj.ejhg.5200822. PMID: 12107815.

Liu M, Yue Y, Harper SQ, Grange RW, Chamberlain JS, Duan D. (2005) Adeno-associated virus-mediated microdystrophin expression protects young mdx muscle from contraction-induced injury // Molecular Therapy 11 (2): 245-56.

Mendell, Jerry R., Katherine Campbell, Louise Rodino-Klapac, Zarife Sahenk, Chris Shilling, Sarah Lewis, Dawn Bowles, et al. (2010) Dystrophin Immunity in Duchenne's Muscular Dystrophy // The New England Journal of Medicine 363 (15): 1429-37.

Song, Y., Morales, L., Malik, A.S. et al. Non-immunogenic utrophin gene therapy for the treatment of muscular dystrophy animal models // Nature Medicine 25: 1505-1511.

Tinsley, J.M., and K.E. Davies (1993) Utrophin: A Potential Replacement for Dystrophin? // Neuromuscular Disorders: NMD 3 (5-6): 537-39.

Xiao X, Li J, Samulski RJ. Production of high-titer recombinant adeno-associated virus vectors in the absence of helper adenovirus. J Virol. 1998 Mar; 72(3):2224-32. doi: 10.1128/JVI.72.3.2224-2232.1998. PMID: 9499080; PMCID: PMC109519.

--->

Перечень последовательностей

<110> Общество с ограниченной ответственностью «Марлин Биотех»

Marlin Biotech LLC

<120> Химерные белки на основе утрофина и дистрофина человека и

их применение для лечения миодистрофии Дюшенна

<130>

<160> 4

<210> 1

<211> 1209

<212> белок

<213> Искусственная последовательность

<220>

<222> (1)...(1209)

<223> H1-H-Comi-UTRN

<400> 1

Met Ala Lys Tyr Gly Glu His Glu Ala Ser Pro Asp Asn Gly Gln Asn

1 5 10 15

Glu Phe Ser Asp Ile Ile Lys Ser Arg Ser Asp Glu His Asn Asp Val

20 25 30

Gln Lys Lys Thr Phe Thr Lys Trp Ile Asn Ala Arg Phe Ser Lys Ser

35 40 45

Gly Lys Pro Pro Ile Asn Asp Met Phe Thr Asp Leu Lys Asp Gly Arg

50 55 60

Lys Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Thr Ser Leu Pro Lys

65 70 75 80

Glu Arg Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Arg Val

85 90 95

Leu Gln Val Leu His Gln Asn Asn Val Glu Leu Val Asn Ile Gly Gly

100 105 110

Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Leu Trp

115 120 125

Ser Ile Ile Leu His Trp Gln Val Lys Asp Val Met Lys Asp Val Met

130 135 140

Ser Asp Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val

145 150 155 160

Arg Gln Thr Thr Arg Pro Tyr Ser Gln Val Asn Val Leu Asn Phe Thr

165 170 175

Thr Ser Trp Thr Asp Gly Leu Ala Phe Asn Ala Val Leu His Arg His

180 185 190

Lys Pro Asp Leu Phe Ser Trp Asp Lys Val Val Lys Met Ser Pro Ile

195 200 205

Glu Arg Leu Glu His Ala Phe Ser Lys Ala Gln Thr Tyr Leu Gly Ile

210 215 220

Glu Lys Leu Leu Asp Pro Glu Asp Val Ala Val Gln Leu Pro Asp Lys

225 230 235 240

Lys Ser Ile Ile Met Tyr Leu Thr Ser Leu Phe Glu Val Leu Pro Gln

245 250 255

Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg Pro

260 265 270

Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met His

275 280 285

Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg Thr

290 295 300

Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala Ala

305 310 315 320

Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln His

325 330 335

Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu Ser

340 345 350

Glu Val Asn Leu Asp Ser Tyr Gln Ile Ala Leu Glu Glu Val Leu Thr

355 360 365

Trp Leu Leu Ser Ala Glu Asp Thr Phe Gln Glu Gln Asp Asp Ile Ser

370 375 380

Asp Asp Val Glu Glu Val Lys Asp Gln Phe Ala Thr His Glu Ala Phe

385 390 395 400

Met Met Glu Leu Thr Ala His Gln Ser Ser Val Gly Ser Val Leu Gln

405 410 415

Ala Gly Asn Gln Leu Ile Thr Gln Gly Thr Leu Ser Asp Glu Glu Glu

420 425 430

Phe Glu Ile Gln Glu Gln Met Thr Leu Leu Asn Ala Arg Trp Glu Ala

435 440 445

Leu Arg Val Glu Ser Met Asp Arg Gln Ser Arg Leu His Asp Val Leu

450 455 60

Met Glu Leu Gln Lys Lys Gln Leu Gln Gln Leu Ser Ala Trp Leu Thr

465 470 475 480

Leu Thr Glu Glu Arg Ile Gln Lys Met Glu Thr Cys Pro Leu Asp Asp

485 490 495

Asp Val Lys Ser Leu Gln Lys Leu Leu Glu Glu His Lys Ser Leu Gln

500 505 510

Ser Asp Leu Glu Ala Glu Gln Val Lys Val Asn Ser Leu Thr His Met

515 520 525

Val Val Ile Val Asp Glu Asn Ser Gly Glu Ser Ala Thr Ala Ile Leu

530 535 540

Glu Asp Gln Leu Gln Lys Leu Gly Glu Arg Trp Thr Ala Val Cys Arg

545 550 555 560

Trp Thr Glu Glu Arg Trp Asn Arg Leu Gln Glu Ile Asn Ile Leu Trp

565 570 575

Gln Glu Leu Leu Glu Glu Gln Cys Leu Leu Lys Ala Trp Leu Thr Glu

580 585 590

Lys Glu Glu Ala Leu Asn Lys Val Gln Thr Ser Asn Phe Lys Asp Gln

595 600 605

Lys Glu Leu Ser Val Ser Val Arg Arg Leu Ala Ile Leu Lys Glu Asp

610 615 620

Met Glu Met Lys Arg Gln Thr Leu Asp Gln Leu Ser Glu Ile Gly Gln

625 630 635 640

Asp Val Gly Gln Leu Leu Asp Asn Ser Lys Ala Ser Lys Lys Ile Asn

645 650 655

Ser Asp Ser Glu Glu Leu Thr Gln Arg Trp Asp Ser Leu Val Gln Arg

660 665 670

Leu Glu Asp Ser Ser Asn Gln Val Thr Gln Ala Val Ala Lys Leu Gly

675 680 685

Met Ser Gln Ile Pro Gln Lys Asp Leu Leu Glu Thr Val Arg Val Arg

690 695 700

Glu Gln Ala Ile Thr Lys Lys Ser Lys Gln Glu Leu Pro Pro Pro Pro

705 710 715 720

Pro Pro Lys Lys Arg Gln Ile His Val Asp Leu Glu Lys Leu Arg Asp

725 730 735

Leu Gln Gly Ala Met Asp Asp Leu Asp Ala Asp Met Lys Glu Ala Glu

740 745 750

Ser Val Arg Asn Gly Trp Lys Pro Val Gly Asp Leu Leu Ile Asp Ser

755 760 765

Leu Gln Asp His Ile Glu Lys Ile Met Ala Phe Arg Glu Glu Ile Ala

770 775 780

Pro Ile Asn Phe Lys Val Lys Thr Val Asn Asp Leu Ser Ser Gln Leu

785 790 795 800

Ser Pro Leu Asp Leu His Pro Ser Leu Lys Met Ser Arg Gln Leu Asp

805 810 815

Asp Leu Asn Met Arg Trp Lys Leu Leu Gln Val Ser Val Asp Asp Arg

820 825 830

Leu Lys Gln Leu Gln Glu Ala His Arg Asp Phe Gly Pro Ser Ser Gln

835 840 845

His Phe Leu Ser Thr Ser Val Gln Leu Pro Trp Gln Arg Ser Ile Ser

850 855 860

His Asn Lys Val Pro Tyr Tyr Ile Asn His Gln Thr Gln Thr Thr Cys

865 870 875 880

Trp Asp His Pro Lys Met Thr Glu Leu Phe Gln Ser Leu Ala Asp Leu

885 890 895

Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Ile Lys Ile Arg Arg

900 905 910

Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Glu Leu Ser Thr Thr Asn

915 920 925

Glu Ile Phe Lys Gln His Lys Leu Asn Gln Asn Asp Gln Leu Leu Ser

930 935 940

Val Pro Asp Val Ile Asn Cys Leu Thr Thr Thr Tyr Asp Gly Leu Glu

945 950 955 960

Gln Met His Lys Asp Leu Val Asn Val Pro Leu Cys Val Asp Met Cys

965 970 975

Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Lys Ile

980 985 990

Arg Val Gln Ser Leu Lys Ile Gly Leu Met Ser Leu Ser Lys Gly Leu

995 1000 1005

Leu Glu Glu Lys Tyr Arg Tyr Leu Phe Lys Glu Val Ala Gly Pro Thr

1010 1015 1020

Glu Met Cys Asp Gln Arg Gln Leu Gly Leu Leu Leu His Asp Ala Ile

1025 1030 1035 1040

Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ala Phe Gly Gly Ser Asn

1045 1050 1055

Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Gln Asn Asn Asn Lys Pro

1060 1065 1070

Glu Ile Ser Val Lys Glu Phe Ile Asp Trp Met His Leu Glu Pro Gln

1075 1080 1085

Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr

1090 1095 1100

Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Val

1105 1110 1115 1120

Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Val Cys Gln

1125 1130 1135

Ser Cys Phe Phe Ser Gly Arg Thr Ala Lys Gly His Lys Leu His Tyr

1140 1145 1150

Pro Met Val Glu Tyr Cys Ile Pro Thr Thr Ser Gly Glu Asp Val Arg

1155 1160 1165

Asp Phe Thr Lys Val Leu Lys Asn Lys Phe Arg Ser Lys Lys Tyr Phe

1170 1175 1180

Ala Lys His Pro Arg Leu Gly Tyr Leu Pro Val Gln Thr Val Leu Glu

1185 1190 1195 1200

Gly Asp Asn Leu Glu Thr Gln Ala Met

1205 1209

<210> 2

<211> 3630

<212> ДНК

<213> Искусственная последовательность

<220>

<222> (1)...(3630)

<223> H1-H-Comi-UTRN gene.

<400> 2

ATG GCC AAG TAC GGC GAG CAC GAG GCC TCC CCC GAC AAC GGC CAG AAC 48

Met Ala Lys Tyr Gly Glu His Glu Ala Ser Pro Asp Asn Gly Gln Asn

1 5 10 15

GAG TTC TCC GAC ATC ATC AAG TCC CGC TCC GAC GAG CAC AAC GAC GTG 96

Glu Phe Ser Asp Ile Ile Lys Ser Arg Ser Asp Glu His Asn Asp Val

20 25 30

CAG AAG AAG ACC TTC ACC AAG TGG ATC AAC GCC CGC TTC TCC AAG TCC 144

Gln Lys Lys Thr Phe Thr Lys Trp Ile Asn Ala Arg Phe Ser Lys Ser

35 40 45

GGC AAG CCC CCC ATC AAC GAC ATG TTC ACC GAC CTG AAG GAC GGC CGC 192

Gly Lys Pro Pro Ile Asn Asp Met Phe Thr Asp Leu Lys Asp Gly Arg

50 55 60

AAG CTG CTG GAC CTG CTG GAG GGC CTG ACC GGC ACC TCC CTG CCC AAG 240

Lys Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Thr Ser Leu Pro Lys

65 70 75 80

GAG CGC GGC TCC ACC CGC GTG CAC GCC CTG AAC AAC GTG AAC CGC GTG 288

Glu Arg Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Arg Val

85 90 95

CTG CAG GTG CTG CAC CAG AAC AAC GTG GAG CTG GTG AAC ATC GGC GGC 336

Leu Gln Val Leu His Gln Asn Asn Val Glu Leu Val Asn Ile Gly Gly

100 105 110

ACC GAC ATC GTG GAC GGC AAC CAC AAG CTG ACC CTG GGC CTG CTG TGG 384

Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Leu Trp

115 120 125

TCC ATC ATC CTG CAC TGG CAG GTG AAG GAC GTG ATG AAG GAC GTG ATG 432

Ser Ile Ile Leu His Trp Gln Val Lys Asp Val Met Lys Asp Val Met

130 135 140

TCC GAC CTG CAG CAG ACC AAC TCC GAG AAG ATC CTG CTG TCC TGG GTG 480

Ser Asp Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val

145 150 155 160

CGC CAG ACC ACC CGC CCC TAC TCC CAG GTG AAC GTG CTG AAC TTC ACC 528

Arg Gln Thr Thr Arg Pro Tyr Ser Gln Val Asn Val Leu Asn Phe Thr

165 170 175

ACC TCC TGG ACC GAC GGC CTG GCC TTC AAC GCC GTG CTG CAC CGC CAC 576

Thr Ser Trp Thr Asp Gly Leu Ala Phe Asn Ala Val Leu His Arg His

180 185 190

AAG CCC GAC CTG TTC TCC TGG GAC AAG GTG GTG AAG ATG TCC CCC ATC 624

Lys Pro Asp Leu Phe Ser Trp Asp Lys Val Val Lys Met Ser Pro Ile

195 200 205

GAG CGC CTG GAG CAC GCC TTC TCC AAG GCC CAG ACC TAC CTG GGC ATC 672

Glu Arg Leu Glu His Ala Phe Ser Lys Ala Gln Thr Tyr Leu Gly Ile

210 215 220

GAG AAG CTG CTG GAC CCC GAG GAC GTG GCC GTG CAG CTG CCC GAC AAG 720

Glu Lys Leu Leu Asp Pro Glu Asp Val Ala Val Gln Leu Pro Asp Lys

225 230 235 240

AAG TCC ATC ATC ATG TAC CTG ACC TCC CTG TTC GAG GTG CTG CCC CAG 768

Lys Ser Ile Ile Met Tyr Leu Thr Ser Leu Phe Glu Val Leu Pro Gln

245 250 255

CAG GTG TCC ATC GAG GCC ATC CAG GAA GTG GAA ATG CTG CCC AGG CCC 816

Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg Pro

260 265 270

CCC AAA GTG ACC AAG GAG GAG CAC TTC CAG CTG CAC CAC CAG ATG CAC 864

Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met His

275 280 285

TAT AGC CAG CAG ATC ACC GTG TCC CTG GCC CAG GGC TAT GAG AGA ACC 912

Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg Thr

290 295 300

AGC AGC CCC AAG CCC AGA TTC AAG AGC TAC GCC TAC ACC CAG GCC GCC 960

Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala Ala

305 310 315 320

TAC GTG ACC ACC TCC GAC CCC ACC AGA AGC CCC TTC CCC AGC CAG CAC 1008

Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln His

325 330 335

CTG GAG GCC CCC GAG GAC AAG AGC TTC GGC AGC AGC CTG ATG GAG AGC 1056

Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu Ser

340 345 350

GAA GTG AAC CTG GAC TCC TAC CAG ATC GCC CTG GAG GAG GTG CTG ACC 1104

Glu Val Asn Leu Asp Ser Tyr Gln Ile Ala Leu Glu Glu Val Leu Thr

355 360 365

TGG CTG CTG TCC GCC GAG GAC ACC TTC CAG GAG CAG GAC GAC ATC TCC 1152

Trp Leu Leu Ser Ala Glu Asp Thr Phe Gln Glu Gln Asp Asp Ile Ser

370 375 380

GAC GAC GTG GAG GAG GTG AAG GAC CAG TTC GCC ACC CAC GAG GCC TTC 1200

Asp Asp Val Glu Glu Val Lys Asp Gln Phe Ala Thr His Glu Ala Phe

385 390 395 400

ATG ATG GAG CTG ACC GCC CAC CAG TCC TCC GTG GGC TCC GTG CTG CAG 1248

Met Met Glu Leu Thr Ala His Gln Ser Ser Val Gly Ser Val Leu Gln

405 410 415

GCC GGC AAC CAG CTG ATC ACC CAG GGC ACC CTG TCC GAC GAG GAG GAG 1296

Ala Gly Asn Gln Leu Ile Thr Gln Gly Thr Leu Ser Asp Glu Glu Glu

420 425 430

TTC GAG ATC CAG GAG CAG ATG ACC CTG CTG AAC GCC CGC TGG GAG GCC 1344

Phe Glu Ile Gln Glu Gln Met Thr Leu Leu Asn Ala Arg Trp Glu Ala

435 440 445

CTG CGC GTG GAG TCC ATG GAC CGC CAG TCC CGC CTG CAC GAC GTG CTG 1392

Leu Arg Val Glu Ser Met Asp Arg Gln Ser Arg Leu His Asp Val Leu

450 455 460

ATG GAG CTG CAG AAG AAG CAG CTG CAG CAG CTG TCC GCC TGG CTG ACC 1440

Met Glu Leu Gln Lys Lys Gln Leu Gln Gln Leu Ser Ala Trp Leu Thr

465 470 475 480

CTG ACC GAG GAG CGC ATC CAG AAG ATG GAG ACC TGC CCC CTG GAC GAC 1488

Leu Thr Glu Glu Arg Ile Gln Lys Met Glu Thr Cys Pro Leu Asp Asp

485 490 495

GAC GTG AAG TCC CTG CAG AAG CTG CTG GAG GAG CAC AAG TCC CTG CAG 1536

Asp Val Lys Ser Leu Gln Lys Leu Leu Glu Glu His Lys Ser Leu Gln

500 505 510

TCC GAC CTG GAG GCC GAG CAG GTG AAG GTG AAC TCC CTG ACC CAC ATG 1584

Ser Asp Leu Glu Ala Glu Gln Val Lys Val Asn Ser Leu Thr His Met

515 520 525

GTG GTG ATC GTG GAC GAG AAC TCC GGC GAG TCC GCC ACC GCC ATC CTG 1632

Val Val Ile Val Asp Glu Asn Ser Gly Glu Ser Ala Thr Ala Ile Leu

530 535 540

GAG GAC CAG CTG CAG AAG CTG GGC GAG CGC TGG ACC GCC GTG TGC CGC 1680

Glu Asp Gln Leu Gln Lys Leu Gly Glu Arg Trp Thr Ala Val Cys Arg

545 550 555 560

TGG ACC GAG GAG CGC TGG AAC CGC CTG CAG GAG ATC AAC ATC CTG TGG 1728

Trp Thr Glu Glu Arg Trp Asn Arg Leu Gln Glu Ile Asn Ile Leu Trp

565 570 575

CAG GAG CTG CTG GAG GAG CAG TGC CTG CTG AAG GCC TGG CTG ACC GAG 1776

Gln Glu Leu Leu Glu Glu Gln Cys Leu Leu Lys Ala Trp Leu Thr Glu

580 585 590

AAG GAG GAG GCC CTG AAC AAG GTG CAG ACC TCC AAC TTC AAG GAC CAG 1824

Lys Glu Glu Ala Leu Asn Lys Val Gln Thr Ser Asn Phe Lys Asp Gln

595 600 605

AAG GAG CTG TCC GTG TCC GTG CGC CGC CTG GCC ATC CTG AAG GAG GAC 1872

Lys Glu Leu Ser Val Ser Val Arg Arg Leu Ala Ile Leu Lys Glu Asp

610 615 620

ATG GAG ATG AAG CGC CAG ACC CTG GAC CAG CTG TCC GAG ATC GGC CAG 1920

Met Glu Met Lys Arg Gln Thr Leu Asp Gln Leu Ser Glu Ile Gly Gln

625 630 635 640

GAC GTG GGC CAG CTG CTG GAC AAC TCC AAG GCC TCC AAG AAG ATC AAC 1968

Asp Val Gly Gln Leu Leu Asp Asn Ser Lys Ala Ser Lys Lys Ile Asn

645 650 655

TCC GAC TCC GAG GAG CTG ACC CAG CGC TGG GAC TCC CTG GTG CAG CGC 2016

Ser Asp Ser Glu Glu Leu Thr Gln Arg Trp Asp Ser Leu Val Gln Arg

660 665 670

CTG GAG GAC TCC TCC AAC CAG GTG ACC CAG GCC GTG GCC AAG CTG GGC 2064

Leu Glu Asp Ser Ser Asn Gln Val Thr Gln Ala Val Ala Lys Leu Gly

675 680 685

ATG TCC CAG ATC CCC CAG AAG GAC CTG CTG GAG ACC GTG CGC GTG CGC 2112

Met Ser Gln Ile Pro Gln Lys Asp Leu Leu Glu Thr Val Arg Val Arg

690 695 700

GAG CAG GCC ATC ACC AAG AAG TCC AAG CAG GAG CTG CCC CCC CCC CCC 2160

Glu Gln Ala Ile Thr Lys Lys Ser Lys Gln Glu Leu Pro Pro Pro Pro

705 710 715 720

CCC CCC AAG AAG CGC CAG ATC CAC GTG GAC CTG GAG AAG CTG CGC GAC 2208

Pro Pro Lys Lys Arg Gln Ile His Val Asp Leu Glu Lys Leu Arg Asp

725 730 735

CTG CAG GGC GCC ATG GAC GAC CTG GAC GCC GAC ATG AAG GAG GCC GAG 2256

Leu Gln Gly Ala Met Asp Asp Leu Asp Ala Asp Met Lys Glu Ala Glu

740 745 750

TCC GTG CGC AAC GGC TGG AAG CCC GTG GGC GAC CTG CTG ATC GAC TCC 2304

Ser Val Arg Asn Gly Trp Lys Pro Val Gly Asp Leu Leu Ile Asp Ser

755 760 765

CTG CAG GAC CAC ATC GAG AAG ATC ATG GCC TTC CGC GAG GAG ATC GCC 2352

Leu Gln Asp His Ile Glu Lys Ile Met Ala Phe Arg Glu Glu Ile Ala

770 775 780

CCC ATC AAC TTC AAG GTG AAG ACC GTG AAC GAC CTG TCC TCC CAG CTG 2400

Pro Ile Asn Phe Lys Val Lys Thr Val Asn Asp Leu Ser Ser Gln Leu

785 790 795 800

TCC CCC CTG GAC CTG CAC CCC TCC CTG AAG ATG TCC CGC CAG CTG GAC 2448

Ser Pro Leu Asp Leu His Pro Ser Leu Lys Met Ser Arg Gln Leu Asp

805 810 815

GAC CTG AAC ATG CGC TGG AAG CTG CTG CAG GTG TCC GTG GAC GAC CGC 2496

Asp Leu Asn Met Arg Trp Lys Leu Leu Gln Val Ser Val Asp Asp Arg

820 825 830

CTG AAG CAG CTG CAG GAG GCC CAC CGC GAC TTC GGC CCC TCC TCC CAG 2544

Leu Lys Gln Leu Gln Glu Ala His Arg Asp Phe Gly Pro Ser Ser Gln

835 840 845

CAC TTC CTG TCC ACC TCC GTG CAG CTG CCC TGG CAG CGC TCC ATC TCC 2592

His Phe Leu Ser Thr Ser Val Gln Leu Pro Trp Gln Arg Ser Ile Ser

850 855 860

CAC AAC AAG GTG CCC TAC TAC ATC AAC CAC CAG ACC CAG ACC ACC TGC 2640

His Asn Lys Val Pro Tyr Tyr Ile Asn His Gln Thr Gln Thr Thr Cys

865 870 875 880

TGG GAC CAC CCC AAG ATG ACC GAG CTG TTC CAG TCC CTG GCC GAC CTG 2688

Trp Asp His Pro Lys Met Thr Glu Leu Phe Gln Ser Leu Ala Asp Leu

885 890 895

AAC AAC GTG CGC TTC TCC GCC TAC CGC ACC GCC ATC AAG ATC CGC CGC 2736

Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Ile Lys Ile Arg Arg

900 905 910

CTG CAG AAG GCC CTG TGC CTG GAC CTG CTG GAG CTG TCC ACC ACC AAC 2784

Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Glu Leu Ser Thr Thr Asn

915 920 925

GAG ATC TTC AAG CAG CAC AAG CTG AAC CAG AAC GAC CAG CTG CTG TCC 2832

Glu Ile Phe Lys Gln His Lys Leu Asn Gln Asn Asp Gln Leu Leu Ser

930 935 940

GTG CCC GAC GTG ATC AAC TGC CTG ACC ACC ACC TAC GAC GGC CTG GAG 2880

Val Pro Asp Val Ile Asn Cys Leu Thr Thr Thr Tyr Asp Gly Leu Glu

945 950 955 960

CAG ATG CAC AAG GAC CTG GTG AAC GTG CCC CTG TGC GTG GAC ATG TGC 2928

Gln Met His Lys Asp Leu Val Asn Val Pro Leu Cys Val Asp Met Cys

965 970 975

CTG AAC TGG CTG CTG AAC GTG TAC GAC ACC GGC CGC ACC GGC AAG ATC 2976

Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Lys Ile

980 985 990

CGC GTG CAG TCC CTG AAG ATC GGC CTG ATG TCC CTG TCC AAG GGC CTG 3024

Arg Val Gln Ser Leu Lys Ile Gly Leu Met Ser Leu Ser Lys Gly Leu

995 1000 1005

CTG GAG GAG AAG TAC CGC TAC CTG TTC AAG GAG GTG GCC GGC CCC ACC 3072

Leu Glu Glu Lys Tyr Arg Tyr Leu Phe Lys Glu Val Ala Gly Pro Thr

1010 1015 1020

GAG ATG TGC GAC CAG CGC CAG CTG GGC CTG CTG CTG CAC GAC GCC ATC 3120

Glu Met Cys Asp Gln Arg Gln Leu Gly Leu Leu Leu His Asp Ala Ile

1025 1030 1035 1040

CAG ATC CCC CGC CAG CTG GGC GAG GTG GCC GCC TTC GGC GGC TCC AAC 3168

Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ala Phe Gly Gly Ser Asn

1045 1050 1055

ATC GAG CCC TCC GTG CGC TCC TGC TTC CAG CAG AAC AAC AAC AAG CCC 3216

Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Gln Asn Asn Asn Lys Pro

1060 1065 1070

GAG ATC TCC GTG AAG GAG TTC ATC GAC TGG ATG CAC CTG GAG CCC CAG 3264

Glu Ile Ser Val Lys Glu Phe Ile Asp Trp Met His Leu Glu Pro Gln

1075 1080 1085

TCC ATG GTG TGG CTG CCC GTG CTG CAC CGC GTG GCC GCC GCC GAG ACC 3312

Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr

1090 1095 1100

GCC AAG CAC CAG GCC AAG TGC AAC ATC TGC AAG GAG TGC CCC ATC GTG 3360

Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Val

1105 1110 1115 1120

GGC TTC CGC TAC CGC TCC CTG AAG CAC TTC AAC TAC GAC GTG TGC CAG 3408

Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Val Cys Gln

1125 1130 1135

TCC TGC TTC TTC TCC GGC CGC ACC GCC AAG GGC CAC AAG CTG CAC TAC 3456

Ser Cys Phe Phe Ser Gly Arg Thr Ala Lys Gly His Lys Leu His Tyr

1140 1145 1150

CCC ATG GTG GAG TAC TGC ATC CCC ACC ACC TCC GGC GAG GAC GTG CGC 3504

Pro Met Val Glu Tyr Cys Ile Pro Thr Thr Ser Gly Glu Asp Val Arg

1155 1160 1165

GAC TTC ACC AAG GTG CTG AAG AAC AAG TTC CGC TCC AAG AAG TAC TTC 3552

Asp Phe Thr Lys Val Leu Lys Asn Lys Phe Arg Ser Lys Lys Tyr Phe

1170 1175 1180

GCC AAG CAC CCC CGC CTG GGC TAC CTG CCC GTG CAG ACC GTG CTG GAG 3600

Ala Lys His Pro Arg Leu Gly Tyr Leu Pro Val Gln Thr Val Leu Glu

1185 1190 1195 1200

GGC GAC AAC CTG GAG ACC CAG GCC ATG TGA 3630

Gly Asp Asn Leu Glu Thr Gln Ala Met ***

1205 1209

<210> 3

<211> 1193

<212> белок

<213> Искусственная последовательность

<220>

<222> (1)...(1193)

<223> EX1-H1-H-Comi-UTRN

<400> 3

Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val

1 5 10 15

Gln Lys Lys Thr Phe Thr Lys Trp Ile Asn Ala Arg Phe Ser Lys Ser

20 25 30

Gly Lys Pro Pro Ile Asn Asp Met Phe Thr Asp Leu Lys Asp Gly Arg

35 40 45

Lys Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Thr Ser Leu Pro Lys

50 55 60

Glu Arg Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Arg Val

65 70 75 80

Leu Gln Val Leu His Gln Asn Asn Val Glu Leu Val Asn Ile Gly Gly

85 90 95

Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Leu Trp

100 105 110

Ser Ile Ile Leu His Trp Gln Val Lys Asp Val Met Lys Asp Val Met

115 120 125

Ser Asp Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val

130 135 140

Arg Gln Thr Thr Arg Pro Tyr Ser Gln Val Asn Val Leu Asn Phe Thr

145 150 155 160

Thr Ser Trp Thr Asp Gly Leu Ala Phe Asn Ala Val Leu His Arg His

165 170 175

Lys Pro Asp Leu Phe Ser Trp Asp Lys Val Val Lys Met Ser Pro Ile

180 185 190

Glu Arg Leu Glu His Ala Phe Ser Lys Ala Gln Thr Tyr Leu Gly Ile

195 200 205

Glu Lys Leu Leu Asp Pro Glu Asp Val Ala Val Gln Leu Pro Asp Lys

210 215 220

Lys Ser Ile Ile Met Tyr Leu Thr Ser Leu Phe Glu Val Leu Pro Gln

225 230 235 240

Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg Pro

245 250 255

Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met His

260 265 270

Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg Thr

275 280 285

Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala Ala

290 295 300

Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln His

305 310 315 320

Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu Ser

325 330 335

Glu Val Asn Leu Asp Ser Tyr Gln Ile Ala Leu Glu Glu Val Leu Thr

340 345 350

Trp Leu Leu Ser Ala Glu Asp Thr Phe Gln Glu Gln Asp Asp Ile Ser

355 360 365

Asp Asp Val Glu Glu Val Lys Asp Gln Phe Ala Thr His Glu Ala Phe

370 375 380

Met Met Glu Leu Thr Ala His Gln Ser Ser Val Gly Ser Val Leu Gln

385 390 395 400

Ala Gly Asn Gln Leu Ile Thr Gln Gly Thr Leu Ser Asp Glu Glu Glu

405 410 415

Phe Glu Ile Gln Glu Gln Met Thr Leu Leu Asn Ala Arg Trp Glu Ala

420 425 430

Leu Arg Val Glu Ser Met Asp Arg Gln Ser Arg Leu His Asp Val Leu

435 440 445

Met Glu Leu Gln Lys Lys Gln Leu Gln Gln Leu Ser Ala Trp Leu Thr

450 455 460

Leu Thr Glu Glu Arg Ile Gln Lys Met Glu Thr Cys Pro Leu Asp Asp

465 470 475 480

Asp Val Lys Ser Leu Gln Lys Leu Leu Glu Glu His Lys Ser Leu Gln

485 490 495

Ser Asp Leu Glu Ala Glu Gln Val Lys Val Asn Ser Leu Thr His Met

500 505 510

Val Val Ile Val Asp Glu Asn Ser Gly Glu Ser Ala Thr Ala Ile Leu

515 520 525

Glu Asp Gln Leu Gln Lys Leu Gly Glu Arg Trp Thr Ala Val Cys Arg

530 535 540

Trp Thr Glu Glu Arg Trp Asn Arg Leu Gln Glu Ile Asn Ile Leu Trp

545 550 555 560

Gln Glu Leu Leu Glu Glu Gln Cys Leu Leu Lys Ala Trp Leu Thr Glu

565 570 575

Lys Glu Glu Ala Leu Asn Lys Val Gln Thr Ser Asn Phe Lys Asp Gln

580 585 590

Lys Glu Leu Ser Val Ser Val Arg Arg Leu Ala Ile Leu Lys Glu Asp

595 600 605

Met Glu Met Lys Arg Gln Thr Leu Asp Gln Leu Ser Glu Ile Gly Gln

610 615 620

Asp Val Gly Gln Leu Leu Asp Asn Ser Lys Ala Ser Lys Lys Ile Asn

625 630 635 640

Ser Asp Ser Glu Glu Leu Thr Gln Arg Trp Asp Ser Leu Val Gln Arg

645 650 655

Leu Glu Asp Ser Ser Asn Gln Val Thr Gln Ala Val Ala Lys Leu Gly

660 665 670

Met Ser Gln Ile Pro Gln Lys Asp Leu Leu Glu Thr Val Arg Val Arg

675 680 685

Glu Gln Ala Ile Thr Lys Lys Ser Lys Gln Glu Leu Pro Pro Pro Pro

690 695 700

Pro Pro Lys Lys Arg Gln Ile His Val Asp Leu Glu Lys Leu Arg Asp

705 710 715 720

Leu Gln Gly Ala Met Asp Asp Leu Asp Ala Asp Met Lys Glu Ala Glu

725 730 735

Ser Val Arg Asn Gly Trp Lys Pro Val Gly Asp Leu Leu Ile Asp Ser

740 745 750

Leu Gln Asp His Ile Glu Lys Ile Met Ala Phe Arg Glu Glu Ile Ala

755 760 765

Pro Ile Asn Phe Lys Val Lys Thr Val Asn Asp Leu Ser Ser Gln Leu

770 775 780

Ser Pro Leu Asp Leu His Pro Ser Leu Lys Met Ser Arg Gln Leu Asp

785 790 795 800

Asp Leu Asn Met Arg Trp Lys Leu Leu Gln Val Ser Val Asp Asp Arg

805 810 815

Leu Lys Gln Leu Gln Glu Ala His Arg Asp Phe Gly Pro Ser Ser Gln

820 825 830

His Phe Leu Ser Thr Ser Val Gln Leu Pro Trp Gln Arg Ser Ile Ser

835 840 845

His Asn Lys Val Pro Tyr Tyr Ile Asn His Gln Thr Gln Thr Thr Cys

850 855 860

Trp Asp His Pro Lys Met Thr Glu Leu Phe Gln Ser Leu Ala Asp Leu

865 870 875 880

Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Ile Lys Ile Arg Arg

885 890 895

Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Glu Leu Ser Thr Thr Asn

900 905 910

Glu Ile Phe Lys Gln His Lys Leu Asn Gln Asn Asp Gln Leu Leu Ser

915 920 925

Val Pro Asp Val Ile Asn Cys Leu Thr Thr Thr Tyr Asp Gly Leu Glu

930 935 940

Gln Met His Lys Asp Leu Val Asn Val Pro Leu Cys Val Asp Met Cys

945 950 955 960

Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Lys Ile

965 970 975

Arg Val Gln Ser Leu Lys Ile Gly Leu Met Ser Leu Ser Lys Gly Leu

980 985 990

Leu Glu Glu Lys Tyr Arg Tyr Leu Phe Lys Glu Val Ala Gly Pro Thr

995 1000 1005

Glu Met Cys Asp Gln Arg Gln Leu Gly Leu Leu Leu His Asp Ala Ile

1010 1015 1020

Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ala Phe Gly Gly Ser Asn

1025 1030 1035 1040

Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Gln Asn Asn Asn Lys Pro

1045 1050 1055

Glu Ile Ser Val Lys Glu Phe Ile Asp Trp Met His Leu Glu Pro Gln

1060 1065 1070

Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr

1075 1080 1085

Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Val

1090 1095 1100

Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Val Cys Gln

1105 1110 1115 1120

Ser Cys Phe Phe Ser Gly Arg Thr Ala Lys Gly His Lys Leu His Tyr

1125 1130 1135

Pro Met Val Glu Tyr Cys Ile Pro Thr Thr Ser Gly Glu Asp Val Arg

1140 1145 1150

Asp Phe Thr Lys Val Leu Lys Asn Lys Phe Arg Ser Lys Lys Tyr Phe

1155 1160 1165

Ala Lys His Pro Arg Leu Gly Tyr Leu Pro Val Gln Thr Val Leu Glu

1170 1175 1180

Gly Asp Asn Leu Glu Thr Gln Ala Met ***

1185 1190 1193

<210> 4

<211> 3582

<212> ДНК

<213> Искусственная последовательность

<220>

<222> (1)...(3582)

<223> EX1-H1-H-Comi-UTRN gene

<400> 4

ATG CTG TGG TGG GAG GAA GTG GAG GAC TGC TAC GAG AGA GAG GAC GTG 48

Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val

1 5 10 15

CAG AAG AAG ACC TTC ACC AAG TGG ATC AAC GCC CGC TTC TCC AAG TCC 96

Gln Lys Lys Thr Phe Thr Lys Trp Ile Asn Ala Arg Phe Ser Lys Ser

20 25 30

GGC AAG CCC CCC ATC AAC GAC ATG TTC ACC GAC CTG AAG GAC GGC CGC 144

Gly Lys Pro Pro Ile Asn Asp Met Phe Thr Asp Leu Lys Asp Gly Arg

35 40 45

AAG CTG CTG GAC CTG CTG GAG GGC CTG ACC GGC ACC TCC CTG CCC AAG 192

Lys Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Thr Ser Leu Pro Lys

50 55 60

GAG CGC GGC TCC ACC CGC GTG CAC GCC CTG AAC AAC GTG AAC CGC GTG 240

Glu Arg Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Arg Val

65 70 75 80

CTG CAG GTG CTG CAC CAG AAC AAC GTG GAG CTG GTG AAC ATC GGC GGC 288

Leu Gln Val Leu His Gln Asn Asn Val Glu Leu Val Asn Ile Gly Gly

85 90 95

ACC GAC ATC GTG GAC GGC AAC CAC AAG CTG ACC CTG GGC CTG CTG TGG 336

Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Leu Trp

100 105 110

TCC ATC ATC CTG CAC TGG CAG GTG AAG GAC GTG ATG AAG GAC GTG ATG 384

Ser Ile Ile Leu His Trp Gln Val Lys Asp Val Met Lys Asp Val Met

115 120 125

TCC GAC CTG CAG CAG ACC AAC TCC GAG AAG ATC CTG CTG TCC TGG GTG 432

Ser Asp Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val

130 135 140

CGC CAG ACC ACC CGC CCC TAC TCC CAG GTG AAC GTG CTG AAC TTC ACC 480

Arg Gln Thr Thr Arg Pro Tyr Ser Gln Val Asn Val Leu Asn Phe Thr

145 150 155 160

ACC TCC TGG ACC GAC GGC CTG GCC TTC AAC GCC GTG CTG CAC CGC CAC 528

Thr Ser Trp Thr Asp Gly Leu Ala Phe Asn Ala Val Leu His Arg His

165 170 175

AAG CCC GAC CTG TTC TCC TGG GAC AAG GTG GTG AAG ATG TCC CCC ATC 576

Lys Pro Asp Leu Phe Ser Trp Asp Lys Val Val Lys Met Ser Pro Ile

180 185 190

GAG CGC CTG GAG CAC GCC TTC TCC AAG GCC CAG ACC TAC CTG GGC ATC 624

Glu Arg Leu Glu His Ala Phe Ser Lys Ala Gln Thr Tyr Leu Gly Ile

195 200 205

GAG AAG CTG CTG GAC CCC GAG GAC GTG GCC GTG CAG CTG CCC GAC AAG 672

Glu Lys Leu Leu Asp Pro Glu Asp Val Ala Val Gln Leu Pro Asp Lys

210 215 220

AAG TCC ATC ATC ATG TAC CTG ACC TCC CTG TTC GAG GTG CTG CCC CAG 720

Lys Ser Ile Ile Met Tyr Leu Thr Ser Leu Phe Glu Val Leu Pro Gln

225 230 235 240

CAG GTG TCC ATC GAG GCC ATC CAG GAA GTG GAA ATG CTG CCC AGG CCC 768

Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg Pro

245 250 255

CCC AAA GTG ACC AAG GAG GAG CAC TTC CAG CTG CAC CAC CAG ATG CAC 816

Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met His

260 265 270

TAT AGC CAG CAG ATC ACC GTG TCC CTG GCC CAG GGC TAT GAG AGA ACC 864

Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg Thr

275 280 285

AGC AGC CCC AAG CCC AGA TTC AAG AGC TAC GCC TAC ACC CAG GCC GCC 912

Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala Ala

290 295 300

TAC GTG ACC ACC TCC GAC CCC ACC AGA AGC CCC TTC CCC AGC CAG CAC 960

Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln His

305 310 315 320

CTG GAG GCC CCC GAG GAC AAG AGC TTC GGC AGC AGC CTG ATG GAG AGC 1008

Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu Ser

325 330 335

GAA GTG AAC CTG GAC TCC TAC CAG ATC GCC CTG GAG GAG GTG CTG ACC 1056

Glu Val Asn Leu Asp Ser Tyr Gln Ile Ala Leu Glu Glu Val Leu Thr

340 345 350

TGG CTG CTG TCC GCC GAG GAC ACC TTC CAG GAG CAG GAC GAC ATC TCC 1104

Trp Leu Leu Ser Ala Glu Asp Thr Phe Gln Glu Gln Asp Asp Ile Ser

355 360 365

GAC GAC GTG GAG GAG GTG AAG GAC CAG TTC GCC ACC CAC GAG GCC TTC 1152

Asp Asp Val Glu Glu Val Lys Asp Gln Phe Ala Thr His Glu Ala Phe

370 375 380

ATG ATG GAG CTG ACC GCC CAC CAG TCC TCC GTG GGC TCC GTG CTG CAG 1200

Met Met Glu Leu Thr Ala His Gln Ser Ser Val Gly Ser Val Leu Gln

385 390 395 400

GCC GGC AAC CAG CTG ATC ACC CAG GGC ACC CTG TCC GAC GAG GAG GAG 1248

Ala Gly Asn Gln Leu Ile Thr Gln Gly Thr Leu Ser Asp Glu Glu Glu

405 410 415

TTC GAG ATC CAG GAG CAG ATG ACC CTG CTG AAC GCC CGC TGG GAG GCC 1296

Phe Glu Ile Gln Glu Gln Met Thr Leu Leu Asn Ala Arg Trp Glu Ala

420 425 430

CTG CGC GTG GAG TCC ATG GAC CGC CAG TCC CGC CTG CAC GAC GTG CTG 1344

Leu Arg Val Glu Ser Met Asp Arg Gln Ser Arg Leu His Asp Val Leu

435 440 445

ATG GAG CTG CAG AAG AAG CAG CTG CAG CAG CTG TCC GCC TGG CTG ACC 1392

Met Glu Leu Gln Lys Lys Gln Leu Gln Gln Leu Ser Ala Trp Leu Thr

450 455 460

CTG ACC GAG GAG CGC ATC CAG AAG ATG GAG ACC TGC CCC CTG GAC GAC 1440

Leu Thr Glu Glu Arg Ile Gln Lys Met Glu Thr Cys Pro Leu Asp Asp

465 470 475 480

GAC GTG AAG TCC CTG CAG AAG CTG CTG GAG GAG CAC AAG TCC CTG CAG 1488

Asp Val Lys Ser Leu Gln Lys Leu Leu Glu Glu His Lys Ser Leu Gln

485 490 495

TCC GAC CTG GAG GCC GAG CAG GTG AAG GTG AAC TCC CTG ACC CAC ATG 1536

Ser Asp Leu Glu Ala Glu Gln Val Lys Val Asn Ser Leu Thr His Met

500 505 510

GTG GTG ATC GTG GAC GAG AAC TCC GGC GAG TCC GCC ACC GCC ATC CTG 1584

Val Val Ile Val Asp Glu Asn Ser Gly Glu Ser Ala Thr Ala Ile Leu

515 520 525

GAG GAC CAG CTG CAG AAG CTG GGC GAG CGC TGG ACC GCC GTG TGC CGC 1632

Glu Asp Gln Leu Gln Lys Leu Gly Glu Arg Trp Thr Ala Val Cys Arg

530 535 540

TGG ACC GAG GAG CGC TGG AAC CGC CTG CAG GAG ATC AAC ATC CTG TGG 1680

Trp Thr Glu Glu Arg Trp Asn Arg Leu Gln Glu Ile Asn Ile Leu Trp

545 550 555 560

CAG GAG CTG CTG GAG GAG CAG TGC CTG CTG AAG GCC TGG CTG ACC GAG 1728

Gln Glu Leu Leu Glu Glu Gln Cys Leu Leu Lys Ala Trp Leu Thr Glu

565 570 575

AAG GAG GAG GCC CTG AAC AAG GTG CAG ACC TCC AAC TTC AAG GAC CAG 1776

Lys Glu Glu Ala Leu Asn Lys Val Gln Thr Ser Asn Phe Lys Asp Gln

580 585 590

AAG GAG CTG TCC GTG TCC GTG CGC CGC CTG GCC ATC CTG AAG GAG GAC 1824

Lys Glu Leu Ser Val Ser Val Arg Arg Leu Ala Ile Leu Lys Glu Asp

595 600 605

ATG GAG ATG AAG CGC CAG ACC CTG GAC CAG CTG TCC GAG ATC GGC CAG 1872

Met Glu Met Lys Arg Gln Thr Leu Asp Gln Leu Ser Glu Ile Gly Gln

610 615 620

GAC GTG GGC CAG CTG CTG GAC AAC TCC AAG GCC TCC AAG AAG ATC AAC 1920

Asp Val Gly Gln Leu Leu Asp Asn Ser Lys Ala Ser Lys Lys Ile Asn

625 630 635 640

TCC GAC TCC GAG GAG CTG ACC CAG CGC TGG GAC TCC CTG GTG CAG CGC 1968

Ser Asp Ser Glu Glu Leu Thr Gln Arg Trp Asp Ser Leu Val Gln Arg

645 650 655

CTG GAG GAC TCC TCC AAC CAG GTG ACC CAG GCC GTG GCC AAG CTG GGC 2016

Leu Glu Asp Ser Ser Asn Gln Val Thr Gln Ala Val Ala Lys Leu Gly

660 665 670

ATG TCC CAG ATC CCC CAG AAG GAC CTG CTG GAG ACC GTG CGC GTG CGC 2064

Met Ser Gln Ile Pro Gln Lys Asp Leu Leu Glu Thr Val Arg Val Arg

675 680 685

GAG CAG GCC ATC ACC AAG AAG TCC AAG CAG GAG CTG CCC CCC CCC CCC 2112

Glu Gln Ala Ile Thr Lys Lys Ser Lys Gln Glu Leu Pro Pro Pro Pro

690 695 700

CCC CCC AAG AAG CGC CAG ATC CAC GTG GAC CTG GAG AAG CTG CGC GAC 2160

Pro Pro Lys Lys Arg Gln Ile His Val Asp Leu Glu Lys Leu Arg Asp

705 710 715 720

CTG CAG GGC GCC ATG GAC GAC CTG GAC GCC GAC ATG AAG GAG GCC GAG 2208

Leu Gln Gly Ala Met Asp Asp Leu Asp Ala Asp Met Lys Glu Ala Glu

725 730 735

TCC GTG CGC AAC GGC TGG AAG CCC GTG GGC GAC CTG CTG ATC GAC TCC 2256

Ser Val Arg Asn Gly Trp Lys Pro Val Gly Asp Leu Leu Ile Asp Ser

740 745 750

CTG CAG GAC CAC ATC GAG AAG ATC ATG GCC TTC CGC GAG GAG ATC GCC 2304

Leu Gln Asp His Ile Glu Lys Ile Met Ala Phe Arg Glu Glu Ile Ala

755 760 765

CCC ATC AAC TTC AAG GTG AAG ACC GTG AAC GAC CTG TCC TCC CAG CTG 2352

Pro Ile Asn Phe Lys Val Lys Thr Val Asn Asp Leu Ser Ser Gln Leu

770 775 780

TCC CCC CTG GAC CTG CAC CCC TCC CTG AAG ATG TCC CGC CAG CTG GAC 2400

Ser Pro Leu Asp Leu His Pro Ser Leu Lys Met Ser Arg Gln Leu Asp

785 790 795 800

GAC CTG AAC ATG CGC TGG AAG CTG CTG CAG GTG TCC GTG GAC GAC CGC 2448

Asp Leu Asn Met Arg Trp Lys Leu Leu Gln Val Ser Val Asp Asp Arg

805 810 815

CTG AAG CAG CTG CAG GAG GCC CAC CGC GAC TTC GGC CCC TCC TCC CAG 2496

Leu Lys Gln Leu Gln Glu Ala His Arg Asp Phe Gly Pro Ser Ser Gln

820 825 830

CAC TTC CTG TCC ACC TCC GTG CAG CTG CCC TGG CAG CGC TCC ATC TCC 2544

His Phe Leu Ser Thr Ser Val Gln Leu Pro Trp Gln Arg Ser Ile Ser

835 840 845

CAC AAC AAG GTG CCC TAC TAC ATC AAC CAC CAG ACC CAG ACC ACC TGC 2592

His Asn Lys Val Pro Tyr Tyr Ile Asn His Gln Thr Gln Thr Thr Cys

850 855 860

TGG GAC CAC CCC AAG ATG ACC GAG CTG TTC CAG TCC CTG GCC GAC CTG 2640

Trp Asp His Pro Lys Met Thr Glu Leu Phe Gln Ser Leu Ala Asp Leu

865 870 875 880

AAC AAC GTG CGC TTC TCC GCC TAC CGC ACC GCC ATC AAG ATC CGC CGC 2688

Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Ile Lys Ile Arg Arg

885 890 895

CTG CAG AAG GCC CTG TGC CTG GAC CTG CTG GAG CTG TCC ACC ACC AAC 2736

Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Glu Leu Ser Thr Thr Asn

900 905 910

GAG ATC TTC AAG CAG CAC AAG CTG AAC CAG AAC GAC CAG CTG CTG TCC 2784

Glu Ile Phe Lys Gln His Lys Leu Asn Gln Asn Asp Gln Leu Leu Ser

915 920 925

GTG CCC GAC GTG ATC AAC TGC CTG ACC ACC ACC TAC GAC GGC CTG GAG 2832

Val Pro Asp Val Ile Asn Cys Leu Thr Thr Thr Tyr Asp Gly Leu Glu

930 935 940

CAG ATG CAC AAG GAC CTG GTG AAC GTG CCC CTG TGC GTG GAC ATG TGC 2880

Gln Met His Lys Asp Leu Val Asn Val Pro Leu Cys Val Asp Met Cys

945 950 955 960

CTG AAC TGG CTG CTG AAC GTG TAC GAC ACC GGC CGC ACC GGC AAG ATC 2928

Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Lys Ile

965 970 975

CGC GTG CAG TCC CTG AAG ATC GGC CTG ATG TCC CTG TCC AAG GGC CTG 2976

Arg Val Gln Ser Leu Lys Ile Gly Leu Met Ser Leu Ser Lys Gly Leu

980 985 990

CTG GAG GAG AAG TAC CGC TAC CTG TTC AAG GAG GTG GCC GGC CCC ACC 3024

Leu Glu Glu Lys Tyr Arg Tyr Leu Phe Lys Glu Val Ala Gly Pro Thr

995 1000 1005

GAG ATG TGC GAC CAG CGC CAG CTG GGC CTG CTG CTG CAC GAC GCC ATC 3072

Glu Met Cys Asp Gln Arg Gln Leu Gly Leu Leu Leu His Asp Ala Ile

1010 1015 1020

CAG ATC CCC CGC CAG CTG GGC GAG GTG GCC GCC TTC GGC GGC TCC AAC 3120

Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ala Phe Gly Gly Ser Asn

1025 1030 1035 1040

ATC GAG CCC TCC GTG CGC TCC TGC TTC CAG CAG AAC AAC AAC AAG CCC 3168

Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Gln Asn Asn Asn Lys Pro

1045 1050 1055

GAG ATC TCC GTG AAG GAG TTC ATC GAC TGG ATG CAC CTG GAG CCC CAG 3216

Glu Ile Ser Val Lys Glu Phe Ile Asp Trp Met His Leu Glu Pro Gln

1060 1065 1070

TCC ATG GTG TGG CTG CCC GTG CTG CAC CGC GTG GCC GCC GCC GAG ACC 3264

Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr

1075 1080 1085

GCC AAG CAC CAG GCC AAG TGC AAC ATC TGC AAG GAG TGC CCC ATC GTG 3312

Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Val

1090 1095 1100

GGC TTC CGC TAC CGC TCC CTG AAG CAC TTC AAC TAC GAC GTG TGC CAG 3360

Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Val Cys Gln

1105 1110 1115 1120

TCC TGC TTC TTC TCC GGC CGC ACC GCC AAG GGC CAC AAG CTG CAC TAC 3408

Ser Cys Phe Phe Ser Gly Arg Thr Ala Lys Gly His Lys Leu His Tyr

1125 1130 1135

CCC ATG GTG GAG TAC TGC ATC CCC ACC ACC TCC GGC GAG GAC GTG CGC 3456

Pro Met Val Glu Tyr Cys Ile Pro Thr Thr Ser Gly Glu Asp Val Arg

1140 1145 1150

GAC TTC ACC AAG GTG CTG AAG AAC AAG TTC CGC TCC AAG AAG TAC TTC 3504

Asp Phe Thr Lys Val Leu Lys Asn Lys Phe Arg Ser Lys Lys Tyr Phe

1155 1160 1165

GCC AAG CAC CCC CGC CTG GGC TAC CTG CCC GTG CAG ACC GTG CTG GAG 3552

Ala Lys His Pro Arg Leu Gly Tyr Leu Pro Val Gln Thr Val Leu Glu

1170 1175 1180

GGC GAC AAC CTG GAG ACC CAG GCC ATG TGA 3582

Gly Asp Asn Leu Glu Thr Gln Ala Met ***

1185 1190 1193

<---

Реферат

Группа изобретений относится к области биотехнологии и медицины, в частности к химерным белкам, содержащим последовательности дистрофина и утрофина человека. Предложен химерный белок для лечения миодистрофии Дюшенна, содержащий N-терминальный домен утрофина человека, в котором пептид, кодируемый первым экзоном утрофина, необязательно заменен на пептид, кодируемый первым экзоном дистрофина человека, первый неструктурированный домен дистрофина человека (hinge 1), спектриновые повторы 1, 2, 3 утрофина человека, второй неструктурированный домен утрофина человека (hinge 2), спектриновый повтор 22 утрофина человека, четвёртый неструктурированный домен утрофина человека (hinge 4), цистеин-богатый (CR) домен утрофина человека, олигопептид QAM, кодируемый экзоном 74 утрофина человека. Также предложены нуклеиновые кислоты, кодирующие упомянутые белки и вирусные экспрессионные векторы для введения в организм млекопитающего, содержащие упомянутые нуклеиновые кислоты. Изобретения могут использоваться для заместительной генной терапии миодистрофии Дюшенна при доставке в мышечные клетки пациентов с помощью известных экспрессионных векторов и дальнейшей экспрессии там химерного белка, способного функционально заменить отсутствующий дистрофин. 4 н. и 4 з.п. ф-лы, 10 ил., 3 пр.

Формула

1. Химерный белок для лечения миодистрофии Дюшенна, содержащий N-терминальный домен утрофина человека, в котором пептид, кодируемый первым экзоном утрофина, необязательно заменен на пептид, кодируемый первым экзоном дистрофина человека, первый неструктурированный домен дистрофина человека (hinge 1), спектриновые повторы 1, 2, 3 утрофина человека, второй неструктурированный домен утрофина человека (hinge 2), спектриновый повтор 22 утрофина человека, четвёртый неструктурированный домен утрофина человека (hinge 4), цистеин-богатый (CR) домен утрофина человека, олигопептид QAM, кодируемый экзоном 74 утрофина человека.
2. Белок по п. 1, отличающийся тем, что содержит N-терминальный домен утрофина человека.
3. Белок по п. 2, характеризующийся аминокислотной последовательностью SEQ ID No: 1.
4. Нуклеиновая кислота, кодирующая белок по п. 3, характеризующаяся последовательностью SEQ ID No: 2.
5. Белок по п. 1, отличающийся тем, что содержит N-терминальный домен утрофина человека, в котором пептид, кодируемый первым экзоном утрофина, заменен на пептид, кодируемый первым экзоном дистрофина человека.
6. Белок по п. 5, характеризующийся аминокислотной последовательностью SEQ ID No: 3.
7. Нуклеиновая кислота, кодирующая белок по п. 6, характеризующаяся последовательностью SEQ ID No: 4.
8. Вирусный экспрессионный вектор, содержащий нуклеиновую кислоту по п. 4 или 7, для введения в организм млекопитающего, отличающийся тем, что вектор представляет собой ААV 9 серотипа.

Патенты аналоги

Авторы

Патентообладатели

СПК: A61K38/1709 A61P21/00 C07K19/00 C07K14/4708 C12N15/86 C12N2750/14142

МПК: A61K38/17 A61P21/00

Публикация: 2022-03-17

Дата подачи заявки: 2021-03-02

0
0
0
0
Невозможно загрузить содержимое всплывающей подсказки.
Поиск по товарам