Код документа: RU2699523C2
Данные родственных заявок
Эта заявка испрашивает приоритет по Предварительной заявки на патент США №61/779,169, поданной 13 марта 2013 года и Предварительной заявки на патент США №61/738,355, поданной 17 декабря 2012, каждая из которых включена тем самым здесь ссылкой в их полном виде для всех целей.
Заявление интересов правительства
Данное изобретение было произведено с поддержкой правительства под Р50 HG005550, решением Национальных Институтов Здоровья. Правительство имеет определенные права на это изобретение.
Уровень техники
Системы CRISPR бактерий и архебактерий основаны на сrРНК в комплексе с белками Cas для направленной деградации комплементарных последовательностей, присутствующих во вторгнувшейся вирусной и плазмидной ДНК (1-3). Недавнее in vitro воссоздание системы CRISPR типа II S. pyogenes продемонстрировало, что сrРНК, слитая с нормальной транс-кодируемой tracrPHK, является достаточной для направления белка Cas9 для последовательность-специфического расщепления ДНК-последовательностей-мишеней, соответствующих сrРНК (4).
Сущность изобретения
В настоящем описании содержаться ссылки в виде цифр на документы, которые перечислены в конце данного описания изобретения. Документ, соответствующий этой цифре, включен посредством отсылки в это описание изобретения также как если бы он был приведен полностью.
Согласно одному аспекту данного изобретения, эукариотическую клетку трансфицируют двухкомпонентной системой, включающей РНК, комплементарную геномной ДНК, и фермент, который взаимодействует с этой РНК. Эти РНК и фермент экспрессируются клеткой. Затем РНК из комплекса РНК/фермент связывается с комплементарной геномной ДНК. Затем фермент выполняет функцию, такую как расщепление этой геномной ДНК. Данная РНК содержит между приблизительно 10 нуклеотидов - приблизительно 250 нуклеотидов. Например РНК включает приблизительно 20 нуклеотидов - приблизительно 100 нуклеотидов. Согласно некоторым аспектам, фермент может выполнять любую желаемую функцию, для которой он был сконструирован, сайт-специфическим образом. Согласно одному аспекту, этой эукариотической клеткой является клетка дрожжей, клетка растения или клетка млекопитающего. Согласно одному аспекту, фермент расщепляет геномные последовательности, на которые нацелены РНК-последовательности (см. ссылки (4-6)), создавая таким образом эукариотическую клетку с измененным геномом.
Согласно одному аспекту, данное изобретение обеспечивает способ генетического изменения клетки человека включением в геном этой клетки нуклеиновой кислоты, кодирующей РНК, комплементарную геномной ДНК, и нуклеиновой кислоты, кодирующей фермент, который осуществляет желаемое воздействие на геномную ДНК. Согласно одному аспекту, РНК и фермент экспрессируются. Согласно одному аспекту, эта РНК гибридизируются с комплементарной геномной ДНК. Согласно одному аспекту, этот фермент активируется для осуществления желаемой функции, такой как расщепление сайт-специфическим образом, когда РНК гибридизируется с комплементарной геномной ДНК. Согласно одному аспекту, эта РНК и этот фермент являются компонентами бактериальной системы CRISPR Type II.
Согласно одному аспекту, предлагается способ изменения эукариотической клетки, включающий трансфекцию этой эукариотической клетки нуклеиновой кислотой, кодирующей РНК, комплементарную геномной ДНК этой эукариотической клетки, трансфекцию этой эукариотической клетки нуклеиновой кислотой, кодирующей фермент, который взаимодействует с этой РНК и расщепляет эту геномную ДНК сайт-специфическим образом, где эта клетка экспрессирует эти РНК и фермент, где эта РНК связывается с комплементарной геномной ДНК и указанный фермент расщепляет геномную ДНК сайт-специфическим образом. Согласно одному аспекту, ферментом является Cas9 или модифицированный Cas9 или гомолог Cas9. Согласно одному аспекту, эукариотической клеткой является клетка дрожжей, клетка растения или клетка млекопитающего. Согласно одному аспекту, РНК содержит между приблизительно 10 - приблизительно 250 нуклеотидов. Согласно следующему аспекту, РНК содержит между приблизительно 20 - приблизительно 250 нуклеотидов. Согласно еще одному аспекту, РНК содержит между приблизительно 20 до приблизительно 100 нуклеотидов.
Согласно дальнейшему аспекту, предлагается способ изменения клетки человека, включающий трансфекцию клетки человека нуклеиновой кислотой, кодирующей РНК, комплементарную геномной ДНК эукариотической клетки, трансфекцию клетки человека нуклеиновой кислотой, кодирующей фермент, который взаимодействует с РНК и расщепляет геномную ДНК сайт-специфическим образом, где эта клетка человека экспрессирует эти РНК и фермент, где РНК связывается с комплементарной геномной ДНК, а фермент расщепляет эту геномную ДНК сайт-специфическим образом. Согласно одному аспекту, этим ферментом является Cas9 или модифицированный Cas9 или гомолог Cas9. Согласно одному аспекту, РНК содержит между приблизительно 10 - приблизительно 250 нуклеотидов. Согласно следующему аспекту, РНК содержит между приблизительно 20 - приблизительно 250 нуклеотидов.
Согласно другому аспекту, предложен способ изменения эукариотической клетки во множестве сайтов геномной ДНК, включающий трансфекцию эукариотической клетки множеством нуклеиновых кислот, кодирующих РНК, комплементарные различным сайтам геномной ДНК этой эукариотической клетки, трансфекцию этой эукариотической клетки нуклеиновой кислотой, кодирующей фермент, который взаимодействует с этими РНК и расщепляет геномную ДНК сайт-специфическим образом, где эта клетка экспрессирует эти РНК и фермент, где РНК связываются с комплементарными участками геномной ДНК а фермент расщепляет эти геномные ДНК сайт-специфическим образом. Согласно дополнительному аспекту, этим ферментом является Cas9. Согласно еще одному аспекту, этой эукариотической клеткой является клетка дрожжей, клетка растения или клетка млекопитающего. Согласно следующему аспекту, РНК содержит между приблизительно 10 - приблизительно 250 нуклеотидов. Согласно дальнейшему аспекту, эта РНК содержит между приблизительно 20 - приблизительно 250 нуклеотидов.
Подробное описание
Согласно одному аспекту, синтезировали кодон-оптимизированную с учетом использования кодонов у человека версию белка Cas9, содержащую с С-конца сигнал ядерной локализации SV40, и затем клонировали в систему экспрессии млекопитающих (фиг. 1А и фиг. 3А). Соответственно, на фиг. 1 изображено редактирование генома в клетках человека с использованием сконструированной системы CRISPR Type II. Как показано на фиг. 1А, РНК-направляемое нацеливание в клетках человека включает коэкспрессию белка Cas9, несущего с С-конца сигнал ядерной локализации SV40, с одной или несколькими направляющими РНК (гидРНК), которые экспрессировали с использованием промотора U6 полимеразы III. Cas9 раскручивает ДНК-дуплекс и расщепляет обе цепи после узнавания последовательности-мишени гидРНК, но только если на 3'-конце присутствует правильный смежный с протоспейсером мотив (РАМ). В принципе, можно нацелить систему на любую геномную последовательность формы GN20GG. Как показано на фиг. 1В, интегрировавшая в геном последовательность, кодирующая GFP, разрушается путем инсерции стоп-кодона и геномного фрагмента в 68 п. н. из локуса AAVS1. Реконструкция этой GFP-последовательности путем гомологичной рекомбинацией (HR) с помощью подходящей донорной последовательностью приводит к получению GFP+-клеток, которые могут быть количественно определены посредством FACS. Последовательности-мишени гидРНК Т1 и Т2 входят в состав фрагмента AAVS1. Сайты связывания двух половин гетеродимера нуклеазы TAL (TALEN) подчеркнуты. На фиг. 1С приведена столбчатая диаграмма эффективности HR, индуцированной T1, Т2 и TALEN-опосредованной нуклеазной активностью в локусе-мишени, что было измерено с использованием FACS. Репрезентативные графики FACS и микроскопические изображения этих клеток-мишеней изображены ниже (шкала столбчатой диаграммы равна 10 микрон). Приведенные данные являются средним +/- SEM (стандартная ошибка среднего (N=3).
Согласно одному аспекту, для направления Cas9 для расщепления представляющих интерес последовательностей, с помощью промотора U6 полимеразы III экспрессируют слитые транскрипты crPHK-tracrPHК, далее называемые как РНК-направляющие (гидРНК). Согласно дополнительному аспекту, гидРНК непосредственно транскрибируются клеткой. Этот аспект имеет то преимущество, что позволяет избежать реконструирование системы процессинга РНК, используемого бактериальными системами CRISPR (фиг. 1А и фиг. 3В) (см. ссылки (4, 7-9)). Согласно еще одному аспекту, предложен способ для изменения геномной ДНК, использующий инициацию транскрипции U6 с G и РАМ (смежный с протоспейсером мотив) последовательности-NGG, за которым следует мишень сrРНК из 20 п.н. Согласно этому аспекту, геномный сайт-мишень находится в форме GN20GG (см. фиг. 3С).
Согласно следующему аспекту, предложен репортерный анализ GFP (фиг. 1В) в клетках 293Т, который подобен описанному ранее анализу (см. ссылку (10)), для тестирования функциональности описанных здесь способов инженерии генома. Согласно этому аспекту, была получена стабильная клеточная линия, содержащая интегрированную в геном последовательность, кодирующую GFP, которая прервана инсерцией стоп-кодона и фрагмента в 68 п. н. из локуса AAVS1, что приводит к тому, что экспрессируемый белковый фрагмент не флуоресцентный. Гомологичная рекомбинация (HR), использующая подходящий репарирующий донор, может восстановить нормальную последовательность GFP, что позволяет специалисту определить количество полученных GFP+-клеток с помощью сортировки клеток с активированной флуоресценцией (FACS).
Согласно следующему аспекту, предложен способ гомологичной рекомбинации (HR). Конструировали две гидРНК, Т1 и Т2, которые нацелены на промежуточный фрагмент AAVS1 (фиг. 1b). Сравнивали их активность с активностью ранее описанного гетеродимера TAL-эффекторной нуклеазы (TALEN), нацеленного на ту же самую область (см. ссылку (11)). Со всеми тремя нацеливающими реагентами наблюдались успешные события HR, где частота коррекции гена с использованием подхода с Т1 и Т2 гидРНК, достигала 3% и 8%, соответственно (фиг. 1С). Этот РНК-опосредованный процесс редактирования оказался примечательно быстрым, и первые детектируемые GFP+-клетки появились через ~20 часов после трансфекции, в сравнении с ~40 часами для AAVS1 TALEN. HR наблюдали только после одновременного введения донора репарации, белка Cas9, и гидРНК, что является подтверждением того, что все эти компоненты требуются для редактирования генома (фиг. 4). Хотя явной токсичности, ассоциированной с экспрессией с Cas9/crPHK не отмечали, работа с ZFN и TALEN ранее показала, что разрыв только одной цепи дополнительно уменьшает токсичность. Таким образом, тестировали мутант Cas9D10A, о котором известно, что он функционирует в качестве никазы in vitro, что давало сходную HR (гомологичную рекомбинацию), но более низкую частоту негомологичного соединения концов (NHEJ) (фиг. 5) (см. ссылки (4, 5)). В соответствии с (4), где было показано что белок родственный Cas9 разрезает обе цепи на расстоянии 6 п.н. слева по ходу транскрипции от РАМ, данные NHEJ подтвердили, что большинство делеций или инсерций происходит на 3'-конце последовательности-мишени (фиг. 5В). Было также подтверждено, что мутация геномного сайта-мишени предотвращает воздействие гидРНК на HR в этом локусе, демонстрируя, что CRISPR-опосредованное редактирование генома является последовательность-специфическим (фиг. 6). Было показано, что два сайта нацеливания гидРНК в гене GFP, а также три дополнительных фрагмента нацеливания гидРНК из гомологичных районов ДНКметилтрансферазы 3а (DNMT3a) и гена DNMT3b могут последовательность-специфическим образом индуцировать значимую гомологичную рекомбинацию (HR) в сконструированных линиях репортерных клеток (фиг. 7, 8). Вместе эти результаты подтверждают, что РНК-направляемое нацеливание на геном в клетках человека индуцирует сильную гомологичную рекомбинацию (HR) во множественных сайтах-мишенях.
Согласно некоторым аспектам, был модифицирован нативный локус. гидРНК использовали для нацеливания на локус AAVS1, локализованный в гене PPP1R12C на хромосоме 19, который повсеместно экспрессируется в большинстве тканей (фиг. 2А) и в клетках iPS человека 293Т, К562 и PGP1 (см. ссылку (12)), и анализировали результаты с помощью next-gen секвенирования локуса мишени. Соответственно фиг. 2 предложена для описания РНК-направляемого редактирование генома в нативном локусе AAVS1 во множестве типов клеток. Как показано на фиг. 2А, Т1 (красная) и Т2 (зеленая) последовательности-мишени гидРНК находятся в интроне гена PPP1R12C в локусе AAVS1 хромосомы 19. Как показано на фиг. 2В, определены общее количество и локализация делеций, вызываемых NHEJ в клетках iPS 293Т, K562 и PGP1 после экспрессии Cas9 и либо Т1, либо Т2 гидРНК, что было сделано с помощью next-gen секвенирования. Красные и зеленые штрихпунктирные линии обозначают границы сайтов таргетинга Т1 и Т2 гидРНК. Частота NHEJ для Т1 и Т2 гидРНК были 10% и 25% и 25% в 293Т, 13% и 38% в K562 и 2% и 4% в клетках PGP1 iPS, соответственно. На фиг. 2С изображена схема ДНК-донора для HR в локусе AAVS1, и показаны местоположения секвенирующих праймеров (стрелками) для детектирования успешных событий нацеливания. Как это видно из фиг. 2D, ПЦР-анализ спустя три дня после трансфекции выявил, что только клетки, экспрессирующие донор, Cas9 и Т2 гидРНК, показали успешные события HR. Как показано на фиг. 2Е, успешная HR (гомологичная рекомбинация) подтверждалась секвенированием ПЦР-ампликона методом Sanger, показавшем, что ожидаемые ДНК-основания присутствуют на обеих границах геном-донор и донор-вставка. Как показано на фиг. 2F в течение 2 недель с использованием пуромицина отбирали «успешно нацеленные» клоны клеток 293Т. Показаны изображения под микроскопом двух репрезентативных GFP+-клонов (масштабная линейка (метка) равна 100 микрон).
В соответствии с результатами для GFP-репортерного анализа, высокую частоту событий NHEJ наблюдали в эндогенном локусе для всех трех типов клеток. Для двух гидРНК Т1 и Т2 частота NHEJ достигала 10 и 25% в 293Т, 13 и 38% в K562 и 2 и 4% в клетках PGP1-iPS, соответственно (фиг. 2В). Явная токсичность не наблюдалась от экспрессии Cas9 и сrРНК, которая требуется для индукции NHEJ в любом из этих типов клеток (фиг. 9). Как и ожидалось, NHEJ-опосредованные делеции для Т1 и Т2 сосредоточивались около положений сайта-мишени, что дополнительно подтверждает специфичность к последовательности у этого процесса нацеливания (фиг. 9, 10, 11). Одновременное введение как Т1, так и Т2 гидРНК приводило к высокоэффективной делеции промежуточного фрагмента 19 п.н. (фиг. 10), демонстрируя, что мультиплексное редактирование геномных локусов выполнимо с использованием этого подхода.
Согласно одному аспекту, HR используют для интеграции либо конструкта дцДНК-донора (см. ссылку (13)), либо олиго-донора в нативный локус AAVS1 (фиг. 2С, фиг. 12). HR-опосредуемую интеграцию подтверждали с использованием как ПЦР (фиг. 2D, фиг. 12) и так и -секвенирования по Sanger (дидезоксисеквенирования) (фиг. 2Е). Клоны 293Т или iPS легко выделяли из пула модифицированных клеток с использованием селекции на пуромицине на протяжении двух недель (фиг. 2F, фиг. 12). Эти результаты демонстрируют, что Cas9 способен эффективно встраивать чужеродную ДНК в эндогенные локусы в клетках человека. Таким образом, один аспект данного изобретения включает в себя способ интеграции чужеродной ДНК в геном клетки с использованием гомологичной рекомбинации и Cas9.
Согласно одному аспекту, предлагается РНК-направляемая система редактирования генома, которая может быть легко адаптирована для модификации других геномных сайтов путем простой модификации последовательности гидРНК-экспрессирующего вектора, для того чтобы она совпала с совместимой последовательностью в представляющем интерес локусе. Согласно этому аспекту, создавали 190,000 специфически гидРНК-направляющих последовательностей, нацеленных на около 40,5% экзонов генов в геноме человека. Эти последовательности-мишени были включены в формат 200 п.н., совместимый с мультиплексным синтезом на ДНК-эрреях (ранжированных рядах ДНК) (см. ссылку (14)) (фиг. 13). Согласно этому аспекту, обеспечена готовая к использованию система направления на потенциальные сайты-мишени в полноразмерном геноме человека и методология для мультиплексного синтеза гидРНК.
Согласно одному аспекту, предлагаются способы для мультиплексных геномных изменений в клетке с использованием одной или более или множества систем РНК/фермент, описанных здесь, для изменения генома клетки во множестве местоположений. Согласно одному аспекту, сайты-мишени идеально совпадают с последовательностью РАМ NGG и с 8-12 п.о. затравочной последовательности на 3'-конце этой гидРНК. Согласно некоторым аспектам, не требуется абсолютное совпадение для оставшихся 8-12 оснований. Согласно ряду аспектов, Cas9 будет функционировать с отдельными ошибочными спариваниями на 5'-конце. Согласно некоторым определенным аспектам, структура хроматина в локуса-мишени и эпигенетическое состояние могут влиять на эффективность функционирования Cas9. Согласно некоторым аспектам, в качестве пригодных ферментов включены гомологи Cas9, имеющие высокую специфичность. Специалист в данной области будет способен идентифицировать или сконструировать подходящие гомологи Cas9. Согласно одному аспекту, CRISPR-таргетируемые последовательности включают те последовательности, имеющие другие требования РАМ (см. ссылку (9)) или направленную эволюцию. Согласно одному аспекту, инактивирование одного из доменов Саs9-нуклеазы увеличивает скорость HR относительно NHEJ и может уменьшать токсичность (фиг. 3А, фиг. 5) (4, 5), тогда как инактивирование обоих доменов может заставить Cas9 функционировать в качестве перенастраиваемого ДНК-связывающего белка. Варианты данного изобретения имеют широкое применения в синтетической биологии (см. ссылки (21, 22)), прямой и мультиплексной перестройке генных сетей (см. ссылки (13, 23)), и направленной ex vivo (см. ссылки (24-26)) и in vivo генотерапии (см. ссылку (27)).
В соответствии с некоторыми аспектами, предложен "переконструированный организм" в качестве модельной системы для биологического открытий и скрининга in vivo. Согласно одному аспекту, создана "переконструированная мышь", несущая индуцируемый трансген Cas9, и локализованную доставку (с использованием аденоассоциированных вирусов, например) библиотек гидРНК, направленных на множество генов или регуляторных элементов, что позволяет проводить скрининг на мутации, которые приводят к появлению опухолей в этом типе ткани-мишени. Применение гомологов Cas9 или вариантов нуклеаза-нуль, несущих эффекторные домены (такие как активаторы), позволяет активировать или подавлять один или многие гены in vivo. Согласно этому аспекту, специалист мог бы проводить скрининг на факторы, которые могут создавать фенотипы, такие как: регенерация ткани, транс-дифференциации и т.д. Согласно некоторым аспектам, (а) применение ДНК-эрреев позволяет выполнять мультиплексный синтез определенных библиотек гидРНК (ссылка на фиг. 13); и (b) поскольку гидРНК имеет малый размер (ссылка на фиг. 3b), их упаковывают и доставляют с использованием множества невирусных или вирусных способов доставки.
Согласно одному аспекту, наблюдались более низкие токсичности когда в геномной инженерии использовались "никазы", что достигалось инактивированием одного из доменов Саs9-нуклеазы, вырезающем либо цепь ДНК, спарившуюся с РНК, либо вырезающая ее комплемент. Инактивирование обоих доменов позволяет Cas9 функционировать в качестве перенацеливаемого ДНК-связывающего белка. Согласно одному аспекту, этот перенацеленный ДНК-связываюший белок Cas9 присоединяют (а) к доменам активации или репрессии транскрипции для модуляции экспрессии гена-мишени, включающей в том числе ремоделирование хроматина, модификацию гистонов, сайленсинг, инсуляции, прямых взаимодействий с аппаратом транскрипции;
(b) к доменам нуклеазы, таким как FokI, для возможности обеспечения «высоко специфического» контингента редактирования генома после димеризации смежных комплексов гидPHK-Cas9;
(c) к флуоресцентным белкам для визуализации геномных локусов и динамики хромосом; или
(d) к другим флуоресцентным молекулам, таким как связывающиеся с белками или нуклеиновыми кислотами органические флуорофоры, квантовые точки, молекулярные маяки и эхо-зонды или заменители молекулярных маяков;
(е) с мультивалентным лиганд-связывающим доменам белков, что делает возможной программируемую манипуляцию с 3D-архитектурой генома.
Согласно еще одному аспекту, компоненты транскрипционной активации и репрессии могут использовать системы CRISPR, которые природно или синтетически ортогональны, так что гидРНК связываются только с активатором или репрессором класса Cas. Это позволяет иметь большой набор гидРНК для настраивания множества мишеней.
Согласно некоторым аспектам, применение гидРНК дает больше возможность мультиплексирования по сравнению с мРНК, частично вследствие меньшего размера - 100 против. 2000 нуклеотидной длины, соответственно. Это является особенно ценным, с учетом того, что доставка нуклеиновой кислоты ограничена размером, например в случае упаковки в вирус. Это позволяет получить множественные случаи расщепления, никинга, активации или репрессии - или их комбинации. Эта способность легко нацеливаться на множественные регуляторные мишени позволяет грубо или тонкое настраивать систему или регуляторные сети не ограничиваясь природными регуляторными циклами, начинающимися с специфических регуляторных факторов (например, 4 мРНК, используемых в перепрограммировании фибробластов в IPSC). Примеры мультиплексированных применений включают в себя::
1. Установление (главной и минорной) аллелей гистосовместимости, гаплотипов и генотипов для трансплантации ткани/органа у человека (или животного). Этот аспект обеспечивает, например, гомозиготные линии клеток HLA или гуманизированные породы животных - или - набор гидРНК, способных перекладывать такие аллели HLA для других желаемых линий или пород.
2. Мультиплексные мутации цис-регуляторных элементов (CRE = сигналы для транскрипции, сплайсинга, трансляции, фолдинга, деградации РНК или белка, и т.д.) в одной клетке (или коллекции клеток), что может быть использовано для эффективного исследования сложной совокупности регуляторного взаимодействия, происходящих при нормальном развитии или патологических, синтетических или фармацевтических сценариях. Согласно этому аспекту, данные CRE являются (или могут быть сделаны) несколько ортогональными (т.е. с низкими взаимными помехами), так что многие могут тестироваться в одинаковой обстановке) - например, в дорогостоящей динамической модели эмбрионов животного. Одним вариантом применения является совместное использование с флуоресцентным секвенированием РНК in situ (FISSeq).
3. Мультиплексные комбинации мутаций СRE и/или эпигенетической активации или репрессии CRE могут быть использованы для изменения или репрограммирования iPSC или ESC или других стволовых клеток или нестволовых клеток в любой тип клеток или комбинацию клеточных типов для использования в органах-на-чипах или других культурах клеток или органов для целей тестирования фармацевтических препаратов (малых молекул, белков, РНК, клеток, клеток животного, растения или микробных клеток, аэрозолей и других способов доставки), стратегий трансплантации, стратегий персонализации и т.д.
4. Получение мультиплексных мутантных клеток человека для использования в диагностическом тестировании (и/или секвенировании ДНК) для медицинской генетики. До той степени, пока хромосомная локализация и окружение аллеля генома человека (или эпигенетической метки) могут влиять на точность клинико-генетического диагноза, скорее важно иметь аллели, присутствующие в правильном местоположении в эталонном геноме, чем в эктопическом (иначе трансгенном) местоположении или в отдельном куске синтетической ДНК. Одним вариантом воплощения является серия независимых клеточных линий по одной на каждый диагностический SNP (однонуклеотидный полиморфизм) человека, или структурный вариант. Альтернативно, один вариант включает в себя мультиплексные наборы аллелей в одной и той же клетке. В некоторых случаях будут желательными мультиплексные изменения в одном гене (или множестве генов), при условии независимого тестирования. В других случаях, конкретные комбинации аллелей-гаплотипы позволяют тестировать методы секвенирования (генотипирования), которые точно устанавливают фазу гаплотипа (т.е. затронута ли одна или обе копии гена в отдельном субъекте или типе соматических клеток).
5. Повторяющиеся элементы или эндогенные вирусные элементы могут быть мишенями сконструированных систем Cas+ гидРНК в клетках микробах, растений, животных или человека для уменьшения вредной транспозиции или способствования секвенированию или других аналитических геномных/транскриптомных/протеомных/диагностических инструментах (в которых почти идентичные копии могут быть проблематическими).
Следующие ссылки, идентифицированные цифрами в предыдущем разделе, включены здесь посредством ссылки в их полном виде.
1. В. Wiedenheft, S.H. Sternberg, J.A. Doudna, Nature 482, 331 (Feb 16, 2012).
2. D. Bhaya, M. Davison, R. Barrangou, Annual review of genetics 45, 273 (2011).
3. M.P. Terns, R.M. Terns, Current opinion in microbiology 14, 321 (Jun, 2011).
4. M. Jinek et al., Science 337, 816 (Aug 17, 2012).
5. G. Gasiunas, R. Barrangou, P. Horvath, V. Siksnys, Proceedings of the National Academy of Sciences of the United States of America 109, E2579 (Sep 25, 2012).
6. R. Sapranauskas et al., Nucleic acids research 39, 9275 (Nov, 2011).
7. T.R. Brummelkamp, R. Bernards, R. Agami, Science 296, 550 (Apr 19, 2002).
8. M. Miyagishi, K. Taira, Nature biotechnology 20, 497 (May, 2002).
9. E. Deltcheva et al., Nature 471, 602 (Mar 31, 2011).
10. J. Zou, P. Mali, X. Huang, S.N. Dowey, L. Cheng, Blood 118, 4599 (Oct 27, 2011).
11. Ν.Ε. Sanjana et al., Nature protocols 7, 171 (Jan, 2012).
12. J.H. Lee et al, PLoS Genet 5, e1000718 (Nov, 2009).
13. D. Hockemeyer et al., Nature biotechnology 27, 851 (Sep, 2009).
14. S. Kosuri et al., Nature biotechnology 28, 1295 (Dec, 2010).
15. V. Pattanayak, C.L. Ramirez, J.K. Joung, D.R. Liu, Nature methods 8, 765 (Sep, 2011).
16. N.M. King, O. Cohen-Haguenauer, Molecular therapy: the journal of the American Society of Gene Therapy 16,432 (Mar, 2008).
17. Y.G. Kim, J. Cha, S. Chandrasegaran, Proceedings of the National Academy of Sciences of the United States of America 93, 1156 (Feb 6, 1996).
18. E.J. Rebar, С.O. Pabo, Science 263, 671 (Feb 4, 1994).
19. J. Boch et al., Science 326, 1509 (Dec 11, 2009).
20. M.J. Moscou, A.J. Bogdanove, Science 326, 1501 (Dec 11, 2009).
21. A.S. Khalil, J.J. Collins, Nature reviews. Genetics 11, 367 (May, 2010).
22. P.E. Purnick, R. Weiss, Nature reviews. Molecular cell biology 10, 410 (Jun, 2009).
23. J. Zou et al., Cell stem cell 5, 97 (Jul 2, 2009).
24. N. Holt et al., Nature biotechnology 28, 839 (Aug, 2010).
25. F.D. Urnov et al., Nature 435, 646 (Jun 2, 2005).
26. A. Lombardo et al., Nature biotechnology 25, 1298 (Nov, 2007).
27. H. Li et al., Nature 475, 217 (Jul 14, 2011).
Следующие примеры представлены в качестве репрезентативных примеров воплощения данного изобретения. Эти примеры не должны пониматься как ограничивающие объем данного изобретения, так как эти и другие эквивалентные варианты воплощения будут очевидными в свете данного описания изобретения, фигур и сопутствующей формулы изобретения.
Пример I
Система CRISPR-Cas Типа II
Согласно одному аспекту, в вариантах воплощения этого изобретения используют короткую РНК для идентификации чужеродных нуклеиновых кислот для действия на них посредством нуклеазы в эукариотической клетке. Согласно некоторому аспекту данного изобретения, эукариотическую клетку изменяют для включения в ее геном нуклеиновых кислот, кодирующие одну или несколько коротких РНК и одну или несколько нуклеаз, которые активируются связыванием короткой РНК с последовательностью ДНК-мишени. Согласно некоторым аспектам, примерные системы короткая РНК / фермент могут быть идентифицированы в бактериях или архебактериях, такие как (CRISPR)/CRISPR-ассоциированные (Cas) системы, которые используют короткую РНК для направленной деградации чужеродных нуклеиновых кислот. Защита CRISPR ("Короткие палиндромные повторы, регулярно расположенные кластерами") включает в себя приобретение и интеграцию новых нацеливающих "спейсеров" из внедряющихся вирусных и плазмидных ДНК в локус CRISPR, экспрессию и процессинг коротких направляющих CRISPR РНК (сrРНК), состоящих из единиц спейсер-повтор, и расщепление нуклеиновых кислот (наиболее часто ДНК) комплементарных этому спейсеру.
Известны три класса систем CRISPR и на них ссылаются как на Тип I, Тип II или Тип III. Согласно одному аспекту, особенно полезным ферментом используемым в соответствии с настоящим изобретением для расщепления дцДНК является одноэффекторный фермент, Cas9, характерный для Типа II. (См. ссылку (1)). В бактериях, эта эффекторная система Типа II состоит из длинной пре-сrРНК, транскрибируемой из спейсер-содержащего локуса CRISPR, мультифункционального белка Cas9 и tracrPHK, важной для процессинга гидРНК. Эти tracrPHK гибридизируются с областями повторов, разделяющими спейсеры prе-сrРНК, инициируя расщепление дцРНК эндогенной РНКазой III, за которым следует второе событие расщепления в пределах каждого спейсер посредством Cas9, что в результате дает зрелые сrРНК, которые остаются ассоциированными с tracrPHK и Cas9. Согласно одному аспекту, эукариотические клетки данного изобретения конструируют таким образом, чтобы избежать использования РНКазы III и процессинга сrРНК в целом. См. ссылку (2).
Согласно одному аспекту, фермент данного описания изобретения, такой как Cas9, раскручивает ДНК-дуплекс и ищет последовательности, соответствующие сrРНК, для расщепления. Узнавание мишени осуществляется после детектирования комплементарности между последовательностью "протоспейсера" в ДНК-мишени и сохранившейся спейсерной последовательностью в сrРНК. Важно, что Cas9 разрезает ДНК только в том случае, если на 3'-конце присутствует корректный смежный с протоспейсером мотив (РАМ). Согласно некоторым аспектам, может быть использован другой смежный с протоспейсером мотив. Например, система S. pyogenes требует последовательность NGG, где N может быть любым нуклеотидом. Системы S. thermophilus Type II требуют NGGNG (см. ссылку (3)) и NNAGAAW (см. ссылку (4)), соответственно, тогда как другие системы S. mutans допускают NGG или NAAR (см. ссылку (5)). Биоинформатические анализы создали обширные базы данных локусов CRISPR в различных бактериях, которые могут служить для идентификации дополнительных пригодных РАМ и расширить набор последовательностей, на которые нацеливается CRISPR (см. ссылки (6, 7)). В S. thermophilus, Cas9 генерирует двухцепочечный разрыв с тупыми концами на расстоянии 3 п.н. перед 3'-концом протоспейсера (см. ссылку (8)), процесс, опосредуемый двумя каталитическими доменами белка Cas9: HNH-доменом, который расщепляет комплементарную цепь ДНК, и RuvC-подобным доменом, который расщепляет некомплементарную цепь (см. фиг. 1А и фиг. 3). Хотя система S. pyogenes еще не была настолько точно охарактеризована, образование двуцепочечного разрыва также происходит в направлении 3'-конца протоспейсера. Если один из этих двух доменов нуклеазы инактивирован, Cas9 будет функционировать в качестве никазы in vitro (см. ссылку (2)) и в клетках человека (см. фиг. 5).
Согласно одному аспекту, специфичность гидРНК-направляемого расщепления Cas9 используют в качестве механизма геномной инженерии в эукариотической клетке. Согласно одному аспекту, гибридизация гидРНК не должна быть 100-процентной для того, чтобы фермент распознал гибрид гидРНК/ДНК и осуществил расщепление. Может наблюдаться некоторая внецелевая активность. Например, система S. pyogenes допускает нарушение комплементарности в первых 6 основаниях из 20 п.н. зрелой спейсерной последовательности in vitro. Согласно одному аспекту, большая жесткость может быть более выгодной in vivo, когда в эталонном геноме человека имеются потенциальные внецелевые сайты совпадения (последние 14 п.н.) NGG для гидРНК. Результат этого ошибочного спаривания и активность фермента в общем виде описаны в ссылках (9), (2), (10) и (4).
Согласно некоторым аспектам, может быть улучшена специфичность. Когда интерференция является чувствительной к точке плавления гибрида гидРНК-ДНК, АТ-обогащенные последовательности могут иметь меньше внецелевых сайтов. Осторожный выбор сайтов-мишеней во избежание псевдосайтов с. совпадающими последовательностями по меньшей мере в 14 п.н. в других местах генома может улучшить специфичность. Применение варианта Cas9, требующего более длинную последовательность РАМ, также может уменьшать частоту внецелевых сайтов. Направленная эволюция может улучшать Саз9-специфичность до уровня, достаточного для полного предотвращения внецелевой активности, в идеале требуя полного совпадения 20 п.н. гидРНК с минимальным РАМ. Таким образом, модификация белка Cas9 является репрезентативным вариантом данного изобретения. В связи с этим, предвидится разработка новых способов, обеспечивающих много раундов эволюции в коротком временном интервале (см. ссылку (11). Системы CRISPR, полезные в данном изобретении, описаны в ссылках (12, 13).
Пример II
Конструирование плазмиды
Последовательность гена Cas9 оптимизировали с учетом использования кодонов человека и собирали с использованием Hierarchical fusion PCR assembly из 9 500 п.н. gBlock, полученных от IDТ. На фиг. 3А, посвященной сконструированной системе типа Π CRISPR для клеток человека, показан формат экспрессии и полная последовательность вставки cas9. Мотивы RuvC-подобный и HNH, и С-конец SV40 NLS соответственно окрашенными синим, коричневым и оранжевым цветом. Подобным образом конструировали и Cas9_D10A. Полученные полноразмерные продукты клонировали в вектор pcDNA3.3-TOPO (Invitrogen). Конструкты для экспрессии желаемой гидРНК - были заказаны в виде отдельных 455 п.н. gBlock в IDT и их либо клонировали в вектор pCR-BluntII-ΤΟΡΟ (Invitrogen), либо ПЦР-амплифицировали. На фиг. 3В приведена схема экспрессии на основе промотора U6 для направляющей РНК и предсказанной вторичной структуры РНК-транскрипта. Использование промотора U6 ведет к тому, что 1-ое положение в этом РНК-транскрипте будет 'G', и, следовательно, с использованием этого подхода можно нацелиться на все геномные сайты формы GN20GG. На фиг. 3С показаны используемые 7 гидРНК.
Векторы для репортерного анализа HR, включающего использование разорванного GFP, конструировали слиянием посредством ПЦР-сборки последовательности GFP, несущей стоп-кодон и 68 п.н. фрагмент AAVS1 (или их мутанты; см. фиг. 6), или 58 п.н. фрагменты из геномных локусов DNMT3a и DNMT3b (см. фиг. 8), собранные в лентивектор EGIP из Addgene (плазмида #26777). Затем эти лентивекторы использовали для получения стабильных линий репортера. TALEN, используемые в этом исследовании, конструировали с использованием протоколов, описанных в (14). Все ДНК-реагенты, используемые в этом исследовании, являются доступными в Addgene.
Пример III
Культура клеток
Клетки PGP1 iPS поддерживали на покрытых Matrigel (BD Biosciences)-чашках в mTeSR1 (Stemcell Technologies). Культуры пассировали каждые 5-7 дней с использованием TrypLE Express (Invitrogen). Клетки K562 выращивали и поддерживали в RPMI (Invitrogen), содержащей 15% FBS. Клетки HEK 293Т культивировали в модифицированной по способу Дульбекко среде Игла (DMEM, Invitrogen), дополненной высокой концентрацией глюкозы с 10% фетальной бычьей сывороткой (FBS, Invitrogen), пенициллином/стрептомицином (пен/стреп, Invitrogen) и не-незаменимыми аминокислотами (NEAA, Invitrogen). Все клетки поддерживали при 37°С и 5% СО2 в увлажняемом инкубаторе.
Пример IV
Таргетинг генов PGP1 iPS, K562 и 293Т
Клетки PGP1 iPS культивировали с ингибитором Rho-киназы (ROCK) (Calbiochem) 2 ч перед нуклеофекцией. Клетки собирали с использованием TrypLE Express (Invitrogen) и 2×106 клеток ресуспендировали в реагенте Р3 (Lonza) 1 мкг плазмиды Cas9, 1 мкг гидРНК и/или 1 мкг плазмиды с донором ДНК, и осуществляли нуклеофекцию в соответствии с инструкцией изготовителя (Lonza). Затем клетки высевали на mTeSR1-покрытую чашку, дополненную ингибитором ROCK, в течение первых 24 часов. Для клеток K562, 2×106 клеток ресуспендировали в реагенте SF (Lonza) 1 мкг плазмиды Cas9, 1 мкг гидРНК и/или 1 мкг плазмиды с донором ДНК, и осуществляли нуклеофекцию в соответствии с инструкцией изготовителя (Lonza). Для 293Т, 0,1×106 клеток трансфицировали 1 мкг плазмиды Cas9, 1 мкг гидРНК и/или 1 мкг плазмиды с донорной ДНК с использованием Липофектамина 2000 как в протоколах изготовителя. ДНК-доноры, используемые для таргетинга на эндогенный AAVS1 были либо дцДНК-донором (фиг. 2С), либо 90-мерным олигонуклеотидом. Первый имеет фланкирующие короткие гомологичные плечи и SA-2A-пуромицин-CaGGS-eGFP-кассету для обогащения успешно таргетированных клеток.
Эффективность нацеливания оценивали следующим образом. Клетки собирали через 3 дня после нуклеофикации и экстрагировали геномную ДНК ~1×106 клеток с использованием prepGEM (ZyGEM). Проводили ПЦР амплификацию района-мишени с геномной ДНК, полученной из этих клеток, и проводили глубокое секвенирование ампликонов с использованием MiSeq Personal Sequencer (Illumina) с покрытием >200000 прочтений. Данные секвенирования анализировали для оценивания эффективностей NHEJ. Этой анализированной эталонной последовательностью AAVS1 является:
ПЦР-праймерами для амплификации таргетирующих районов в геноме человека являются:
Для анализа событий гомологической рекомбинации HR с использованием ДНК-донора на фиг. 2С, этими праймерами были:
Пример V
Биоинформатический подход для вычисления экзона человека, которые являются мишенями CRISPR и методология для их мультиплексного синтеза.
Набор последовательностей гидРНК, которые в максимальной степени нацелены на специфические местоположения в экзонах человека, но в минимальной степени нацелены на другие местоположения в этом геноме, определяли следующим образом. Согласно одному аспекту, максимально эффективное нацеливание посредством гидРНК достигается использованием 23 нт последовательностей, из которых наиболее близкие к 5'-концу 20 нт являются точным комплементом желаемого местоположения, при этом три наиболее близких к 3'-концу основания должны быть в форме NGG. Дополнительно, наиболее близкий к 5'-концу нуклеотид должен быть G для установления сайта начала транскрипции pol-III. Однако, в соответствии с (2), ошибочное спаривание шести наиболее близких к 5' нуклеотидов из 20 п.н. гидРНК с ее геномной мишенью не отменяет Саs9-опосредуемое расщепление до тех пор, пока последние 14 нт спарены правильно, но ошибочное спаривание восьми наиболее близкими к 5'-концу нуклеотидов совмещенное со спариванием последних 12 нуклеотидов отменяет расщепления, в то время как случай с ошибочным спариванием семи наиболее близких к 5'-концу нт и 13 парами с 3'-конца не был тестирован. Для того чтобы занизить внецелевые эффекты, было поставлено условие, что этот случай с ошибочным спариванием семи нуклеотидов наиболее близких к 5'-концу, подобно случаю с ошибочным спариванием шести, допускает расщепление, так что спаривание наиболее близких к 3'-концу 13 нт является достаточным для расщепления. Для идентификации сайтов мишени CRISPR в экзонах человека, которые должны быть расщеплены без внецелевых расщеплений, испытывали все последовательности из 23 п.н. формы 5'-GBBBB ВВВВВ ВВВВВ ВВВВВ NGG-3' (формы 1), где В представляют основания в местоположении экзона, для которых не существует последовательность формы 5'-NNNNN NNBBB ВВВВВ ВВВВВ NGG-3' (формы 2) в любом другом местоположении в геноме человека. Конкретно, загрузили (i) BED-файл местоположений кодирующих районов всех генов RefSeq генома человека GRCh37/hg19 из UCSC Genome Browser (15-17). Местоположения кодирующих экзонов в этом BED-файле содержат набор 346089 номеров доступа RefSeq мРНК для генома hg19. Однако некоторые номера доступа RefSeq-мРНК картировались во множественных геномных местоположений (возможные дупликации генов) и многие номера доступа картировались на субпопуляций того же самого набора местоположений экзонов (множественные изоформы одних и тех же генов). Для различения случаев очевидно дуплицированных генов и объединения множества отсылок на один и тот же геномный экзон, возникших из за наличия множественных номеров доступа RefSeq на различные изоформы, (ii) добавляли уникальные цифровые суффиксы к 705 номерам доступа RefSeq, которые имели множественные геномные местоположения, и (iii) использовали функцию mergeBed в BEDTool (18) (v2.16.2-zip-87e3926) для объединения перекрывающихся местоположений экзонов в слитые района экзонов. Эти стадии уменьшали начальный набор из 346089 местоположений экзонов RefSeq до 192783 различных геномных районов. Последовательность hg19 для всех слитых районов экзонов загружали с использованием UCSC Table Browser, добавляя 20 п.н. материал для заполнения места на каждом конце, (iv) С использованием custom perl кода, идентифицировали 1657793 случаев form 1 в этой последовательности экзонов. (v) Затем эти последовательности фильтровали на присутствие случаев внецелевых form 2: для каждой мишени form 1 в слитом экзоне, экстрагировали наиболее близкие к 3' 13 п.н. специфические (В) "коровые последовательности и, для каждого кора генерировали четыре 16 п.н. последовательностей 5'-ВВВ ВВВВВ ВВВВВ NGG-3' (N=А, С, G и Т), и производили поиск по всему геному hg19 на точные совпадения с этими 6631172 последовательностями при помощи Bowtie version 0.12.8 (19) с использованием параметров. Каждый сайт экзона-мишени, для которого было более чем одно совпадение, отбрасывали. Следует обратить внимание на то, что поскольку любая специфическая 13 п.н. последовательность, за которой следует последовательность NGG, дает только 15 п.н. специфичность, должно быть в среднем ~5,6 совпадений с удлиненной коровой последовательностью в рандомизированной последовательности ~3Гб (обеих цепях). Таким образом, большинство из этих первоначально идентифицированных последовательностей отбрасывали; однако 189864 последовательности проходили через этот фильтр. Они содержат набор CRISPR-таргетируемых местоположений в экзонах генома человека. Местоположения мишеней 189864 последовательностей находятся в 78028 слитых районах экзонов (~40,5% из всех 192783 × слитных районов экзонов человека) при численности ~2,4 сайта на район-мишеньэкзона. Для оценивания таргетинга на генном уровне, картирования мРНК RefSeq кластеризовали таким образом, что любые два номера доступа RefSeq (включающие в себя дупликаты генов, различаемых в (ii)), которые перекрываются со слитым районом экзона, считают как один кластер генов, 189864 экзон-специфических сайтов CRISPR направлено на 17104 и мишеней из 18872 генных кластеров (~90,6% от всех генных кластеров) при численности ~11,1 на таргетированный генный кластер. (Обратите внимание, что хотя в этих кластерах генов в единый объект «схлестываются» номера доступа RefSeq мРНК, которые представляют собой множественные изоформы одного транскрибируемого гена, они будут также стягивать перекрывающиеся с ними другие гены, а также гены с антисмысловыми транскриптами. На уровне исходных RefSeq-номеров доступа, эти 189864 последовательности направлены на 30563 района-мишени из общих 43726 (~69,9%) картированных RefSeq-номеров доступа (включающих в себя различаемые дупликаты генов) при численности ~6,2 сайтов на таргетированный картированный номер доступа RefSeq.
Согласно одному аспекту, эта база данных может быть усовершенствована внесением поправок с учетом таких факторов как состав оснований и вторичная структура обеих гидРНК и геномных мишеней (20, 21), и эпигенетическое состояние этих мишеней в линиях клеток человека, для которых эта информация является доступной.
Пример VI
Мультиплексный синтез
Последовательности-мишени включали в формат 200 п.н., который является совместимым с мультиплексным синтезом на ДНК-эрреях (23, 24). Согласно одному аспекту этот способ позволяет отыскивать специфические гидРНК или пул последовательностей гидРНК в олигонуклеотидном пуле ДНК-эррея и быстр клонировать их в одинаковый экспрессирующий вектор (фиг. 13А). Конкретно, синтезировали 12k олигонуклеотидный пул из CustomArray Inc. Кроме того, успешно извлекли выбранные из этой библиотеки гидРНК (фиг. 13В) Авторы наблюдали частоту ошибок ~4 мутаций на 1000 п.н. синтезированной ДНК.
Пример VII
РНК-направляемое редактирование генома требует как Cas9, так и направляющей РНК для успешного нацеливания.
С использованием анализа на основе GFP-репортера, описанного на фиг. 1В, тестировали все возможные комбинации донора для репарации ДНК, белка Cas9 и гидРНК на их способность осуществлять успешную HR (гомологичную рекомбинацию) (в 293Т). Как показано на фиг. 4, клетки GAP+ наблюдали только, когда присутствовали все 3 компонента, подтверждая, что эти CRISPR компоненты являются существенными для РНК-направляемого редактирования генома. Данные являются средним +/- стандартная ошибка среднего (SEM) (N=3).
Пример VIII
Анализ опосредованного гидРНК и Cas9 редактирования генома
Процесс CRISPR-опосредованного редактирования генома исследовали с использованием либо (А) описанного ранее анализа с GFP-репортером, результаты которого приведены на фиг. 5А, и (В) глубокого секвенирования локусов-мишенией (в 293Т), результаты которого показаны на фиг 5В). В качестве сравнения, тестировали мутант D10A Cas9, который, как было показано в ранних сообщениях, функционирует в качестве никазы в анализах in vitro. Как показано на фиг. 5, как Cas9, так и Cas9D10A могут успешно влиять на HR (гомологичную рекомбинацию) при почти одинаковой частоте. Однако секвенирование подтверждает, что, хотя Cas9 обнаруживает значимо повышенное NHEJ присоединение в локусах-мишенях, мутант D10A имеет значимо сниженную частоту NHEJ (как и могло ожидаться из его предполагаемой способности только разрывать ДНК). Также, в соответствии с известной биохимией белка Cas9, данные NHEJ подтверждают, что большинство делеций или инсерций пар оснований встречаются вблизи 3'-конца последовательности-мишени: этот пик находится на ~3-4 основания слева от сайта РАМ, с медианной частотой делеций ~9-10 п.н. Данные показаны как среднее +/- стандартная ошибка среднего SEM (N=3).
Пример IX
РНК-направляемое редактирование генома является специфическим к последовательности-мишени.
Подобно анализу с GFP-репортером, описанному на фиг. 1В, были получены 3 стабильные линии 293Т, каждая из которых несет разный конструкт GFP-репортера. Они различаются последовательностью встроенного фрагмента AAVS1 (как указано на фиг. 6). Одна линия содержит фрагмент дикого типа, тогда как две другие линии содержат мутацию в 6 п.н. (показанные красным цветом). Затем каждую из линий таргетировали одним из следующих 4 компонентов: пара GFP-ZFN, которая может нацеливаться на все типы клеток, так как ее последовательность-мишень находится во фрагментах фланкирующих GFP и, следовательно, присутствует у всех клеточных линий; AAVS1 TALEN, который может быть потенциально нацелен только wt-AAVS1-фрагмент, так как из мутаций в других двух линиях TALEN неспособен к связыванию этих сайтов в них; Т1 гидРНК, которая может также потенциально быть нацелена только на фрагмент wt-AAVS1, так как ее сайт-мишень также разрушен в этих двух мутантных линиях; и наконец Т2 гидРНК, которая должна быть способна нацеливаться на все 3 клеточные линии поскольку, в отличие от Т1 гидРНК, ее сайт-мишень является неизмененным среди этих 3 линий. ZFN модифицировал все 3 типа клеток, AAVS1 TALEN и Т1 гидРНК нацеливались только на тип клеток wt-AAVS1, и Т2 гидРНК успешно нацеливается на все 3 типа клеток. Эти результаты вместе подтверждают, что опосредуемое гид-РНК редактирование, является специфичным в отношении последовательности-мишени. Данные показаны в виде среднего +/- стандартная ошибка среднего (SEM) (N=3).
Пример X
Гид-РНК, нацеленная на последовательность GFP, пригодна для надежного редактирования.
В дополнение к 2 гидРНК, нацеленным на вставку AAVS1, тестировали две дополнительных гидРНК, нацеленные на фланкирующие GFP последовательности репортера, описанного на фиг. 1В (в 293Т) Как показано на фиг. 7, эти гидРНК были также воздействовать на частоту HR в этом сконструированном локусе. Данные показаны в виде среднего +/- стандартной ошибки среднего (SEM) (N=3).
Пример XI
РНК-направляемое редактирование генома является специфическим в отношении последовательности-мишени и демонстрирует сходные с ZFNs или TALEN эффективности нацеливания
Сходно с анализом с репортером GFP, описанным на фиг. 1В, создали две стабильные клеточные линии 293Т, каждая из которых несет отличающийся конструкт репортера GFP. Они различаются по последовательности фрагмента-вставки (как указано на фиг. 8). Одна линия несет фрагмент в 58 п.н. из гена DNMT3a, тогда как другая линия несет гомологичный ему фрагмент в 58 п.н. из гена DNMT3b. Эти различия последовательности выделены красным цветом. Затем каждую из этих линий таргетировали одним из следующих шести реагентов: GFP-ZFN-пары, которая может нацеливаться на все типы клеток, так как ее последовательность-мишень находится во фланкирующих GFP фрагментах и, следовательно, присутствует у всех линий клеток; пары TALEN, которая потенциально нацелена либо на DNMT3a-, либо на DNMT3b-фрагменты; пары гидРНК, которая может быть потенциально нацелена только на DNMT3а-фрагмент; и, наконец, гидРНК, которая должна потенциально нацеливаться только на DNМТ3b-фрагмент. Как показано на фиг. 8, эти ZFN модифицировали все 3 типа клеток, a TALEN и гидРНК только соответствующие им мишени. Кроме того, эффективности нацеливания оказались сравнимыми у 6 нацеливающих реагентов. Эти результаты вместе подтверждают, что РНК-направляемое редактирование является специфическим в отношении последовательности-мишени и демонстрирует сходные с ZFN или TALEN эффективности нацеливания. Данные показаны в виде среднего +/- стандартная ошибка среднего (SEM) (N=3).
Пример XII
РНК-направляемое соединение негомологичных концов (NHEJ) в клетках iPS человека.
В клетки iPS человека (PGP1) посредством нуклеофекции вводили конструкты, указанные на левой панели фиг. 9. Через 4 дня после нуклеофекции частоту NHEJ измеряли путем оценки частоты делеций и инсерций при разрывах двойной цепи (DSB) глубоким секвенированием. Панель 1: Частота делеции, детектируемая в районе-мишени. Красные штрихпунктирные линии: граница сайта-мишени РНК Т1; зеленые штрихпунктирные линии: граница сайта-мишени РНК Т2. Частоту случаев делеции в каждом положении нуклеотида откладывали на графике в виде черных линий и рассчитывали частоту делеции как процент прочтений, несущих делецию. Панель 2: Частота инсерции детектируемая в районе-мишени. Красные штрихпунктирные линии: граница сайта-мишени РНК Т1; зеленые штрихпунктирные линии: граница сайта-мишени РНК Т2. Частоту случаев инсерции в геномном местоположении, где детектировалось первое встроенное сочленение откладывали на графике в виде черных линий и частоту инсерции рассчитывали как процент прочтений несущих инсерцию. Панель 3: Распределение по размерам делеций. Частоты делений различных размеров среди всей популяции NHEJ строили в виде графиков. Панель 4: Распределение размеров инсерций. Частоты различных размеров инсерций всей популяции NHEJ строили в виде графиков. Таргетинг iPS обеими гидРНК является эффективным (2-4%), последовательность-специфическим (как показано смещением в положении распределений делеции NHEJ), и подтверждение результатов фиг. 4, анализ на основе NGS также показывает, что как белок Cas9, так и гидРНК являются существенными для событий NHEJ в локусе-мишени.
Пример XIII
РНК-направляемое NHEJ в клетках K562.
В клетки K562 посредством нуклеофекции вводили конструкты, указанными на левой панели фиг. 10. Через 4 дня после нуклеофекции, частоту NHEJ измеряли оцениванием частоты геномных делеций и инсерций при двуцепочечном разрыве глубоким секвенированием. Панель 1: Частота делеции, детектируемая в районе-мишени. Красные штрихпунктирные линии: граница сайта-мишени Т1 РНК; зеленые штрихпунктирные линии: граница сайта-мишени Т2 РНК. Частоту случаев делеции в каждом положении нуклеотида откладывали на графике в виде в черных линий и рассчитывали частоту делеции как процент прочтений, несущих делецию. Панель 2: Частота инсерции детектируемая в районе-мишени. Красные штрихпунктирные линии: граница сайта-мишени РНК Т1; зеленые штрихпунктирные линии: граница сайта-мишени РНК Т2. Частоту случаев инсерции в геномном местоположении, где обнаруживалось первое встроенное сочленение откладывали на графике в виде в черных линиях и частоту инсерции рассчитывали как процент прочтений, несущих инсерцию. Панель 3: Распределение по размерам делеций. Частоту делеций различных размеров среди всей популяции NHEJ строили в виде графиков. Панель 4: Распределение по размерам инсерций. Частоту инсерций различных размеров по всей популяции строили в виде графиков. Таргетинг на K562 обеими гидРНК является эффективным (13-38%) и последовательность-специфическими (как показано смещением в положении распределений делеции NHEJ). Важно, о чем свидетельствуют пики на гистограмме наблюдаемых частот размеров делений, одновременное введение как Т1, так и Т2 гидРНК приводило к высокой эффективности делении промежуточного фрагмента 19 п.н., демонстрируя, что мультиплексное редактирование геномных локусов также является осуществимым с использованием этого подхода.
Пример XIV
РНК-направляемое NHEJ в клетках 293Т.
Клетки 293Т трансфицировали конструктами, показанными в левой панели фиг. 11. Через 4 дня после нуклеофекции, частота NHEJ измеряли оценивая частоту геномных делеций и инсерций при DSB глубоким секвенированием. Панель 1: Частота делеции, детектируемая в районе-мишени. Красные штрихпунктирные линии: граница сайта-мишени Т1 РНК; зеленые штрихпунктирные линии: граница сайта-мишени Т2 РНК. Частоту случаев делеции в каждом положении нуклеотида откладывали на графике в виде черных линий и рассчитывали частоту делеции как процент прочтений, несущих делеции. Панель 2: Частота инсерций, детектируемая в районе-мишени. Красные штрихпунктирные линии: граница сайта-мишени РНК Т1; зеленые штрихпунктирные линии: граница сайта-мишени РНК Т2. Частоту случаев инсерций в геномном местоположении, где обнаруживалось первое встроенное сочленение откладывали на графике в виде в черных линий и частоту инсерций рассчитывали как процент прочтений, несущих инсерцию. Панель 3: Распределение размеров делеций. Частоты делеций различных размеров среди всей популяции NHEJ строили в виде графиков. Панель 4: Распределение размеров инсерций. Частоты различных размеров инсерций всей популяции строили в виде графиков. Таргетинг 293Т обеими гидРНК является эффективным (10-24%) и последовательность-специфическим (как показано смещением в положении распределений NHEJ делеций).
Пример XV
HR в эндогенном локусе AAVS1 с использованием либо донора дцДНК либо короткого олигонуклеотидного донора.
Как показано на фиг. 12А, ПЦР-скрининг (со ссылкой на фиг. 2С) подтвердил, что 21/24 случайно выбранные клоны 293Τ были успешно таргетированы. Как показано на фиг. 12В, сходный ПЦР-скрининг подтвердил, что 3/7 случайно выбранных клонов PGP1-iPS, были также успешно таргетированными. Как показано на фиг. 12С, короткие 90-мерные олигонуклеотиды могли бы осуществлять эффективное нацеливание в эндогенном локусе AAVS1 (показанное здесь для клеток K562).
Пример XVI
Методология для мультиплексного синтеза, извлечения и клонирования в U6-экспрессирующем векторе направляющих РНК, нацеленных на гены в геноме человека
Создавали источник приблизительно 190k биоинформатически вычисленных уникальных сайтов гидРНК, таргетирующих ~40,5% всех экзонов генов в геноме человека. Как показано на фиг. 13А, эти сайты-мишени гидРНК были включены в формат 200 п.н., который является совместимым с мультиплексным синтезом на ДНК-эрреях. Конкретно, эта конструкция позволяет выполнять (i) нацеленный поиск и выделение определенной мишени или пула мишеней гидРНК из олигонуклеотидного пула ДНК-эррея (посредством 3 последовательных раундов гнездовой ПЦР, как указано на этой фигуре схематически), и (ii) высокую частоту клонирование в используемый экспрессирующий вектор, который после линеаризации с использованием AflII служит в качестве реципиента для опосредуемого сборкой Гибсона включения вставкой фрагмента гидРНК. Как показано на фиг. 13В, этот способ был использован для выполнения нацеленного поиска и выделения 10 уникальных гидРНКs из 12к олигонуклеотидного пула, синтезированного CustomArray Inc.
Пример XVII
CRISPR-опосредованная РНК-направляемая активация транскрипции.
Система CRISPR-Cas является адаптивной иммунозащитной системой в бактериях и функционирует для 'расщепления' вторгающихся нуклеиновых кислот. Согласно одному аспекту, эта система CRISPR-CAS сконструирована для функционирования в клетках человека и для 'расщепления' геномной ДНК. Это достигается короткой гидРНК, направляющей белок Cas9 (который имеет нуклеазную функцию) на последовательность-мишень, комплементарную спейсеру в этой гидРНК. Способность 'расщеплять' ДНК позволяет использовать это во множестве приложений, относящихся к редактированию генома, а также направленной регуляции генома. Для этого, белок Cas9 изменяли чтобы сделать его нуклеаза-нуль введением мутаций, которые, как предсказывалось, аннулируют связывание с Mg2+ (который, как известно, является важным для функций доменов RuvC-подобный и HNH-подобный): Конкретно, вводили комбинации мутаций D10A, D839A, Н840А и N863A. Затем генерированный таким образом нуклеаза-нуль- белок (как подтверждалось его способностью не разрезать ДНК с использованием анализа секвенирования) и здесь далее называемый Cas9R-H-, связывали с доменом активирования транскрипции, здесь это Р64, позволяющий системе CRISPR-cas функционировать в качестве РНК-направляемого фактора транскрипции (см. фиг. 14). Это слияние Cas9R-H-+VP64 делает возможной РНК-направляемую транскрипционную активацию двух показанных репортеров. Конкретно, как FACS-анализ, так и иммунофлуоресцентный анализ демонстрирует, что этот белок позволяет гидРНК- специфическое нацеливание на соответствующие репортеры, и, кроме того, в результате происходит активация транскрипции, что оценивалось анализом экспрессии флуоресцентного белка dTomato, было при уровнях, сходных с уровнями, индуцируемыми стандартным слитым белком TALE-VP64.
Пример XVIII
Гибкость последовательностей гидРНК и ее применения.
Гибкость последовательности каркаса гидРНК для инсерций в целях конструирования последовательностей определяли систематическим анализом для ряда случайных инсерций последовательностей на 5'-, середине и 3'-концах гидРНК: конкретно, ставки 1 п.н., 5 п.н., 10 п.н., 20 п.н. и 40 п.н. выполняли в последовательности гидРНК на 5'-, середине и 3'-концах гидРНК (точные положения инсерций изображены 'красным цветом' на фиг. 15. Затем эту гидРНК тестируют на функциональность по ее способности индуцировать HR (гомологичную рекомбинацию) в анализе с репортером GFP (как описано здесь). Очевидно, что гидРНК являются гибкими относительно встраивания последовательностей на 5'- и 3'-концах (как измерено по поддерживаемой индуцирующей HR активности). Таким образом, аспекты данного раскрытия изобретения направлены прикрепление небольших последовательностей, соответствующих РНК-аптамерам, которые могут запускать появление активности гидРНК, или опосредовать визуализацию гидРНК. Дополнительно, аспекты данного изобретения направлены на прикрепление оцДНК-доноров к гидРНК посредством гибридизации, делая таким образом возможными разрезание и немедленную физическую локализацию матрицы репарации, которая может стимулировать частоту гомологичной рекомбинации в сравнении с допускающим ошибки негомологичным соединением концов.
Следующие ссылки, идентифицированные в разделе Примеров цифрами, включены здесь посредством ссылок в их полном объеме для всех целей.
Ссылки
1. К.S. Makarova et al., Evolution and classification of the CRISPR-Cas systems. Nature reviews. Microbiology 9, 467 (Jun, 2011).
2. M. Jinek et al., A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816 (Aug 17, 2012).
3. P. Horvath, R. Barrangou, CRISPR/Cas, the immune system of bacteria and archaea. Science 327, 167 (Jan 8, 2010).
4. H. Deveau et al., Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. Journal of bacteriology 190, 1390 (Feb, 2008).
5. J.R. van der Ploeg, Analysis of CRISPR in Streptococcus mutans suggests frequent occurrence of acquired immunity against infection by M102-like bacteriophages. Microbiology 155, 1966 (Jun, 2009).
6. M. Rho, Y.W. Wu, H. Tang, T.G. Doak, Y. Ye, Diverse CRISPRs evolving in human microbiomes. PLoS genetics 8, el002441 (2012).
7. D.T. Pride et al, Analysis of streptococcal CRISPRs from human saliva reveals substantial sequence diversity within and between subjects over time. Genome research 21, 126 (Jan, 2011).
8. G. Gasiunas, R. Barrangou, P. Horvath, V. Siksnys, Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proceedings of the National Academy of Sciences of the United States of America 109, E2579 (Sep 25, 2012).
9. R. Sapranauskas et al., The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic acids research 39, 9275 (Nov, 2011).
10. J.E. Garneau et al., The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA. Nature 468, 67 (Nov 4, 2010).
11. K.M. Esvelt, J.C. Carlson, D.R. Liu, A system for the continuous directed evolution of biomolecules. Nature 472, 499 (Apr 28, 2011).
12. R. Barrangou, P. Horvath, CRISPR: new horizons in phage resistance and strain identification. Annual review of food science and technology 3, 143 (2012).
13. B. Wiedenheft, S.H. Sternberg, J.A. Doudna, RNA-guided genetic silencing systems in bacteria and archaea. Nature 482, 331 (Feb 16, 2012).
14. N.E. Sanjana et al., A transcription activator-like effector toolbox for genome engineering. Nature protocols 7, 171 (Jan, 2012).
15. W.J. Kent et al., The human genome browser at UCSC. Genome Res 12, 996 (Jun, 2002).
16. T.R. Dreszer et al., The UCSC Genome Browser database: extensions and updates 2011. Nucleic Acids Res 40, D918 (Jan, 2012).
17. D. Karolchik et al., The UCSC Table Browser data retrieval tool. Nucleic Acids Res 32, D493 (Jan 1, 2004).
18. A.R. Quinlan, I.M. Hall, BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics 26, 841 (Mar 15, 2010).
19. B. Langmead, C. Trapnell, M. Pop, S.L. Salzberg, Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol 10, R25 (2009).
20. R. Lorenz et al., ViennaRNA Package 2.0. Algorithms for molecular biology: AMB6, 26 (2011).
21. D.H. Mathews, J. Sabina, M. Zuker, D.H. Turner, Expanded sequence dependence of thermodynamic parameters improves prediction of RNA secondary structure. Journal of molecular biology 288, 911 (May 21, 1999).
22. R.E. Thurman et al., The accessible chromatin landscape of the human genome. Nature 489, 75 (Sep 6, 2012).
23. S. Kosuri et al., Scalable gene synthesis by selective amplification of DNA pools from high-fidelity microchips. Nature biotechnology 28, 1295 (Dec, 2010).
24. Q. Xu, M.R. Schlabach, G.J. Hannon, S.J. Elledge, Design of 240,000 orthogonal 25mer DNA barcode probes. Proceedings of the National Academy of Sciences of the United States of America 106, 2289 (Feb 17, 2009).
Изобретение относится к биотехнологии. Описан способ генетического изменения эукариотической клетки. Обеспечивают в эукариотической клетке последовательность направляющей РНК, комплементарную последовательности-мишени нуклеиновой кислоты, причем последовательность направляющей РНК связывается с последовательностью-мишенью нуклеиновой кислоты, и обеспечивают в эукариотической клетке белок Cas9, модифицированный белок Cas9 или гомолог белка Cas9, который взаимодействует с последовательностью направляющей РНК, где клетка не является клеткой зародышевой линии человека. 24 з.п. ф-лы, 15 ил.