Код документа: RU2757424C1
[Область изобретения]
Описание настоящего изобретения относится к микроорганизму, продуцирующему микоспорин-подобную аминокислоту, и к способу получения микоспорин-подобной аминокислоты с использованием микроорганизма.
[Предшествующий уровень техники]
Ультрафиолетовые (УФ) лучи, излучаемые солнцем, состоят из УФ-А (с длиной волны от приблизительно 320 нм до приблизительно 400 нм), УФ-В (с длиной волны от приблизительно 290 нм до приблизительно 320 нм) и УФ-С (с длиной волны от приблизительно 100 нм до приблизительно 280 нм). Известно, что лучи УФ-А проникают в слой кожи, в основном вызывая пигментацию и старение кожи, и вовлечены в возникновение светочувствительного заболевания кожи, тогда как лучи УФ-В представляют собой лучи, несущие высокий уровень энергии, которые проникают в эпидермис и базальный слой дермы и вовлечены в возникновение солнечных ожогов, пигментацию и возникновение рака кожи.
Для того, чтобы предотвратить эти побочные действия УФ лучей, предпринимаются попытки блокировать УФ лучи. Типы солнцезащитных агентов включают химические солнцезащитные агенты и физические солнцезащитные агенты. Химические солнцезащитные агенты предотвращают проникновение УФ лучей в основном путем поглощения УФ лучей, тогда как физические солнцезащитные агенты предотвращают проникновение УФ лучей путем отражения и рассеяния.
Компоненты, которые, как известно, содержатся в химических солнцезащитных агентах, могут включать агенты, которые в основном поглощают лучи УФ-В (например РАВА (пара-аминобензойная кислота), сложные эфиры РАВА (амилдиметил-РАВА, октилдиметил-РАВА), циннаматы (циноксат), салицилаты (гомоментил-салицилат), камфора и т.п.); и агенты, которые в основном поглощают лучи УФ-А (например бензофеноны (оксибензон, диоксибензон и сульфобензол), дибензоилметан, антранилат и т.п.). Хотя эти химические солнцезащитные агенты могут обеспечить действия, поглощающие и блокирующие УФ лучи, известно, что некоторые из этих химических солнцезащитных агентов могут раздражать кожу или глаза, и, в частности, РАВА, сложные эфиры РАВА, бензофеноны и циннаматы и т.п.могут вызывать контактный дерматит.Дополнительно, сообщалось о том, что другие из этих химических солнцезащитных агентов вызывают светочувствительную реакцию на коже и т.п.Соответственно, в некоторых странах применение или объем использования этих химических солнцезащитных агентов ограничен.
Компоненты, которые, как известно, содержатся в физических солнцезащитных агентах, могут включать диоксид титана, тальк (силикат магния), оксид магния, оксид цинка, каолин и т.п. Физические солнцезащитные агенты обладают преимуществами, заключающимися в том, что они не вызывают побочные действия, такие как контактный дерматит, и что они не удаляются легко водой. Тем не менее, они обладают недостатками, заключающимися в том, что сложно с их помощью поддерживать эффективное содержание при использовании желаемых композиций и что возникает белый налет и т.п. при их нанесении на кожу.
Микоспорин-подобные аминокислоты (МАА) представляют собой вещества, представленные в организмах в природе и они, как известно, эффективно поглощают УФ-А и УФ-В. Известно, что в природе существует более 35 видов МАА {Mar. Biol., 1991, 108: 157-166; Planta Med., 2015, 81: 813-820). Недавно сообщали о том, что МАА, к которым прикреплены различные типы Сахаров, существуют в микроводорослях, и они обладают превосходной антиоксидантной функцией (Journal of Photochemistry and Photobiology, 2015, 142: 154-168). Дополнительно, МАА, как известно, обеспечивают не только способность блокировать УФ лучи, но также устойчивость к окислению, осмосу, температурному стрессу и т.п. (Comp. Biochem. Physiol.C Toxicol. Pharmacol., 2007, 146: 60-78; J. Photochem. Photobiol. В., 2007, 89: 29-35).
Тем не менее, количество МАА, продуцируемое в микроводорослях, является очень низким, находясь на уровне нескольких микрограмм, и условия для разделения, экстракции и очистки МАА после культивирования микроводорослей затруднены. Таким образом, сложно массово продуцировать материал МАА.
[Документы предшествующего уровня техники]
[Непатентные документы]
(Непатентный документ 1) Comp. Biochem. Physiol. В 1995, 112: 105-114.
(Непатентный документ 2) FEMSMicrobiol Lett. 2007,269: 1-10.
(Непатентный документ 3) Ann.Rev. Physiol. 2002, 64: 223-262.
Непатентный документ 4) Mar. Biol. 1991, 108: 157-166.
(Непатентный документ 5) Journal of Photochemistry and Photobiology В: Biology. 2015, 142: 154-168
(Непатентный документ 6) Biol. Rev. 1999, 74: 311-345.
(Непатентный документ 7) Mol. Biol. Evol. 2006, 23: 1437-1443.
(Непатентный документ 8) Science, 2010, 329: 1653-1656.
(Непатентный документ 9) Genomics 2010, 95: 120-128.
(Непатентный документ 10) Geomicrobiol. J. 1997. 14: 231-241.
(Непатентный документ 11) Comp. Biochem. Physiol. С Toxicol. Pharmacol. 2007. 146: 60-78.
(Непатентный документ 12) Can. J. Bot. 2003. 81: 131-138.
(Непатентный документ 13) J. Photochem. Photobiol. B. 2007, 89: 29-35.
(Непатентный документ 14) J. Bacteriol. 2011. 193(21): 5923-5928.
(Непатентный документ 15) Planta Med. 2015. 81: 813-820
(Непатентный документ 16) ACS Appl. Mater. Interfaces. 2015. 7: 16558-16564
(Непатентный документ 11) Appl Environ Microbiol. 2016, 82(20): 6167-6173
(Непатентный документ 18) ChemBioChem. 2015, 16: 320-327
(Непатентный документ 19) MethodsMolBiol. 2013, 1073: 43-7
(Непатентный документ 20) Nature Review, 2011, 9: 791-802
[Описание изобретения]
[Техническая проблема]
Авторы настоящего изобретения предприняли множество попыток для увеличения продукции МАА в микроорганизмах. В результате они подтвердили то, что продукция МАА может быть увеличена в микроорганизмах, продуцирующих МАА, при помощи различных исследований, ассоциированных с усилением активности белков 2-дегидро-3-дезоксифосфогептонатальдолазы, фосфоенолпируватсинтетазы и транскетолазы в микроорганизмах, таким образом, завершая описание настоящего изобретения.
[Техническое решение]
Задача в соответствии с описанием настоящего изобретения заключается в том, чтобы предложить микроорганизм, продуцирующий микоспорин-подобную аминокислоту (ММА), в котором усилена активность по меньшей мере одного белка, выбранного из группы, состоящей из 2-дегидро-3-дезоксифосфогептонатальдолазы,
фосфоенолпируватсинтетазы и транскетолазы.
Еще одна задача в соответствии с описанием настоящего изобретения заключается в том, чтобы предложить способ получения микоспорин-подобной аминокислоты, который включает культивирование микроорганизма в среде; и выделение микоспорин-подобной аминокислоты из культивированного микроорганизма или среды.
Еще одна задача в соответствии с описанием настоящего изобретения заключается в том, чтобы предложить применение микроорганизма для продуцирования микоспорин-подобной аминокислоты.
[Благоприятные эффекты]
Поскольку микроорганизм в соответствии с описанием настоящего изобретения обладает увеличенной способностью продуцировать микоспорин-подобную аминокислоту (ММА), он может быть эффективно использован в получении микоспорин-подобных аминокислот.
[Наилучший способ осуществления изобретения]
Описание настоящего изобретения подробно изложено ниже. В то же самое время, соответствующие описания и воплощения, раскрытые в описании настоящего изобретения, также могут быть применены в отношении других описаний и воплощений. То есть, все комбинации различных элементов, раскрытые в описании настоящего изобретения, оказываются в объеме изобретения в соответствии с описанием настоящего изобретения. Кроме того, объем изобретения в соответствии с описанием настоящего изобретения не ограничивается приведенным ниже конкретным описанием изобретения. Кроме того, специалист в данной области техники может обнаружить или идентифицировать множество эквивалентов некоторых аспектов в соответствии с описанием настоящего изобретения исключительно при помощи стандартных экспериментов. Кроме того, предполагается, что такие эквиваленты включены в описание настоящего изобретения.
Для достижения вышеприведенных задач в аспекте в соответствии с описанием настоящего изобретения предложен микроорганизм, продуцирующий микоспорин-подобную аминокислоту (ММА), в котором усилена активность по меньшей мере одного белка, выбранного из группы, состоящей из 2-дегидро-3-дезоксифосфогептонатальдолазы, фосфоенолпируватсинтетазы и транскетолазы.
Используемый здесь термин "2-дегидро-3-дезоксифосфогептонатальдолаза" относится к ферменту, который катализирует обратимую реакцию на следующей реакционной схеме, и, в частности, может относиться к ферменту, который синтезирует 3-дезокси-D-арабино-гептулозонат-7-фосфат (DAHP), но не ограничивается ими.
[Реакционная схема]
Фосфоенолпируват + D-эритроза-4-фосфат + Н2О
↔ 3-дезокси-D-арабиногептулозонат-7-фосфат + фосфат
В описании настоящего изобретения 2-дегидро-3-дезоксифосфогептонатальдолаза может быть использована взаимозаменяемо с 3-дезокси-D-арабино-гептулозонат-7-фосфат (DAHP) синтазой.
Используемый здесь термин "фосфоенолпируватсинтетаза" относится к ферменту, который катализирует обратимую реакцию на следующей реакционной схеме, и, в частности, может относиться к ферменту, который синтезирует фосфоенолпируват, но не ограничивается им.
[Реакционная схема]
АТФ + пируват +Н2О
↔ AMP + фосфоенолпируват + фосфат
Используемый здесь термин "транскетолаза" относится к ферменту, который катализирует обратимую реакцию на следующей реакционной схеме.
[Реакционная схема]
Седогептулозо-7-фосфат+ D-глицеральдегид-3-фосфат
↔ D-рибозо-5-фосфат + D-ксилулозо-5-фосфат
или
Фруктозо-6-фосфат + D-глицеральдегид-3-фосфат
↔ эритрозо-4-фосфат + D-ксилулозо-5-фосфат
Генетическая информация о 2-дегидро-3-дезоксифосфогептонатальдолазе, фосфоенолпируватсинтетазе и транскетолазе могут быть получены в известной базе данных (например GenBank database в National Center for Biotechnology Information (Национальном центре биотехнологической информации) (NCBI) и т.п.), но не ограничивается ей.
2-Дегидро-3-дезоксифосфогептонатальдолаза, фосфоенолпируватсинтетаза и транскетолаза не ограничиваются своим происхождением или последовательностями, поскольку существуют случаи, когда белки, демонстрирующие активности, отличаются по своим аминокислотным последовательностям в зависимости от видов микроорганизма или самого микроорганизма.
В частности, 2-дегидро-3-дезоксифосфогептонатальдолаза может представлять собой белок, включающий аминокислотную последовательность в соответствии с SEQ ID NO: 2, 37 или 124; фосфоенолпируватсинтетаза может представлять собой белок, включающий аминокислотную последовательность в соответствии с SEQ ID NO: 19 или 98; и транскетолаза может представлять собой белок, включающий аминокислотную последовательность в соответствии с SEQ ID NO: 24, 96 или 123, но аминокислотные последовательности этих белков не ограничиваются ими. Используемый здесь термин "белок, включающий аминокислотную последовательность" может быть использован взаимозаменяемо с выражением "белок, имеющий аминокислотную последовательность", или "белок, состоящий из аминокислотной последовательности".
Дополнительно, в описании настоящего изобретения эти ферменты могут включать белки, которые имеют аминокислотные последовательности в соответствии с SEQ ID NO, описанными выше, а также 80% или более высокую, 85% или более высокую, 90% или более высокую, 91% или более высокую, 92% или более высокую, 93% или более высокую, 94% или более высокую, 95% или более высокую, 96% или более высокую, 97% или более высокую, 98% или более высокую, 99% или более высокую гомологию или идентичность с вышеприведенными аминокислотными последовательностями, до тех пор, пока белки обладают биологической активностью, идентичной или соответствующей каждому из этих ферментов.
Дополнительно, понятно, что любой белок, который имеет аминокислотную последовательность с делецией, модификацией, заменой или добавлением части последовательности, также может быть включен в объем изобретения в соответствии с описанием настоящего изобретения, до тех пор, пока аминокислотная последовательность обладает гомологией или идентичностью с SEQ ID NO, описанными выше, и обладает биологической активностью, по существу идентичной или соответствующей белкам ферментов в соответствии с SEQ ID NO, описанными выше.
Используемый здесь термин "гомология или идентичность" относится к степени соответствия между заданными аминокислотными последовательностями или нуклеотидными последовательностями, и могут быть выражены в процентных долях. В описании настоящего изобретения гомологичная последовательность, обладающая активностью, идентичной или похожей на активность для заданной аминокислотной последовательности или нуклеотидной последовательности, представлена как "% гомологии" или "% идентичности". Например, гомология может быть подтверждена с использованием стандартного программного обеспечения, в частности BLAST 2.0, для расчета параметров, таких как оценка, идентичность и сходство, или путем сравнения последовательностей путем гибридизации по Саузерну при определенных жестких условиях. Определенные подходящие условия гибридизации могут находиться в объеме уровня техники и могут быть определены при помощи способа, хорошо известного специалистам в данной области техники (например J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York). Термин "жесткие условия" относится к условиям, которые обеспечивают специфическую гибридизацию между полинуклеотидами. Например, такие условия, в частности, раскрыты в литературе (например J. Sambrook et al., выше).
2-Дегидро-3-дезоксифосфогептонатальдолаза, фосфоенолпируватсинтетаза и транскетолаза в соответствии с описанием настоящего изобретения могут включать полинуклеотиды, кодирующие белки, которые имеют аминокислотные последовательности в соответствии с описанными выше SEQ ID NO, или 80% или более высокую, 85% или более высокую, 90% или более высокую, 91% или более высокую, 92% или более высокую, 93% или более высокую, 94% или более высокую, 95% или более высокую, 96% или более высокую, 97% или более высокую, 98% или более высокую, 99% или более высокую гомологию или идентичность с аминокислотными последовательностями в соответствии с SEQ ID NO, описанными выше, до тех пор, пока эти полинуклеотиды обладают биологической активностью, идентичной или соответствующей каждому из этих ферментов.
Дополнительно, рассматривая кодоны, предпочтительные в организме, когда должен экспрессироваться белок, вследствие вырожденности кодонов различные модификации могут быть осуществлены в кодирующей области нуклеотидной последовательности в объеме изобретения, не изменяющие аминокислотную последовательность белка, экспрессирующегося с кодирующей области. Таким образом, любой полинуклеотид, имеющий последовательность, кодирующую каждый из белков-ферментов, может быть включен без ограничения.
Дополнительно, любая последовательность, которая кодирует белок, обладающий активностью белков-ферментов 2-дегидро-3-дезоксифосфогептонатальдолазы,
фосфоенолпируватсинтетазы или транскетолазы, путем гибридизации с любым зондом, который могут быть получен из известных последовательностей генов (например последовательности, комплементарные всей или части вышеприведенной полинуклеотидной последовательности), в жестких условиях, может быть включена без ограничения.
Термин "жесткие условия" относится к условиям, которые обеспечивают специфическую гибридизацию между полинуклеотидами. Такие условия, в частности, описаны в литературе (например J Sambrook et al., выше). Например условия гибридизации между генами, имеющими высокую гомологию или идентичность, гомология или идентичность 40% или выше, в частности, 90% или выше, в частности, 95% или выше, в частности, 97% или выше, и, в частности, 99% или выше, без гибридизации между генами, имеющими гомологию или идентичность ниже, чем гомологии или идентичности, описанные выше; или могут быть перечислены обычные условия отмывания для гибридизации по Саузерну, т.е. однократное отмывание, в частности, два или три раза при концентрации соли и температуре, соответствующей 60°С, 1×SSC, 0,1% SDS (додецилсульфат натрия), в частности 60°С, 0,1×SSC, 0,1% SDS, и, в частности, 68°С, 0,1×SSC, 0,1% SDS.
Гибридизация требует того, что два полинуклеотида обладают комплементарными последовательностями, хотя некомплементарности между основаниями возможны в зависимости от жесткости гибридизации. Термин "комплементарный" используют для описания взаимосвязи между нуклеотидными основаниями, которые могут гибрид изо в аться друг с другом. Например, в отношении ДНК аденозин комплементарен тимину и цитозин комплементарен гуанину. Соответственно, описание настоящего изобретения также может включать выделенные полинуклеотидные фрагменты, комплементарные полноразмерной последовательности, а также, по существу, похожие полинуклеотидные последовательности.
В частности, полинуклеотиды, обладающие гомологией или идентичностью, могут быть обнаружены с использованием условий гибридизации, которые включают стадию гибридизации при величине Tm 55°С и с использованием условий, описанных выше. Дополнительно, величина Tm может составлять 60°С, 63°С или 65°С, но температура не ограничивается ими, и может быть подходящим образом скорректирована специалистом в данной области техники в зависимости от задачи.
Жесткость, подходящая для гибридизации полинуклеотидов, зависит от длины и степени комплементарности полинуклеотидов, и варианты хорошо известны в области техники (смотри Sambrook et al., выше, 9.50-9.51 и 11.7-11.8). Используемый здесь термин "усиление активности" означает, что введена активность белка-фермента, или активность усилена по сравнению с собственной эндогенной активностью или активностью до его модификации, которую демонстрирует микроорганизм. "Введение" активности означает, что микроорганизм естественным или искусственным образом демонстрирует активность конкретного белка, которая исходно не демонстрируется микроорганизмом. В частности, микроорганизм с усиленной активностью белка-фермента относится к микроорганизму, в котором активность белка-фермента усилена по сравнению с активностью природного микроорганизма дикого типа или немодифицированного микроорганизма. Усиление активности может включать, например как усиление активности путем введения экзогенной 2-дегидро-3-дезоксифосфогептонатальдолазы, фосфоенолпируватсинтетазы и/или транскетолазы в микроорганизм; так и усиление активности эндогенных 2-дегидро-3-дезоксифосфогептонатальдолазы, фосфоенолпируватсинтетазы и/или транскетолазы.
В частности, в описании настоящего изобретения способ усиления активности может включать:
(1) способ увеличения количества копий полинуклеотидов, кодирующих ферменты;
(2) способ модификации последовательности, контролирующей экспрессию, для увеличения экспрессии полинуклеотидов;
(3) способ модификации полинуклеотидных последовательностей на хромосоме для усиления активностей ферментов; или
(4) способ модификации для усиления путем комбинирования вышеприведенных способов (1)-(3) и т.п, но способы не ограничиваются ими.
Способ (1) увеличения количества копий полинуклеотидов может быть осуществлен в форме, при которой полинуклеотид функционально связан с вектором, или путем встраивания полинуклеотида в хромосому клетки-хозяина, но не ограничен конкретно ими. Дополнительно, в качестве альтернативы, количество копий может быть увеличено путем введения экзогенного полинуклеотида, демонстрирующего активность фермента, или оптимизированного по кодонам модифицированного полинуклеотида относительно вышеприведенного полинуклеотида в клетку-хозяина. Экзогенный полинуклеотид может быть использован без ограничения своего происхождения или последовательности до тех пор, пока полинуклеотид демонстрирует активность, идентичную или похожую на активность фермента. Введение может быть осуществлено специалистом в данной области техники путем надлежащего выбора известного способа трансформации, и активность фермента может быть усилена таким образом, что введенный полинуклеотид экспрессируется в клетке-хозяине, таким образом, продуцируя фермент.
Затем, способ (2) модификации последовательности, контролирующей экспрессию, для увеличения экспрессии полинуклеотидов, может быть осуществлен путем индукции модификации в последовательности путем делеции, вставки, неконсервативной или консервативной замены или их комбинации для дополнительного усиления активности последовательности, контролирующей экспрессию; или путем замены последовательности нуклеиновой кислоты на последовательность нуклеиновой кислоты, обладающую более сильной активностью, но способ по существу не ограничивается ими. Последовательность, контролирующая экспрессию, может включать промотор, операторную последовательность, последовательность, кодирующую сайт связывания с рибосомой, последовательности, контролирующие прекращение транскрипции и трансляции и т.п., но последовательность, контролирующая экспрессию, не ограничена конкретно ими.
В частности, сильный гетерологический промотор вместо исходного промотора может быть связан выше относительно полинуклеотидного экспрессирующегося фрагмента, и примеры сильного промотора могут включать промотор CJ7, промотор lysCP1, промотор EF-Tu, промотор groEL, промотор асе А или асеВ и т.п. В частности, полинуклеотидный экспрессирующийся фрагмент может быть функционально связан с промотором, происходящим из Corynebacterium, таким как промотор lysCP1 (WO 2009/096689), промотор CJ7 (WO 2006/065095), промотор SPL (KR 10-1783170 В) или промотор о2 (KR 10-1632642 В), для улучшения уровня экспрессии полинуклеотида, кодирующего фермент, но способ не ограничивается ими.
Дополнительно, способ (3) модификации полинуклеотидной последовательности на хромосоме может быть осуществлен путем индукции модификации в последовательности, контролирующей экспрессию, путем делеции, вставки, неконсервативной или консервативной замены или их комбинации для дополнительного усиления активности полинуклеотидной последовательности; или путем замены последовательности нуклеиновой кислоты на улучшенную полинуклеотидную последовательность, обладающую более сильной активностью, но способ не ограничивается конкретно ими.
Наконец, способ (4) модификации для усиления путем комбинирования способов (1)-(3) может быть осуществлен путем применения вместе одного или более чем одного способа из числа способов: способа увеличения числа копий полинуклеотидов, кодирующих ферменты; способа модификации последовательности, контролирующей экспрессию, для увеличения экспрессии; и способа модификации полинуклеотидных последовательностей на хромосоме или способа модификации экзогенных полинуклеотидов, демонстрирующих активность фермента или его оптимизированного по кодонам модифицированного полинуклеотида.
Полинуклеотиды могут быть описаны как гены, когда они представляют собой ансамбль из полинуклеотидов, способных функционировать. В описании настоящего изобретения полинуклеотиды и гены могут быть использованы взаимозаменяемо, и полинуклеотидные последовательности и нуклеотидные последовательности могут быть использованы взаимозаменяемо.
Используемый здесь термин "вектор" относится к конструкции ДНК, включающей нуклеотидную последовательность полинуклеотида, кодирующего желаемый белок, в которой желаемый белок функционально связан с подходящей контролирующей последовательностью таким образом, что он может экспрессироваться в подходящем хозяине. Контролирующая последовательность может включать промотор, способный инициировать транскрипцию, любую операторную последовательность для контроля транскрипции, последовательность, кодирующую подходящий сайт связывания мРНК с рибосомой, и последовательности, контролирующие прекращение транскрипции и трансляции. Вектор после трансформации в подходящую клетку-хозяина может реплицироваться или функционировать независимо от генома хозяина, или может интегрироваться в геном самого хозяина.
Вектор, используемый в описании настоящего изобретения, не ограничен конкретным образом, пока вектор может реплицироваться в клетке-хозяине, и может быть использован любой вектор, известный в области техники. Примеры обычных векторов могут включать природную или рекомбинантную плазмиду, космиду, вирус и бактериофаг.Например pWE15, М13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A и Charon21A и т.п. могут быть использованы в качестве фагового вектора или космидного вектора; и pBR, pUC, pBluescriptII, pGEM, pTZ, pCL и pET и т.п.могут быть использованы в качестве плазмидного вектора. В частности, могут быть использованы векторы, такие как pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC, pSKH, pRS-413, pRS-414 и pRS-415 и т.п., но векторы не ограничиваются ими.
Векторы, используемые в описании настоящего изобретения, не ограничены конкретным образом, и может быть использован любой экспрессирующий вектор. Дополнительно, полинуклеотид, кодирующий желаемый белок на хромосоме, может быть встроен в хромосому при помощи вектора для хромосомного встраивания в клетку. Встраивание полинуклеотида в хромосому может быть осуществлено с использованием любого способа, известного в области техники (например, путем гомологичной рекомбинации), но способ встраивания не ограничивается ими. Также может быть включен селективный маркер для подтверждения встраивания в хромосому. Селективный маркер используется для отбора клеток, трансформированных вектором (т.е. для подтверждения того, встроилась ли желаемая молекула нуклеиновой кислоты), и могут быть использованы маркеры, способные обозначать отбираемые фенотипы (например лекарственная устойчивость, ауксотрофность, устойчивость к цитотоксическим агентам и экспрессия поверхностных белков). В условиях, когда обрабатывают селективными агентами, тогда только клетки, способные экспрессировать селективные маркеры, могут выживать или экспрессировать другие фенотипические признаки, и, таким образом, легко могут быть отобраны трансформированные клетки.
Используемый здесь термин "трансформация" относится к введению вектора, включающего полинуклеотид, кодирующий желаемый белок, в клетку-хозяина, таким образом, что белок, кодируемый полинуклеотидом, может экспрессироваться в клетке-хозяине. Трансформированный полинуклеотид может не ограничиваться конкретным образом, пока он может экспрессироваться в клетке-хозяине независимо от того, встроен ли трансформированный полинуклеотид в хромосому клетки-хозяина, располагаясь в ней, или располагается за пределами хромосомы. Дополнительно, полинуклеотид включает ДНК и РНК, кодирующие желаемый белок. До тех пор, пока полинуклеотид может быть введен в клетку-хозяина и экспрессироваться в ней, не имеет значения, в какой форме встроен полинуклеотид. Например полинуклеотид может быть введен в клетку-хозяина в форме экспрессионной кассеты, которая представляет собой генную конструкцию, включающую все элементы, необходимые для ее экспрессии. Экспрессионная кассета может включать промотор, который функционально связан с полинуклеотидом, сигнал прекращения транскрипции, сайт связывания с рибосомой и сигнал прекращения трансляции. Экспрессионная кассета может представлять собой самореплицирующийся экспрессирующий вектор. Дополнительно, полинуклеотид может представлять собой полинуклеотид, который вводят в клетку-хозяина в виде самого полинуклеотида и который связан с последовательностью, необходимой для экспрессии в клетке-хозяине, но не ограничивается ими. Способы трансформации включают любой способ введения в клетку нуклеиновой кислоты, и могут быть осуществлены путем выбора подходящего стандартного способа, известного в области техники, в зависимости от клетки-хозяина. Например, способы трансформации могут включать электропорацию, осаждение при помощи фосфата кальция (CaPO4), осаждение при помощи хлорида кальция (CaCl2), микроинъекцию, полиэтиленгликолевый способ (PEG), способ с использованием ЕАЕ-декстрана, катионный липосомальный способ, способ с использованием ацетата лития-DMSO (диметилсульфоксид) и т.п., но способы не ограничиваются ими.
Дополнительно, используемый здесь темин "функционально связанный" обозначает функциональную связь между промоторной последовательностью, которая инициирует и опосредует транскрипцию полинуклеотида, кодирующего желаемый белок в соответствии с описанием настоящего изобретения, и полинуклеотидной последовательностью. Функциональная связь может быть получена при помощи способа генетической рекомбинации, известного в области техники, и сайт-специфическое расщепление ДНК и лигирование могут быть осуществлены с использованием рестрикционного фермента, лигазы и т.п., известных в области техники, не ограничиваясь ими.
В микроорганизме в соответствии с описанием настоящего изобретения активность 3-дегидрохинатдегидратазы может быть дополнительно инактивирована.
Используемый здесь термин "3-дегидрохинатдегидратаза" относится к ферменту, который катализирует обратимую реакцию в приведенной ниже реакционной схеме, и, в частности, она может превращать 3-дегидрохинат в 3-дегидрошикимат, но не ограничивается ими.
[Реакционная схема]
3-дегидрохинат ↔ 3-дегидрошикимат + Н2О
3-Дегидрохинатдегидратаза не ограничена в своем происхождении или последовательности, поскольку существуют случаи, когда белки, демонстрирующие активность 3-дегидрохинатдегидратазы, отличаются по своей аминокислотной последовательности в зависимости от вида микроорганизма или микроорганизмов. В частности, 3-дегидрохинатдегидратаза может представлять собой белок, включающий аминокислотную последовательность в соответствии с SEQ ID NO: 90, но не ограничивается ей. Дополнительно, 3-дегидрохинатдегидратаза может включать аминокислотную последовательность в соответствии с SEQ ID NO: 90 или аминокислотную последовательность, обладающую гомологией или идентичностью по меньшей мере на 80%, 90%, 95%, 96%, 97%, 98% или 99% с SEQ ID NO: 90. Дополнительно, понятно, что любая аминокислотная последовательность с делецией, модификацией, заменой или добавлением части последовательности также может быть включена в объем изобретения в соответствии с описанием настоящего изобретения до тех пор, пока аминокислотная последовательность обладает гомологией или идентичностью, описанными выше, и обладает биологической активностью, идентичной или соответствующей вышеприведенному белку.
Используемый здесь термин "инактивация" относится к случаю, когда активность белка фермента ослаблена по сравнению с эндогенной активностью белка фермента или его активностью до модификации, исходно демонстрируемой микроорганизмом; случаю, когда белок не экспрессируется вовсе; или случаю, когда белок экспрессируется, но не обладает активностью. Инактивация представляет собой ситуацию, которая включает: случай, когда активность самого фермента ослаблена по сравнению с его эндогенной активностью, демонстрируемой микроорганизмом, вследствие модификации полинуклеотида, кодирующего фермент, и т.п, или активность удалена; случай, когда степень общей внутриклеточной активности фермента ниже по сравнению с активностью в микроорганизме дикого типа или активность удалена вследствие ингибирования экспрессии или трансляции гена, кодирующего фермент, и т.п; случай, когда весь ген или часть гена, кодирующего фермент, удален; и их комбинация, но инактивация не ограничивается ими. То есть, микроорганизм, в котором активность фермента инактивирована, относится к микроорганизму, в котором активность белка-фермента ниже по сравнению с активностью у его природного микроорганизма дикого типа или немодифицированного микроорганизма или в котором активность удалена.
Инактивация активности фермента может быть достигнута путем применения различных способов, известных в области техники. Примеры вышеприведенных способов могут включать: 1) способ делеции на хромосоме всего гена или части гена, кодирующего фермент; 2) способ модификации на хромосоме последовательности, контролирующей экспрессию, для уменьшения экспрессии гена, кодирующего белок; 3) способ модификации на хромосоме последовательности гена, кодирующего белок, таким образом, что активность белка удаляется или ослабляется; 4) способ введения антисмыслового олигонуклеотида (например антисмысловой РНК), который комплементарно связывается с транскриптом гена на хромосоме, кодирующего белок; 5) способ, приводящий к невозможности прикрепления рибосомы за счет вторичной структуры, образующейся при добавлении последовательности, которая комплементарна последовательности Шайна-Дальгарно (SD), на переднем конце последовательности SD гена на хромосоме, кодирующего белок; 6) способ инженерии с обратной транскрипцией (RTE), при котором промотор, который транскрибируется в обратном направлении добавляется по 3'-концу открытой рамки считывания (ORF) полинуклеотидной последовательности, кодирующей белок, и т.п; и инактивация может быть осуществлена путем их комбинирования, но способы не ограничены конкретно ими.
Способ делеции всего гена или части гена на хромосоме, кодирующего фермент, может быть осуществлен путем замены полинуклеотида на хромосоме, кодирующего эндогенный желаемый белок, на полинуклеотид или маркерный ген, имеющий частично подвергнутую делеции нуклеотидную последовательность, с использованием вектора для встраивания в хромосому. В качестве примера способа делеции всего или части полинуклеотида может быть использован способ делеции полинуклеотида путем гомологичной рекомбинации, но способ не ограничивается им.
Способ модификации последовательности, контролирующей экспрессию, может быть осуществлен путем индукции модификации последовательности нуклеиновой кислоты в последовательности, контролирующей экспрессию, путем делеции, вставки, консервативной или неконсервативной замены или их комбинации таким образом, чтобы дополнительно ослабить активность последовательности, контролирующей экспрессию; или путем замены последовательности нуклеиновой кислоты на последовательность нуклеиновой кислоты, обладающую более слабой активностью. Последовательность, контролирующая экспрессию, может включать промотор, операторную последовательность, последовательность, кодирующую сайт связывания с рибосомой, и последовательность для регулирования транскрипции и трансляции, но не ограничивается ими.
Способ модификации последовательности гена на хромосоме может быть осуществлен путем индукции модификации в последовательности гена путем делеции, вставки, консервативной или неконсервативной замены или их комбинации таким образом, чтобы дополнительно ослабить активность фермента; или путем замены последовательности гена на последовательность гена, модифицированного таким образом, что он обладает более слабой активностью, или на последовательность гена, модифицированного таким образом, что он вовсе не обладает активностью, но способ не ограничивается ими.
В вышеприведенном описании термин "часть", независимо от того, что может варьировать в зависимости от типа полинуклеотида, может составлять, в частности, от 1 нуклеотида до 300 нуклеотидов, в частности, от 1 нуклеотида до 100 нуклеотидов, и, в частности, от 1 нуклеотида до 50 нуклеотидов, но не ограничивается конкретно ими.
В микроорганизме в соответствии с описанием настоящего изобретения активность белка 3-дегидрохинатсинтазы может быть дополнительно усилена по сравнению с активностью у немодифицированного микроорганизма.
3-Дегидрохинатсинтаза относится к ферменту, который катализирует обратимую реакцию следующей реакционной схемы, и, в частности, может синтезировать 3-дегидрохинат (3-DHQ), но не ограничивается ими.
[Реакционная схема]
3-дезокси-арабино-гептулозонат-7-фосфат
↔ 3-дегидрохинат + фосфат
Используемый здесь термин "микоспорин-подобная аминокислота (МАА)" относится к циклическому соединению, которое поглощает ультрафиолетовые (УФ) лучи. В описании настоящего изобретения микоспорин-подобная аминокислота не ограничена до тех пор, пока она может поглощать УФ лучи, и в частности, она может представлять собой соединение, которое имеет центральное кольцо циклогексанона или циклогексенимина; или может представлять собой соединение, в котором различные вещества (например аминокислоты и т.п.) связаны с центральным кольцом, и, в частности, оно может представлять собой микоспорин-2-глицин, палитинол, палитеновую кислоту, дезоксигадузол, микоспорин-метиламин-треонин, микоспорин-глицин-валин, палитин, астерину-330 (asterina-330), шинорин, порфиру-334 porphyra-334), эухалотец-362 (euhalothece-362), микоспорин-глицин, микоспорин-орнитин, микоспорин-лизин, микоспорин-глутаминовая кислота-глицин, микоспорин-метиламин-серин, микоспорин-таурин, палитен, палитин-серин, палитин-серин-сульфат, палитинол, усуджирен или их комбинацию.
В описании настоящего изобретения термин микоспорин-подобная аминокислота может быть использован взаимозаменяемо с МАА и МАА.
Используемый здесь термин "микроорганизм, продуцирующий микоспорин-подобную аминокислоту (МАА)" может относиться к микроорганизму, который включает ген фермента, вовлеченного в биосинтез МАА, или кластер этих генов, или микроорганизму, в котором кластер введен или усилен. Дополнительно, используемый здесь термин "кластер генов биосинтеза микоспорин-подобной аминокислоты (МАА)" может относиться к группе генов, кодирующих ферменты, вовлеченные в биосинтез МАА, и, в частности, может включать ген биосинтеза МАА, ген фермента, обладающего активностью, присоединяющей дополнительный аминокислотный остаток к МАА, или кластер вышеприведенных генов. Ген биосинтеза МАА включает как экзогенные гены, так и/или эндогенные гены микроорганизма, до тех пор, пока микроорганизм, включающий такой ген, может продуцировать МАА. Экзогенные гены могут быть гомогенными или гетерогенными.
Виды микроорганизмов, из которых происходит ген биосинтеза МАА, не ограничены, пока микроорганизмы, включающие этот ген, могут продуцировать ферменты, вовлеченные в биосинтез МАА, и следовательно могут продуцировать МАА. В частности, виды микроорганизмов, из которых происходит ген биосинтеза МАА, могут представлять собой цианобактерии (например Anabaena variabilis, Nostoc punctiforme, Nodularia spumigena, Cyanothece sp. PCC 7424, Lyngbya sp. PCC 8106, Microcystis aeruginosa, Microcoleus chthonoplastes, Cyanothece sp. ATCC 51142, Crocosphaera watsonii, Cyanothece sp. CCY 0110, Cylindrospermum stagnate sp. PCC 7417, Aphanothece halophytica или Trichodesmium erythraeum); грибы (например Magnaporthe orzyae, Pyrenophora tritici-repentis, Aspergillus clavatus, Nectria haematococca, Aspergillus nidulans, Gibberella zeae, Verticillium albo-atrum, Botryotinia fuckeliana или Phaeosphaeria nodorum); или Nematostella vectensis; Heterocapsa triquetra, Oxyrrhis marina, Karlodinium micrum, Actinosynnema mirum и т.п, но не ограничиваться ими.
В соответствии с воплощением микроорганизм в соответствии с описанием настоящего изобретения, который продуцирует МАА, включает ген биосинтеза МАА или его кластер. В частности, в микроорганизм может быть введен генный кластер биосинтеза МАА или активности белков, кодируемых генами, могут быть усилены по сравнению с эндогенными активностями или активностями до модификации, но микроорганизм не ограничивается ими.
Дополнительно, хотя ген биосинтеза МАА не ограничен в своем названии ферментами или микроорганизмами, из которых происходят эти гены, пока микроорганизмы могут продуцировать МАА, этот ген биосинтеза МАА может включать ген, кодирующий белок-фермент, обладающий активностью, идентичной и/или похожей на один или более чем один, в частности, один или более чем один, два или более чем два, три или более чем три, или все из белков-ферментов, выбранных из группы, состоящей из 2-деметил-4-дезоксигадузолсинтазы, О-метилтрансферазы и C-N-лигазы.
Например, 2-деметил-4-дезоксигадузолсинтаза представляет собой фермент, который превращает седогептулозу-7-фосфат в 2-деметил-4-дезоксигадузол. О-Метилтрансфераза представляет собой фермент, который превращает 2-деметил-4-дезоксигадузол в 4-дезоксигадузол, глицилирование 4-дезоксигадузола катализируется С-N-лигазой.
Дополнительно, микроорганизм, продуцирующий МАА, может включать ген фермента, который обладает активностью, присоединяющей дополнительный аминокислотный остаток к МАА, или кластер генов. Хотя вышеприведенный ген или кластер генов не ограничен в своих названиях ферментами или микроорганизмами, из которых происходят эти гены, пока микроорганизмы, продуцирующие МАА, могут продуцировать МАА, к которым присоединены два или более чем два аминокислотных остатка. Микроорганизмы, продуцирующие МАА, могут включать ген, кодирующий белок-фермент, обладающий активностью, идентичной и/или похожей на один или более чем один, в частности, один или более чем один, два или более чем два, три или более чем три или все из белков-ферментов, выбранных из группы, состоящей из нерибосомальной пептидсинтетазы (NRPS), фермента, подобного нерибосомальной пептидсинтетазе (NRPS-подобный фермент), и D-аланин D-аланин-лигазы (D-Ala-D-Ala лигаза; DDL).
Некоторые из МАА включают второй аминокислотный остаток в микоспорин-глицине. Один или более чем один фермент, которые выбраны из группы, состоящей из нерибосомальной пептидсинтетазы, фермента, подобного нерибосомальной пептидсинтетазе, и D-Ala-D-Ala-лигазы, могут присоединять второй аминокислотный остаток к микоспорин-глицину.
В соответствии с воплощением микроорганизм, продуцирующий МАА, может включать без ограничения названия ферментов или виды микроорганизмов, из которых происходят гены биосинтеза МАА, ферменты, пока они обладают активностью, способной присоединять вторую аминокислоту к микоспорин-глицину, как в нерибосомальной пептидсинтетазе, ферменте, подобном нерибосомальной пептидсинтетазе и D-Ala-D-Ala-лигазе.
Например, фермент, подобный нерибосомальной пептидсинтетазе (Ava_3855), в АпаЬаепа variabilis или D-Ala-D-Ala-лигаза (NpF5597) в Nostoc punctiforme могут присоединять сериновый остаток к микоспорин-глицину с образованием шинорина. В еще одном примере микоспорин-2-глицин может быть получен путем присоединения второго глицинового остатка при помощи гомолога D-Ala-D-Ala-лигазы (Ар_3855) в Aphanothece halophytica. Аналогично, в Actinosynnema mirum серии или аланин могут быть присоединены при помощи D-Ala-D-Ala-лигазы и, таким образом, может образовываться шинорин или микоспорин-глицин-аланин. Микроорганизм в соответствии с воплощением в соответствии с описанием настоящего изобретения может быть выбран и включать ферменты, которые подходят для получения желаемых МАА, среди вышеописанных ферментов или ферментов, обладающими активностями, идентичными и/или похожими на активность вышеописанных ферментов.
2-Деметил-4-дезоксигадузолсинтаза, О-метилтрансфераза, C-N-лигаза, не рибосомальная пептидсинтетаза, фермент, подобный нерибосомальной пептидсинтетазе, и/или D-Ala-D-Ala-лигаза, которые могут быть использованы в описании настоящего изобретения, не ограничены видами микроорганизмов, из которых происходят эти ферменты, пока ферменты, которые, как известно, способны выполнять функции и роли, идентичные и/или похожие на функции и роли для вышеописанных ферментов, и диапазон гомологии или идентичности среди них также не ограничен. Например MylA, MylB, MylD, MylE и MylC из С. stagnale PCC 7417 гомологичны с 2-деметил-4-дезоксигадузолсинтазой, О-метилтрансферазой, C-N-лигазой и D-Ala-D-Ala-лигазой, происходящими из Anabaena variabilis и Nostoc punctiforme, и степень сходства между ними находится в диапазоне от приблизительно 61% до приблизительно 88% (Appl Environ Microbiol, 2016, 82(20), 6167-6173; J Bacteriol, 2011, 193(21), 5923-5928). To есть, ферменты, которые могут быть использованы в описании настоящего изобретения, не ограничены существенно видами, из которых происходят ферменты, гомологией последовательностей или идентичностью последовательностей, до тех пор, пока они, как известно, демонстрируют идентичные и/или похожие функции и действия. Дополнительно, непатентные документы, описанные в предшествующем уровне техники, включены в полном объеме, как ссылка на описание настоящего изобретения в целом.
Дополнительно, ген биосинтеза МАА может представлять собой полинуклеотид, кодирующий белок, который включает аминокислотную последовательность в соответствии с SEQ ID NO: 115, 116, 117, 118, 119, 120, 121 или 122, но ген биосинтеза МАА не ограничивается ими.
Дополнительно, ген биосинтеза МАА может включать нуклеотидную последовательность, кодирующую белок, который включает аминокислтную последовательность, имеющую 50%, 60% или 70% или более высокую, в частности, 80% или более высокую, в частности, 90% или более высокую, в частности, 95% или более высокую, и, в частности, 99% или более высокую гомологию или идентичность с аминокислотной последовательностью в соответствии с SEQ ID NO: 115, 116, 117, 118, 119, 120, 121 или 122, и может включать без ограничения нуклеотидную последовательность, кодирующую белок, который выходит за пределы диапазона вышеприведенной гомологии или идентичности, до тех пор, пока микроорганизм может продуцировать ММА. В частности, ген биосинтеза МАА может включать нуклеотидную последовательность в соответствии с SEQ ID NO: 102, 103, 104, 105, 106, 107, 108 или 109, но не ограничивается ими.
Дополнительно, понятно, что любая аминокислотная последовательность с делецией, модификацией, заменой или добавлением части последовательности, также может быть включена в описание настоящего изобретения, до тех пор, пока аминокислотная последовательность обладает гомологией или идентичностью с вышеприведенными последовательностями и по существу обладает биологической активностью, идентичной или соответствующей белкам в соответствии с SEQ ID NO, описанными выше.
Дополнительно, рассматривая кодоны, предпочтительные в организме, в котором должен экспрессироваться белок, вследствие вырожденности кодонов различные модификации могут быть осуществлены в кодирующей области нуклеотидной последовательности в объеме изобретения, не изменяющие аминокислотную последовательность белка, экспрессируемого с кодирующей области. Таким образом, в отношении гена биосинтеза МАА, любая нуклеотидная последовательность может быть включена в описание настоящего изобретения без ограничения, пока нуклеотидная последовательность представляет собой нуклеотидную последовательность, которая кодирует белок, вовлеченный в биосинтез МАА.
Альтернативно, любая последовательность, которая кодирует белок, вовлеченный в биосинтез МАА, путем гибридизации с любым зондом, который может быть получен из известных последовательностей генов (например последовательности, комплементарные всей или части полинуклеотидной последовательности) в жестких условиях, может быть включена в описание настоящего изобретения без ограничения.
В соответствии с воплощением микроорганизм, продуцирующий МАА, может включать гены биосинтеза МАА, имеющие различное происхождение.
В описании настоящего изобретения усиление активности белка и/или введение генов может быть осуществлено одновременно, последовательно и в обратном порядке независимо от самого порядка.
Микроорганизм, продуцирующий МАА, может продуцировать МАА за счет включения генного кластера биосинтеза МАА, и дополнительно, может представлять собой микроорганизм, в котором способность продуцировать МАА увеличена путем усиления активности одного или более чем одного белка, выбранного из группы, состоящей из 2-дегидро-3-дезоксифосфогептонатальдолазы, фосфоенолпируватсинтетазы и транскетолазы. Дополнительно, микроорганизм в соответствии с описанием настоящего изобретения не ограничен до тех пор, пока он представляет собой микроорганизм, в котором способность продуцировать МАА увеличена путем усиления активности одного или более чем одного белка, выбранного из группы, состоящей из 2-дегидро-3-дезоксифосфогептонатальдолазы, фосфоенолпируватсинтетазы. В частности, микроорганизм в соответствии с описанием настоящего изобретения может представлять собой микроорганизм рода Corynebacterium, микроорганизм рода Escherichia или дрожжи.
Микроорганизм рода Corynebacterium может представлять собой, в частности, Corynebacterium glutamicum, Corynebacterium ammoniagenes, Brevibacterium lactofermentum, Brevibacterium flavum, Corynebacterium thermoaminogenes, Corynebacterium efficiens и т.п., и, в частности, может представлять собой Corynebacterium glutamicum, но микроорганизм не ограничивается ими.
Микроорганизм рода Escherichia может представлять собой, в частности, Escherichia albertii, Escherichia coli, Escherichia fergusonii, Escherichia hermannii, Escherichia vulneris и т.п., и, в частности, может представлять собой Escherichia coli, но микроорганизм не ограничивается ими.
Дрожжи могут представлять собой, в частности, Saccharomycotina и Taphrinomycotina типа Ascomycota, Agar i corny с otina типа Basidiomycota, микроорганизм, относящийся к типу Pucciniomycotina и т.п., в частности, микроорганизм рода Saccharomyces, микроорганизм рода Schizosaccharomyces, микроорганизм рода Phaffia, микроорганизм рода Kluyveromyces, микроорганизм рода Pichia и микроорганизм рода Candida, и, в частности, Saccharomyces cerevisiae, но микроорганизм не ограничивается ими.
В еще одном аспекте в соответствии с описанием настоящего изобретения предложен способ получения микоспорин-подобной аминокислоты, который включает культивирование микроорганизма в соответствии с описанием настоящего изобретения в среде; и выделение микоспорин-подобной аминокислоты (МАА) из культивированного микроорганизма или среды.
"Микроорганизм" и "микоспорин-подобная аминокислота (МАА)" являются такими, как описано выше.
Используемый здесь термин "культивирование" означает, что микроорганизм выращивается при надлежащим образом контролируемых условиях окружающей среды. Процесс культивирования в соответствии с описанием настоящего изобретения может быть осуществлен в подходящей культуральной среде и условиях культивирования, известных в области техники. Такой процесс культивирования могут быть легко скорректирован для применения специалистом в данной области техники в зависимости от выбранного микроорганизма. Стадия культивирования микроорганизма может быть осуществлена в периодической культуре, непрерывной культуре, культуре с подпиткой и т.п., известными в области техники, но стадия культивирования микроорганизма не ограничивается конкретно ими. Среда и другие условия культивирования, используемые для культивирования микроорганизма в соответствии с описанием настоящего изобретения, не ограничены конкретно ими, и может быть использована любая среда, используемая для обычного выращивания микроорганизма. В частности, микроорганизм в соответствии с описанием настоящего изобретения, может быть выращен в аэробных условиях в обычной среде, содержащей подходящий источник углерода, источник азота, источник фосфора, неорганическое соединение, аминокислоту и/или витамин и т.п, путем корректирования температуры, рН и т.п. В частности, рН могут быть скорректирован с использованием основного соединения (например гидроксида натрия, гидроксида калия или аммиака) или кислотного соединения (например фосфорная кислота или серная кислота) с получением оптимального рН (например рН от 5 до 9, в частности, рН от 6 до 8, и, в частности, рН 6,8), но способ корректирования рН не ограничивается ими. Дополнительно, кислород или содержащий кислород газ может быть инжектирован в культуру для поддержания аэробного состояния в культуре; или газ азот, водород или диоксид углерода может быть инжектирован в культуру без инжекции газа для поддержания анаэробного или микроаэробного состояния в культуре, но газ не ограничивается ими. Дополнительно, температура в культуре может поддерживаться на уровне от 20°С до 45°С, и, в частности, от 25°С до 40°С, и культивирование может быть осуществлено в течение от приблизительно 10 часов до приблизительно 160 часов, не ограничиваясь ими. Дополнительно, во время культивирования антивспенивающий агент (например полигликолевый эфир жирной кислоты) может быть добавлен для предупреждения образования пены, но не ограничивается им.
Дополнительно, в качестве источника углерода, используемого в среде для культивирования, сахариды и углеводы (например глюкоза, сахароза, лактоза, фруктоза, мальтоза, меласса, крахмал и целлюлоза), масла и жиры (например соевое масло, подсолнечное масло, арахисовое масло и кокосовое масло), жирные кислоты (например пальмитиновая кислота, стеариновая кислота и линолевая кислота), спирты (например глицерин и этанол), органические кислоты (например уксусная кислота) и т.п. могут быть использованы сами по себе или в комбинации, но источник углерода не ограничивается ими. В качестве источника азота азотсодержащее органическое соединение (например пептон, дрожжевой экстракт, мясная подливка, солодовый экстракт, кукурузный сироп, бобовая мука и мочевина) и неорганическое соединение (например сульфат аммония, хлорида аммония, фосфат аммония, карбонат аммония и нитрат аммония) и т.п. могут быть использованы сами по себе или в комбинации, но источник азота не ограничивается ими. В качестве источника фосфора дигидрофосфат калия, гидрофосфат калия и натрийсодержащие соли, соответствующие им, могут быть использованы сами по себе или в комбинации, но источник фосфора не ограничивается ими. Дополнительно, среда может включать не заменимые способствующие росту вещества, такие как соль металла (например сульфат магния или сульфат железа), аминокислоты и витамины.
МАА, продуцируемые путем культивирования, могут быть секретированы в среду или остаются в клетках.
Используемый здесь термин "среда" относится к культуральной среде для выращивания микроорганизма в соответствии с описанием настоящего изобретения и/или продукту, получаемому после выращивания. Среда представляет собой то, что включает форму, в которую включен микроорганизм, и форму, в которой микроорганизм удаляется из содержащего микроорганизм культурального раствора путем центрифугирования, фильтрования и т.п.
На стадии выделения МАА, продуцируемых на вышеизложенной стадии культивирования в соответствии с описанием настоящего изобретения, желаемые МАА могут быть собраны из культурального раствора с использованием подходящего способа, известного в области техники, в соответствии со способом культивирования. Например может быть использовано центрифугирование, фильтрование, анионообменная хроматография, кристаллизация, высокоэффективная жидкостная хроматография (HPLC) и т.п., и желаемые МАА могут быть выделены из культивируемого микроорганизма или среды с использованием подходящего способа, известного в области техники. Стадия выделения МАА может дополнительно включать стадию разделения и/или стадию очистки.
В еще одном аспекте в соответствии с описанием настоящего изобретения предложено применение микроорганизма в соответствии с описанием настоящего изобретения для получения микоспорин-подобной аминокислоты (ММА).
"Микроорганизм" и "микоспорин-подобная аминокислота" являются такими, как описано выше.
[Способ осуществления изобретения]
Далее описание настоящего изобретения будет раскрыто более подробно со ссылкой на следующие примеры. Тем не менее, эти примеры приведены исключительно для иллюстративных задач, и объем описания не ограничен этими примерами.
Получение рекомбинантного микроорганизма на основе Е. сой, продуцирующего МАА, и продукция МАА с его использованием
Пример 1: Получение штамма, в котором усилена активность 2-дегидро-3-дезоксифосфогептонатальдолазы
Для увеличения способности микроорганизма продуцировать МАА получали штаммы Е. coli, в которых усилена активность 2-дегидро-3-дезоксифосфогептонатальдолазы. В частности, дополнительно вводили ген aroG (2-дегидро-3-дезоксифосфогептонатальдолаза; SEQ ID NO: 1 и 2) на основе штамма Е. coli W3110. Матрицы и праймеры, используемые для получения плазмид, представлены в таблице 1 ниже.
После амплификации фрагментов гена путем ПЦР с использованием вышеприведенных матриц и праймеров амплифицированные фрагменты лигировали с вектором pSKH, в котором фрагменты генов fhuA arm 1 и fhuA arm 2 обрабатывали ферментами рестрикции BamH1-SpeI с использованием набора для клонирования In-FusionR HD (Clontech), и полученный вектор был назван pSKH-ΔfhuA. Вследствие делеции renajhuA фаговое инфицирование Е. coli подавлялось.
Фрагмент гена Pn_aroG лигировали с вектором pSKH-ΔfhuA, который разрезали ферментами рестрикции Spel-EcoRV с использованием набора для клонирования In-FusionR HD (Clontech). После разрезания фрагментов гена Ptrc и Pcj1, которые известны как усиленные промоторы, при помощи ферментов рестрикции Spe1-Nde1 и разрушения фрагмента гена aroG ферментами рестрикции Nde1-EcoRV, фрагменты гена Ptrc и aroG или фрагменты гена Pcj1 (Корейский патент №10-620092) и aroG соответственно лигировали с вектором pSKH-ΔfhuA, который разрезали ферментами рестрикции Spel-EcoRV, с использованием набора для клонирования In-Fusion HDR (Clontech). Полученные векторы были названы соответственно pSKH-ΔfhuA-Pn-aroG, pSKH-ΔfhuA-Ptrc-aroG и pSKH-ΔfhuA-Pcjl-aroG.
Вышеприведенные векторы подтверждали путем секвенирования в отношении успеха клонирования и последовательности гена в каждом векторе, и затем трансформировали в каждом штамме дикого типа Е. coli W3110 путем электропорации. Каждый трансформированный ген вводили в хромосому путем первичной рекомбинации (кроссовер), и область плазмиды вырезали из хромосомы путем вторичной рекомбинации (кроссовер). Для каждого из трансформированного штамма Е. coli, в котором вторичная рекомбинация завершена, введение гена aroG подтверждали путем ПЦР с использованием праймеров SEQ ID NO: 14 (прямой) и 8 (обратный).
Пример 2: Получение вектора, сверхэкспрессирующего полученный из микроводорослей ген биосинтеза шинорина
Основанный на A. variabilis генный кластер для биосинтеза шинорина состоит из четырех генов (Ava_ABCD), который кодирует 2-деметил-4-дезоксигадузолсинтазу, О-метилтрансферазу, C-N-лигазу и нерибосомальную пептид с интетазу. Генный кластер для биосинтеза шинорина идентифицировали с использованием геномной ДНК A. variabilis АТСС29413. Вектор, включающий ген биосинтеза шинорина, полученный из A. variabilis АТСС29413, получали с использованием вектора pECCG117_Pcj1_GFP терминатор. Название вектора, экспрессирующего ген биосинтеза шинорина, и соответствующая матрица и праймеры для получения вектора представлены в таблице 2 ниже.
Фрагменты гена получали с использованием вышеприведенных матрицы и праймеров, и каждый фрагмент гена лигировали с вектором pECCG 117_Pcj1_GFP терминатор, который обрабатывали ферментами рестрикции EcoRY-Xbal, с использованием набора для клонирования In-FusionR HD (Clontech). Полученный вектор был назван pECCG117_Pcj1_Ava_ABCD, и успех клонирования и последовательности гена вектора подтверждали путем секвенирования. Нуклеотидная последовательность гена Ava_ABCD представлена в SEQ ID NO: 17.
Пример 3: Оценка способности продуцировать шинорин штаммом, в котором активность 2-дегидро-3-дезоксифосфогептонатальдолазы усилена
Плазмиду pECCG117_Pcj1_Ava_ABCD, полученную в примере 2, путем электропорации вводили в каждый из штаммов, полученных в примере 1, в котором усилен ген aroG, и штамм дикого типа W3110, и каждый трансформированный штамм высевали на твердую среду LB. Штаммы выращивали в инкубаторе в течение ночи при 37°С и затем одну платиновую петлю со штаммом инокулировали в 25 мл среды для титрования [состав среды: глюкоза 40 г/л, KH2PO4 0,3 г/л, K2HPO4 0,6 г/л, (NH4)2SO4 15 г/л, MgSO4⋅7H2O 1 г/л, NaCl 2,5 г/л, цитрат натрия 1,2 г/л, дрожжевой экстракт 2,5 г/л, карбонат кальция 40 г/л: рН 7,0], которую инкубировали в инкубаторе при 37°С при 200 об./мин в течение 48 часов. Получающиеся в результате штаммы анализировали при помощи HPLC (Waters Corp.) и результаты представлены в таблице 3 ниже.
Как представлено в таблице 3 выше, концентрация шинорина продуцируемого в штамме (W3110ΔfhuA::Pn-arcG/pECCG117_Pcj1_Ava_ABCD), в котором усилен ген aroG, увеличивалась приблизительно на 20% по сравнению с контрольной группой. В частности, в случае штаммов, в которых усилен ген aroG путем усиления промотора (т.е. W3110ΔfhuA::Ptrc-araG/pECCG117_Pcj1_Ava_ABCD и W3110ΔfhuA::Pcj1-aroG/pECCG117_Pcj1_Ava_ABCD), концентрация шинорина увеличивалась на величину, составляющую 69% и 94% соответственно.
Пример 4: Получение штамма, в котором усилена активность фосфоенолпируватсинтетазы
Для увеличения способности микроорганизма продуцировать МАА получали штаммы Е. coli, в которых усилена активность фосфоенолпируватсинтетазы. В частности, ген pps (фосфоенолпируватсинтетаза; SEQ ID NO: 18 и 19) дополнительно вводили на основе штамма Е. coli W3110. Матрица и праймеры, используемые для получения плазмиды, представлены в таблице 4 ниже.
После амплификации фрагментов гена с использованием вышеприведенных матрицы и праймеров фрагмент гена Pn_pps лигировали с вектором pSKH-ΔfhuA, который разрезали при помощи ферментов рестрикции Spel-EcoRY, с использованием набора для клонирования m-FusionR HD (Clontech). После разрушения фрагментов гена Ptrc и Pcj1, полученных в примере 1, при помощи ферментов рестрикции Spe1-Nde1, и разрушения фрагмента гена pps при помощи ферментов рестрикции NdeI-EcoRV, фрагменты гена. Ptrc и pps или фрагменты тепа. Pcj1 и pps соответственно лигировали с вектором pSKH-ΔfhuA, который разрезали при помощи ферментов рестрикции Spel-EcoRV, с использованием набора для клонирования In-Fusion HDR (Clontech). Полученные векторы были названы pSKH-ΔfhuA-Pn-pps, pSKH-ΔfhuA-Ptrc-pps и pSKH-ΔfhuA-Pcj1-pps, соответственно.
Вышеприведенные векторы подтверждали путем секвенирования в отношении успеха клонирования и последовательности гена в каждом векторе, и затем трансформировали в каждый штамм дикого типа Е. coli W3110 путем электропорации. Каждый трансформированный ген вводили в хромосому путем первичной рекомбинации (кроссовер), и область плазмиды вырезали из хромосомы путем вторичной рекомбинации (кроссовер). Для каждого из трансформированных штаммов Е. coli, в котором вторичная рекомбинация завершена, введение гена pps подтверждали путем ПЦР с использованием праймеров SEQ ID NO: 14 (прямой) и 21 (обратный).
Пример 5: Оценка способности продуцировать шинорин штаммом, в котором усилена активность фосфоенолпируватсинтетазы
Плазмиду pECCG117_Pcj1_Ava_ABCD, полученную в примере 2, путем электропорации вводили в каждый из штаммов, полученных в примере 4, в которые введен ген pps, и штамм дикого типа W3110, и каждый трансформированный штамм высевали на твердую среду LB. Штаммы выращивали в инкубаторе в течение ночи при 37°С, и одну платиновую петлю со штаммом инокулировали в 25 мл среды для титрования в соответствии с примером 3, которую затем инкубировали в инкубаторе при 37°С при 200 об./мин в течение 48 часов. Результаты представлены в таблице 5 ниже.
Как представлено в таблице 5 выше, концентрация шинорина, продуцируемого в штамме, в котором усилен ген pps, увеличивалась на 41%, и в случае, когда его активность усилена путем замены на сильный промотор, концентрация шинорина увеличивалась на величину, составляющую до 60%, по сравнению с контрольной группой.
Пример 6: Получение штамма, в котором усилена активность транскетолазы
Для увеличения способности микроорганизма продуцировать МАА получали штаммы Е. coli, в которых усилена активность транскетолазы. В частности, в штамм Е. coli W3110 вводили ген tktA (транскетолаза; SEQ ID NO: 23 и 24). Матрица и праймеры, используемые для получения плазмиды, представлены в таблице 6 ниже.
После амплификации фрагментовгена путем ПЦР с использованием вышеприведенных матрицы и праймеров фрагмент гена Vn_tktA лигировали с вектором pSKH-ΔfhuA, который разрезали при помощи ферментов рестрикции Spel-EcoRY, с использованием набора для клонирования In-FusionR HD (Clontech). После разрезания фрагментов гена Ptrc и Pcj1, полученных в примере 1, при помощи ферментов рестрикции Spe1, Nde1 и разрушения фрагмента гена tktA при помощи ферментов рестрикции Nde1-EcoRY, фрагменты гена Ptrc и tktA или фрагменты гена Pcj1 и tktA соответственно лигировали с вектором pSKH-ΔfhuA, который разрезали при помощи ферментов рестрикции Spel-EcoRV, с использованием набора для клонирования ш-Fusion HDR (Clontech). Полученные векторы названы соответственно pSKH-ΔfhuA-Pn-tktA, pSKH-ΔfhuA-Ptrc-tAtA и pSKH-ΔfhuA-Pcj1-tktA.
Вышеприведенные векторы подтверждали путем секвенирования в отношении успеха клонирования и последовательности гена в каждом векторе, и затем трансформировали в каждый штамм дикого типа Е. coli W3110 путем электропорации. Каждый трансформированный ген вводили в хромосому путем первичной рекомбинации (кроссовер), и область плазмиды вырезали из хромосомы путем вторичной рекомбинации (кроссовер). Для каждого из трансформированных штаммов Е. coli, в котором вторичная рекомбинация завершена, введение гена tktA подтверждали путем ПЦР с использованием праймеров SEQ ID NO: 14 (прямой) и 26 (обратный).
Пример 7: Оценка способности продуцировать шинорин в штамме, в котором усилена активность транскетолазы
Плазмиду pECCG117_Pcj1_Ava_ABCD, полученную в примере 2, путем электропорации вводили в каждый из штаммов, полученных в примере 6, в который введен ген tktA, и штамм дикого типа W3110, и каждый трансформированный штамм высевали на твердую среду LB. Штаммы выращивали в инкубаторе в течение ночи при 37°С, и одну платиновую петлю с ночной культурой каждого штамма инокулировали в 25 мл среды для титрования в соответствии с примером 3, которую затем инкубировали в инкубаторе при 37°С при 200 об./мин в течение 48 часов. Результаты представлены в таблице 7 ниже.
Как представлено в таблице 7 выше, концентрация шинорина продуцируемого в штамме, в котором усилен ген tktA, увеличивалась на 4,5%, и в случае, когда его активность усилена путем замены на сильный промотор, тогда концентрация шинорина увеличивалась на величину, составляющую до 32%, по сравнению с контрольной группой.
Пример 8: Получение штамма, в котором усилены активности 2-дегидро-3-дезоксифосфогептонатальдолазы/фосфоенолпируватсинтетазы/транскетолазы
Для увеличения способности микроорганизма продуцировать МАА получали штаммы Е. coli, в которых усилена активность каждой из 2-дегидро-3-дезоксифосфогептонатальдолазы/фосфоенолпируватсинтетазы/транскетолазы. В частности, в штамм Е. coli W3110 дополнительно вводили каждый из гена aroG, гена pps и гена tktA. Матрицы и праймеры, используемые для получения плазмид, представлены в таблице 8 ниже.
После амплификации фрагментов гена с использованием вышеприведенных матриц и праймеров каждый фрагмент гена лигировали с вектором pSKH-ΔfhuA, который разрезали при помощи ферментов рестрикции Spel-EcoRY, с использованием набора для клонирования In-FusionR HD (Clontech). Полученный вектор назван pSKH-ΔfhuA-Pcj1-aroG-Pcj1-ppsA-Pcj1-tktA.
Вышеприведенный вектор подтверждали путем секвенирования в отношении успеха клонирования и последовательностей генов в векторе и затем путем электропорации трансформировали в штамм дикого типа Е. coli W3110. Трансформированные гены вводили в хромосому путем первичной рекомбинации (кроссовер), и область плазмиды вырезали из хромосомы путем вторичной рекомбинации (кроссовер). Для трансформированных штаммов Е. coli, в которых вторичная рекомбинация завершена, введение генов aroG, pps и tktA подтверждали путем ПЦР с использованием праймеров SEQ ID NO: 14 (прямой) и 26 (обратный).
Пример 9: Оценка способности продуцировать шинорин в штамме, в котором усилены активности 2-дегидро-3-дезоксифосфогептонатальдолазы, фосфоенолпируватсинтетазы и транскетолазы
Плазмиду pECCG117_Pcj1_Ava_ABCD, полученную в примере 2, путем электропорации вводили в каждый из штаммов, полученных в примере 8, в который введены гены aroG, pps и tktA, и штамм дикого типа W3110, и каждый трансформированный штамм высевали на твердую среду LB. Штаммы выращивали в инкубаторе в течение ночи при 37°С, и одну платиновую петлю с ночной культурой каждого штамма инокулировали в 25 мл среды для титрования в соответствии с примером 3, которую затем инкубировали в инкубаторе при 37°С при 200 об./мин в течение 48 часов. Результаты представлены в таблице 9 ниже.
Как представлено в таблице 9 выше, концентрация шинорина, продуцируемого в штамме, в котором три типа генов (т.е. aroG, pps и tktA) комбинированы и усилены, увеличивалась на 267% по сравнению с контрольной группой. Этот результат является неожиданным, демонстрируя улучшение, превосходящее ожидание по сравнение с суммой максимальных увеличений, обнаруженных при замене промотора каждого гена на сильный промотор. То есть, последнее подтверждает то, что когда комбинируют три гена (т.е. aroG, pps и tktA), тогда возможно продуцировать шинорин в более высокой концентрации.
Пример 10: Получение штамма, в котором инактивирована активность 3-дегидрохинатдегидратазы
Для увеличения способности микроорганизма продуцировать МАА получали штаммы Е. coli, в которых инактивирована активность 3-дегидрохинатдегидратазы (aroD).
В частности, ген резистентности к хлорамфениколу плазмиды pKD3 использовали в качестве маркера встраивания гена, и кассету с делецией по aroD, которая включает часть гена aroD и ген резистентности к хлорамфениколу пазмиды pKD3, получали путем ПЦР с использованием праймеров SEQ ID NO: 32 (прямой) и 33 (обратный). Компетентные клетки получали путем трансформации штамма дикого типа Е. coli W3110 и штамма, полученного в примере 8, в который введены гены aroG, pps и tktA, плазмидой pKD46, включающей ген рекомбиназы фага лямбда-ред, а затем путем индукции экспрессии соответствующего гена с использованием арабинозы. После введения кассеты с делецией по aroD в компетентные клетки путем электропорации получающиеся в результате компетентные клетки высевали на твердую среду LB, содержащую 30 мг/л хлорамфеникола. Полученный таким образом штамм подвергали ПЦР с использованием праймеров SEQ ID NO: 34 (прямой) и 35 (обратный), и делецию по гену aroD подтверждали путем обнаружения амплифицированного фрагмента 1300 п.о.
Пример 11: Оценка способности продуцировать шинорин штаммом, в котором инактивир ована 3 -дегидрохинатдегидр атаза
Плазмиду pECCG117 Pcj1_Ava_ABCD, полученную в примере 2, путем электропорации вводили в штамм, полученный в примере 10, в котором осуществлена делеция по гену aroD, и получающийся в результате штамм высевали на твердую среду LB. Штамм выращивали в инкубаторе в течение ночи при 37°С, и одну платиновую петлю со штаммом инокулировали в 25 мл среды для титрования в соответствии с примером 3, которую инкубировали в инкубаторе при 37°С при 200 об./мин в течение 48 часов. Результаты представлены в таблице 10 ниже.
Как представлено в таблице 10 выше, концентрация шинорина, продуцируемого в штамме, в котором ген aroD дополнительно подвергнут делеции, увеличивалась на 66% по сравнению со штаммом, продуцирующим шинорин, в котором усилены гены aroG, pps и tktA. Штамм W3110ΔfhuA::Pcj1-aroG-Pcj1-ppsA-Pcj1-tktA/pECCG117_PCJ1_Ava_ABCD, который представляет собой штамм, в котором усилены гены aroG, pps и tktA, назван СВ06-0020 и депонирован в соответствии с Будапештским договором о международном признании депонирования микроорганизмов для целей патентной процедуры 14 февраля 2018 года в Корейском центре культур микроорганизмов (KCCM) и под идентификационным номером КССМ12224Р.
Получение рекомбинантного микроорганизма на основе Corynebacterium gtutamicum, продуцирующего МАА, и продукция МАА с его использованием
Пример 12: Получение вектора, в котором усилена активность 2-дегидро-3-дезоксифосфогептонатальдолазы, и оценка его способности продуцировать шинорин
Для увеличения способности микроорганизма продуцировать МАА получали штаммы Е. coli, в которых усилена активность 2-дегидро-3-дезоксифосфогептонатальдолазы. В частности, ген aroG (2-дегидро-3-дезоксифосфогептонатальдолаза; SEQ ID NO: 36 и 37) дополнительно вводили на основе штамма Corynebacterium glutamicum АТСС13032. Матрица и праймеры, используемые для получения плазмиды, представлены в таблице 11 ниже.
После получения фрагментов гена с использованием вышеприведенных матрицы и праймеров каждый фрагмент гена лигировали с векторами ECCG 117 и pECCG 117_Pcj7_GFP_терминатор (Корейский патент №10-620092, p117-cj7-gfp), которые обрабатывали ферментами рестрикции EcoRV/XbaI, с использованием набора для клонирования m-FusionR HD (Clontech). Полученные векторы названы pECCG117 Pn_cg1_aroG и pECCG117 Pcj7_cg1_aroG, соответственно. Вышеприведенные векторы подтверждали путем секвенирования в отношении успеха клонирования и последовательности гена в каждом векторе.
Во-первых, поскольку микроорганизм рода Corynebacterium не может продуцировать шинорин, получали штамм, в который введен путь биосинтеза шинорина. В частности, ген Ava_ABCD подвергали ПЦР с использованием pECCG117_Ptrc_Ava_ABCD в качестве матрицы вместе с парой праймеров SEQ ID NO: 42 (прямой) и 43 (обратный). pDZTn_Ava_ABCD получали путем лигирования приблизительно 7 т.п.о. фрагмента ПЦР с вектором pDZTn (WO 2009-125992А), который обрабатывали ферментом рестрикции NdeI, с использованием набора для клонирования In-FusionR HD (Clontech). Затем фрагмент промотора O2 (Корейский патент №10-1632642) подвергали ПЦР с использованием пары праймеров SEQ ID NO: 44 (прямой) и 45 (обратный), и лигировали в pDZTn_Ava_ABCD, который обрабатывали ферментом рестрикции NdeI, с использованием набора для клонирования ш-Fusion HD (Clontech), таким образом получая pDZTn_PO2_Ava_ABCD.
Рекомбинантную плазмиду трансформировали в штамм дикого типа АТСС13032 путем электропорации (van der Rest et al. 1999) и плазмиду вводили в хромосому путем первичной рекомбинации (кроссовер), и область плазмиды вырезали из хромосомы путем вторичной рекомбинации (кроссовер).
Для каждого из трансформированных штаммов Corynebacterium glutamicum, в котором вторичная рекомбинация завершена, введение гена Ava_ABCD подтверждали путем ПЦР с использованием специфической для гена пары праймеров SEQ ID NO: 42 (прямой) и 43 (обратный). Полученный штамм назван Corynebacterium glutamicum 13032 ΔN1021PO2_Ava_ABCD.
Каждый из векторов pECCG117_Pn_cgl aroG и pECCG117_Pcj7_cgl aroG путем электропорации трансформировали в штамм Corynebacterium glutamicum 13032 ΔN1021_PO2_Ava_ABCD.
Полученные выше штаммы и контрольную группу Corynebacterium glutamicum АТСС13032 (cgl 13032) выращивали в течение ночи в твердой среде BHIS, содержащей канамицин, и одну платиновую петлю со штаммом инокулировали в 25 мл среды для титрования [состав среды: глюкоза 40 г/л, KH2PO4 1 г/л, (NH4)2SO4 10 г/л, MgSO47H2O 5 г/л, NaCl 5 г/л, дрожжевой экстракт 5 г/л, карбонат кальция 30 г/л: рН 7,0], которую инкубировали в инкубаторе при 37°С при 200 об./мин в течение 48 часов. Результаты представлены в таблице 12 ниже.
Как представлено в таблице 12 выше, когда уровень экспрессии aroG увеличивался в штамме, содержащем ген биосинтеза шинорина, тогда концентрация шинорина увеличивалась на 39%. В частности, когда промотор был усилен, тогда это подтверждало то, что концентрация шинорина может увеличиваться на величину, составляющую до 80%.
Пример 13: Получение вектора, в котором усилены активности фосфоенолпируватсинтетазы/транскетолазы, и оценка его способности продуцировать шинорин
Для увеличения способности микроорганизма продуцировать МАА получали штаммы Corynebacterium glutamicum, в которых усилена активность tkt или pps. В частности, дополнительно вводили tkt (транскетолаза; SEQ ID NO: 95 и 96) или pps (фосфоенолпируватсинтетаза; SEQ ID NO: 97 и 98) на основе штамма Corynebacterium glutamicum АТСС13032. Матрица и праймеры, используемые для получения плазмиды, представлены в таблице 13 ниже.
Векторы получали путем лигирования фрагментов гена, которые получали при помощи технологии ПЦР, в которой матрица соответствовала комбинации праймеров, с векторами pECCG117, pECCG117_Ptrc_GFP_терминатор и pECCG117_Pcj7_GFP терминатор, которые обрабатывали ферментами рестрикции EcoRY/XbaI, с использованием набора для клонирования In-Fusion HDR(Clontech). Полученные векторы названы pECCG117-Pn-tkt/pECCG117-Pcj7-tkt и pECCG117-Ptrc-pps/pECCG117-Pcj7-pps соответственно. Вышеприведенные векторы подтверждали путем секвенирования в отношении успеха клонирования и последовательности гена в каждом векторе и затем путем электропорации трансформировали в штамм Corynebacterium glutamicum 13032 ΔN1021_PO2_Ava_ABCD. Каждый штамм выращивали на содержащей канамицин твердой среде BHIS в течение ночи, и платиновую петлю со средой инокулировали в 25 мл среды для титрования в соответствии с примером 12, которую инкубировали в инкубаторе при 37°С при 200 об./мин в течение 48 часов. Результаты представлены в таблице 14 ниже.
Как представлено в таблице 14 выше, подтверждено, что когда ген tkt или ген pps усилен, тогда продукция шинорина увеличивалась на величину, составляющую до 57% или 72% соответственно.
Пример 14: Получение штамма, в котором усилены активности 2-дегидро-3-дезоксифосфогептонатальдолазы/фосфоенолпируватсинтетазы/тр анскетолазы, и его оценка
Для увеличения способности микроорганизма продуцировать МАА получали штаммы Е. coli, в которых усилены активности генов aroG, pps и tkt, и для подтверждения большей продукции МАА дополнительно инактивировали 3-дегидрохинатдегидратазу (aroD). В частности, для усиления генов aroG, pps и tkt получали плазмиду pDZ-ΔaroD-Pcj7-aroG-Pcj7-pps-Pcj7-tktA. Матрицы и праймеры, используемые для получения плазмиды pDZ-ΔaroD-Pcj7-aroG-Pcj7-pps-Pcj7-tktA, представлены в таблице 15 ниже.
Во-первых, для получения штамма Corynebacterium glutamicum, в котором осуществлена делеция по гену aroD (SEQ ID NO: 89 и 90), получали плазмиду pDZ-AaroD, в которой открытая рамка считывания гена aroD подвергнута внутренней делеции. Внутреннюю делецию гена в плазмиде pDZ-AaroD осуществляли путем проведения перекрестной ПЦР с использованием геномной ДНК штамма Corynebacterium glutamicum АТСС 13032 в качестве матрицы вместе с SEQ ID NO: 91 и 92 и SEQ ID NO: 93 и 94 в качестве пары прямого и обратного праймеров в последующим введением получающихся в результате фрагментов гена в вектор pDZ.
Затем каждый фрагмент генов aroG, pps и tkt амплифицировали при помощи ПЦР с использованием матриц и праймеров, представленных в таблице 15 выше, и затем вводили в вектор pDZ-AaroD, соответственно расщепленный при помощи фермента рестрикции SpeI. Вышеприведенные два типа векторов подтверждали путем секвенирования в отношении успеха клонирования и последовательности гена в каждом векторе и затем трансформировали путем электропорации в штамм Corynebacterium glutamicum 13032ΔN1021_PO2_Ava_ABCD. Каждый штамм выращивали на содержащей канамицин твердой среде BHIS в течение ночи, и платиновую петлю с ночной культурой каждого штамма инокулировали в 25 мл среды для титрования в соответствии с примером 12, которую инкубировали в инкубаторе при 37°С при 200 об./мин в течение 48 часов. Результаты представлены в таблице 16 ниже.
Как представлено в таблице 16 выше, концентрация шинорина, продуцируемого в штамме, в котором усилены три типа генов {aroG, pps и tktA), увеличивалась на приблизительно 25%. Подтверждено, что даже в штамме, в котором способность продуцировать шинорин увеличена путем делеции по гену aroD, шинорин может продуцироваться в высокой концентрации путем комбинации трех типов генов. Дополнительно, можно интерпретировать, что когда ген aroD дополнительно инактивирован в штамме, в котором комбинированы три типа генов, тогда шинорин может продуцироваться при еще более высокой концентрации.
Получение рекомбинантного микроорганизма на основе дрожжей, продуцирующего МАА, и продукция МАА с его использованием
Пример 15: Получение штамма Saccharomyces cerevisiae (S. cerevisiae), продуцирующего шинорин
Для использования штамма Saccharomyces cerevisiae (S. cerevisiae) в качестве штамма, продуцирующего шинорин, ген биосинтеза шинорина, полученный из А. variabilis АТСС29413, вводили в вектор для экспрессии в дрожжах. Гены Ava_A и Ava_B встраивали в вектор pRS-413 с использованием промотора GPD. В частности, области pGPD-Ava_A и pGPD-Ava_B лигировали при помощи ПЦР с перекрывающимися праймерами. Векторы и продукты ПЦР обрабатывали ферментами рестрикции BamIIl и SalI и затем лигировали с использованием лигазы Т4 для получения вектора pRS-413-pGPD-Ava_A-pGPD-Ava_В.
Затем гены Ava_A и Ava_B встраивали в вектор pRS-414 с использованием промотора GPD. В частности, области pGPD-Ava_С и pGPD-Ava_D лигировали при помощи ПЦР с перекрывающимися праймерами, и затем векторы и продукты ПЦР обрабатывали BamHI и SalI и лигировали с использованием лигазы Т4 для получения вектора pRS-414-pGPD-Ava_C-pGPD-Ava_D. Праймеры и матрицы ДНК, используемые для получения вектора, представлены в таблице 17 ниже.
Вектор pRS-413-pGPD-Ava_A-pGPD-Ava_B и вектор pRS-414-pGPD-Ava_C-pGPD-Ava_D вводили в штамм Saccharomyces cerevisiae CEN.PK-1D (S. cerevisiae CEN.PK-1D) путем трансформации при помощи ацетата лития, и затем подтверждали продукцию шинорина. Этот штамм высевали на синтетической полной (SC) твердой среде, из которой исключены Trp и His (т.е. ауксотрофные маркеры), и выращивали в течение ночи в инкубаторе при 30°С Одну платиновую петлю со штаммом, выращенным в течение ночи в синтетической полной (SC) твердой среде, из которой исключены Trp и His, инокулировали в 25 мл среды для титрования в соответствии с таблицей 18, и затем выращивали в инкубаторе при 30°С при 150 об./мин в течение 24 часов. Результаты представлены в таблице 19 ниже.
В качестве результата эксперимента подтвердили, что штамм дикого типа Saccharomyces cerevisiae, не продуцирующий шинорин, продуцировал 331 мг/л шинорина вследствие введения гена биосинтеза шинорина.
Пример 16: Увеличение продукции шинорина путем усиления TKL1 (транскетолазы) Saccharomyces cerevisiae
Для увеличения способности продуцировать МАА получали штамм Saccharomyces cerevisiae, в котором усилена активность TKL1. Для этой задачи экспрессию гена TKL1 усиливали путем клонирования гена TKL1 (SEQ ID NO: 110 и 123) в векторы pRS-415-pGPD, pRS-415-pADH и pRS-415-pTEF.
Промотор GPD, включенный в вектор pRS-415-pGPD, представляет собой промотор генов глицеральдегид-3-фосфатдегидрогеназы (GAPDH) и изозима 3 (TDH3), и он включает последовательность от -674 п.о. до -1 п.о. относительно кодона инициации ORF гена THD3.
Промотор ADH, включенный в вектор pRS-415-pADH, представляет собой промотор гена алкогольдегидрогеназы (ADH1), и он включает последовательность от -1500 п.о. до -1 п.о. относительно кодона инициации ORF гена.ADH1.
Промотор TEF, включенный в вектор pRS-415-pTEF, представляет собой промотор фактора элонгации трансляции гена EF-1 альфа (TEFL), и он включает последовательность от -500 п. о. до -1 п. о. относительно кодона инициации ORF гена TEFL
В частности, ген TEF1 подвергали ПЦР с использованием праймеров в соответствии с таблицей 20 ниже, и продукты ПЦР и векторы pRS-415-pGPD, pRS-415-pADH и pRS-415-pTEF обрабатывали ферментами рестрикции BamHI и SalI, и затем лигировали с использованием лигазы Т4 с получением векторов pRS-415-pGPD-TKL1, pRS-415-pADH-TKL1 и pRS-415-pTEF-TKL1.
Затем, плазмиду для биосинтеза шинорина, полученную в примере 15, вводили в штамм Saccharomyces cerevisiae CEN.PK-1D вместе с pRS-415-pGPD-TKL1, pRS-415-pADH-TKL1 и pRS-415-pTEF-TKL1, и каждый получающийся в результате штамм высевали на синтетической полной твердой среде (SC), из которой исключены Trp, Ura и His, и выращивали в течение ночи в инкубаторе при 30°С Одну платиновую петлю со штаммом, выращиваемым в течение ночи в синтетической полной твердой среде (SC), из которой исключены Trp, Ura и His, инокулировали в 25 мл среды для титрования, и затем выращивали в инкубаторе при 30°С при 150 об./мин в течение 24 часов. Результаты представлены в таблице 21 ниже.
Как представлено в таблице 21 выше, подтверждено, что продукция шинорина увеличивалась в штамме, в котором экспрессия гена TKL1 усилена с использованием промотора GPD, по сравнению со штаммом WT. Дополнительно, также подтверждено, что по мере усиления силы промотора (т.е. pGPD>pTEF>pADH) увеличивается продукция шинорина.
Пример 17: Увеличение продукции шинорина путем усиления ARQ4 (3-дезокси-D-арабино-гептулозонат-7-фосфат (DAHP) синтазы) в Saccharomyces cerevisiae
Для увеличения способности продуцировать МАА получали штаммы Saccharomyces cerevisiae, в которых усилена активность ARO4. Для этой задачи использовали стратегию, при которой экспрессию гена ARO4 увеличивали путем клонирования гена AR04 (SEQ ID NO: 111 и 124) в векторы pRS-415-pGPD, pRS-415-pADH и pRS-415-pTEF. В частности, ген ARO4 подвергали ПЦР с использованием праймеров в соответствии с таблицей 22 ниже, и продукты ПЦР векторов ARO4 и pRS-415-pGPD, pRS-415-pADH и pRS-415-pTEF обрабатывали ферментами рестрикции BamHI и SalI, и затем лигировали с использованием лигазы Т4 с получением векторов pRS-415-pGPD-ARO4, pRS-415-pADH-ARO4 и pRS-415-pTEF-ARO4.
Затем, плазмиду для биосинтеза шинорина, полученную в примере 15, вводили в штамм Saccharomyces cerevisiae CEN.PK-1D вместе с pRS-415-pGPD-ARO4, pRS-415-pADH-ARO4 и pRS-415-pTEF-ARO4, и каждый получающийся в результате штамм высевали на синтетическую полную (SC) твердую среду, из которой исключены Trp, Ura и His, и выращивали в течение ночи в инкубаторе при 30°С. Одну платиновую петлю со штаммом, выращиваемым в течение ночи в синтетической полной (SC) твердой среде, из которой исключены Trp, Ura и His, инокулировали в 25 мл среды для титрования, и затем выращивали в инкубаторе при 30°С при 150 об./мин в течение 24 часов. Результаты представлены в таблице 23 ниже.
Как представлено в таблице 23 выше, подтверждено, что продукция шинорина увеличилась на 187% в штамме, в котором усилена экспрессия гена ARO4 с использованием промотора GPD по сравнению со штаммом WT.
Пример 18: Увеличение продукции шинорина путем усиления фосфоенолпируватсинтетазы (pps) в Saccharomyces cerevisiae
Для увеличения способности продуцировать МАА получали штаммы Saccharomyces cerevisiae, в которых усилена активность pps. Для этой задачи использовали стратегию, при которой экспрессия гена pps усилена путем клонирования гена pps в векторы pRS-415-pGPD, pRS-415-pADH и pRS-415-pTEF, и усилена экспрессия гена pps.
В частности, ген pps подвергали ПЦР с использованием праймеров в соответствии с таблицей 24 ниже и продукты ПЦР векторов pps и pRS-415-pGPD, pRS-415-pADH и pRS-415-pTEF обрабатывали ферментами рестрикции BamHI и SalI и затем лигировали с использованием лигазы Т4 с получением векторов pRS-415-pGPD-pps, pRS-415-pADH-pps npRS-415-pTEF-pps.
Затем плазмиду для биосинтеза шинорина, полученную в примере 15, вводили в штамм Saccharomyces cerevisiae CEN.PK-1D вместе с pRS-415-pGPD-pps, pRS-415-pADH-pps и pRS-415-pTEF-pps, и каждый получающийся в результате штамм высевали на синтетической полной (SC) твердой среде, из которой исключены Trp, Ura и His, и выращивали в течение ночи при 30°С в инкубаторе. Одну платиновую петлю со штаммом, выращиваемым в течение ночи на синтетической полной (SC) твердой среде, из которой исключены Trp, Ura и His, инокулировали в 25 мл среды для титрования, и затем выращивали в инкубаторе при 30°С при 150 об./мин в течение 24 часов. Результаты представлены в таблице 25 ниже.
Как представлено в таблице 25 выше, подтверждено, что продукция шинорина увеличивалась на 70% в штамме, в котором происходит сверэкспрессия гена pps, по сравнению со штаммом WT. Дополнительно, также подтвердили, что по мере увеличения силы промотора (т.е. pGPD>pTEF>pADH) увеличивается продукция шинорина.
Пример 19: Увеличение продукции шинорина путем усиления TKL1, усиления ARO4 и введения гена pps в штамм Saccharomyces cerevisiae
На основе результатов примеров 16, 17 и 18 гены TKL1, ARO4 и pps (Е. coli) отобраны в качестве эффективных факторов, которые оказывают влияние на биосинтез шинорина в Saccharomyces cerevisiae, и сделаны попытки увеличить биосинтез шинорина путем одновременного усиления этих трех типов генов. Для введения этих трех типов генов получали векторы pRS-415-pGVD-TKLl-pGVD-ARO4 и pRS-416-pGPD-pps. В частности, после связывания областей pGFD-TKL1 и pGFD-ARO4 при помощи ПЦР с перекрывающимися праймерами векторы и продукты ПЦР обрабатывали ферментами рестрикции BamHI и SalI, и затем лигировали с использованием лигазы Т4 для получения вектора pRS-415-pGRD-TKL1-pGPD-ARO4.
Затем, ген pps, полученный из Е. coli, подвергали ПЦР. Продукты ПЦР гена pps и вектор pRS-416-pGPD обрабатывали ферментами рестрикции BamHI и SailI и затем лигировали с использованием лигазы Т4 для получения вектора pRS-416-pGPD-pps. Праймеры и матрицы ДНК, используемые для получения векторов, представлены в таблице 26 ниже.
Затем, плазмиду для биосинтеза шинорина, полученную в примере 15, вводили в штамм Saccharomyces cerevisiae CEN.PK-1D вместе с векторами pRS-415-pGPD-TKL1-pGPD-ARO4 и pRS-416-pGPD-pps, и каждый получающийся в результате штамм высевали на синтетическую полную твердую среду (SC), из которой исключены Leu, Trp, Ura и His, и выращивали в течение ночи в инкубаторе при 30°С Одну платиновую петлю со штаммом, выращенным в течение ночи в синтетической полной твердой среде (SC), из которой исключены Leu, Trp, Ura и His, инокулировали в 25 мл среды для титрования, и затем выращивали в инкубаторе при 30°С при 150 об./мин в течение 24 часов. Результаты представлены в таблице 27 ниже.
Как представлено в таблице 27 выше, подтверждено, что продукция шинорина значительно увеличивалась на 230% в штамме, в котором осуществляется сверхэкспрессия трех типов эффективных генов (т.е. pps, TKL1 и ARO4), по сравнению со штаммом WT.
В этом описании изобретения подробные изложения содержания, которое может полностью быть понято и принято специалистом в данной области техники, опущены. Дополнительно к конкретным воплощениям, изложенным в этом описании изобретения, возможны различные модификации без изменения технической сущности или важных составляющих описания настоящего изобретения. Таким образом, описание настоящего изобретения может быть реализовано образом, отличающимся от конкретно описанного и подкрепленного примерами в данном описании изобретения, который может быть понятен специалистам в данной области техники.
--->
Последовательности
<110> CJ CheilJedang Corporation
<120> A microorganism for producing a Mycosporine-like amino acid and a
method for preparing a Mycosporine-like amino acid using the same
<130> OPA18547-PCT
<150> KR10-2018-0022185
<151> 2018-02-23
<160> 124
<170> KoPatentIn 3.0
<210> 1
<211> 1053
<212> DNA
<213> Escherichia coli W3110
<400> 1
atgaattatc agaacgacga tttacgcatc aaagaaatca aagagttact tcctcctgtc 60
gcattgctgg aaaaattccc cgctactgaa aatgccgcga atacggttgc ccatgcccga 120
aaagcgatcc ataagatcct gaaaggtaat gatgatcgcc tgttggttgt gattggccca 180
tgctcaattc atgatcctgt cgcggcaaaa gagtatgcca ctcgcttgct ggcgctgcgt 240
gaagagctga aagatgagct ggaaatcgta atgcgcgtct attttgaaaa gccgcgtacc 300
acggtgggct ggaaagggct gattaacgat ccgcatatgg ataatagctt ccagatcaac 360
gacggtctgc gtatagcccg taaattgctg cttgatatta acgacagcgg tctgccagcg 420
gcaggtgagt ttctcgatat gatcacccca caatatctcg ctgacctgat gagctggggc 480
gcaattggcg cacgtaccac cgaatcgcag gtgcaccgcg aactggcatc agggctttct 540
tgtccggtcg gcttcaaaaa tggcaccgac ggtacgatta aagtggctat cgatgccatt 600
aatgccgccg gtgcgccgca ctgcttcctg tccgtaacga aatgggggca ttcggcgatt 660
gtgaatacca gcggtaacgg cgattgccat atcattctgc gcggcggtaa agagcctaac 720
tacagcgcga agcacgttgc tgaagtgaaa gaagggctga acaaagcagg cctgccagca 780
caggtgatga tcgatttcag ccatgctaac tcgtccaaac aattcaaaaa gcagatggat 840
gtttgtgctg acgtttgcca gcagattgcc ggtggcgaaa aggccattat tggcgtgatg 900
gtggaaagcc atctggtgga aggcaatcag agcctcgaga gcggggagcc gctggcctac 960
ggtaagagca tcaccgatgc ctgcatcggc tgggaagata ccgatgctct gttacgtcaa 1020
ctggcgaatg cagtaaaagc gcgtcgcggg taa 1053
<210> 2
<211> 350
<212> PRT
<213> Escherichia coli W3110
<400> 2
Met Asn Tyr Gln Asn Asp Asp Leu Arg Ile Lys Glu Ile Lys Glu Leu
1 5 10 15
Leu Pro Pro Val Ala Leu Leu Glu Lys Phe Pro Ala Thr Glu Asn Ala
20 25 30
Ala Asn Thr Val Ala His Ala Arg Lys Ala Ile His Lys Ile Leu Lys
35 40 45
Gly Asn Asp Asp Arg Leu Leu Val Val Ile Gly Pro Cys Ser Ile His
50 55 60
Asp Pro Val Ala Ala Lys Glu Tyr Ala Thr Arg Leu Leu Ala Leu Arg
65 70 75 80
Glu Glu Leu Lys Asp Glu Leu Glu Ile Val Met Arg Val Tyr Phe Glu
85 90 95
Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro His
100 105 110
Met Asp Asn Ser Phe Gln Ile Asn Asp Gly Leu Arg Ile Ala Arg Lys
115 120 125
Leu Leu Leu Asp Ile Asn Asp Ser Gly Leu Pro Ala Ala Gly Glu Phe
130 135 140
Leu Asp Met Ile Thr Pro Gln Tyr Leu Ala Asp Leu Met Ser Trp Gly
145 150 155 160
Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Val His Arg Glu Leu Ala
165 170 175
Ser Gly Leu Ser Cys Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr
180 185 190
Ile Lys Val Ala Ile Asp Ala Ile Asn Ala Ala Gly Ala Pro His Cys
195 200 205
Phe Leu Ser Val Thr Lys Trp Gly His Ser Ala Ile Val Asn Thr Ser
210 215 220
Gly Asn Gly Asp Cys His Ile Ile Leu Arg Gly Gly Lys Glu Pro Asn
225 230 235 240
Tyr Ser Ala Lys His Val Ala Glu Val Lys Glu Gly Leu Asn Lys Ala
245 250 255
Gly Leu Pro Ala Gln Val Met Ile Asp Phe Ser His Ala Asn Ser Ser
260 265 270
Lys Gln Phe Lys Lys Gln Met Asp Val Cys Ala Asp Val Cys Gln Gln
275 280 285
Ile Ala Gly Gly Glu Lys Ala Ile Ile Gly Val Met Val Glu Ser His
290 295 300
Leu Val Glu Gly Asn Gln Ser Leu Glu Ser Gly Glu Pro Leu Ala Tyr
305 310 315 320
Gly Lys Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Asp Thr Asp Ala
325 330 335
Leu Leu Arg Gln Leu Ala Asn Ala Val Lys Ala Arg Arg Gly
340 345 350
<210> 3
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> fhuA arm 1_F
<400> 3
ccaagcgacg cccaacctgc catcatggcg cgttccaaaa ctgctcagc 49
<210> 4
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> fhuA arm 1_R
<400> 4
tatcctcgag actagtgagc tcctttcagc ggttcggtgg 40
<210> 5
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> fhuA arm 2_F
<400> 5
ctagtctcga ggatatcgac cacaccctgc tgaccggtgt 40
<210> 6
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> fhuA arm 2_R
<400> 6
atagaatacc aattggcatg ctttttagaa acggaaggtt gcggttgc 48
<210> 7
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Pn_aroG_F
<400> 7
aaaggagctc actagtagga tgctcctgtt atgg 34
<210> 8
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Pn_aroG_R
<400> 8
cagggtgtgg tcgatatctt acccgcgacg cgcttt 36
<210> 9
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Ptrc_F
<400> 9
aaaggagctc actagtccgc ttgctgcaac tctc 34
<210> 10
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Ptrc_R
<400> 10
tggacgatac tcatatgttt cctgtgtgaa attgttatcc 40
<210> 11
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj1_F
<400> 11
aaaggagctc actagtaccg cgggcttatt ccatt 35
<210> 12
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj1_R
<400> 12
atctatagtc tgcatatgtt aatctcctag attgggtttc a 41
<210> 13
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> aroG_F
<400> 13
taggagatta acatatgaat tatcagaacg ac 32
<210> 14
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> certification primer
<400> 14
ggaacgctca gattgcgt 18
<210> 15
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_ABCD_F
<400> 15
acaatttcac acaggaaaga tatcatgagt atcgtccaag caaag 45
<210> 16
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_ABCD_R
<400> 16
ctcatccgcc aaaacagctc tagattatga attattttcc agaca 45
<210> 17
<211> 6461
<212> DNA
<213> Anabaena variabilis ATCC29413
<400> 17
atgagtatcg tccaagcaaa gtttgaagct aaggaaacat cttttcatgt agaaggttac 60
gaaaagattg agtatgattt ggtgtatgta gatggtattt ttgaaatcca gaattctgca 120
ctagcagatg tatatcaagg ttttggacga tgcttggcga ttgtagatgc taacgtcagt 180
cggttgtatg gtaatcaaat tcaggcatat ttccagtatt atggtataga actgaggcta 240
tttcctatta ccattactga accagataag actattcaaa ctttcgagag agttatagat 300
gtctttgcag atttcaaatt agtccgcaaa gaaccagtat tagtcgtggg tggcggttta 360
attacagatg ttgtcggctt tgcttgttct acatatcgtc gcagcagcaa ttacatccgc 420
attcctacta cattgattgg attaattgat gccagtgtag caattaaggt agcagttaat 480
catcgcaaac tgaaaaaccg tttgggtgct tatcatgctt ctcgcaaagt atttttagat 540
ttctccttgt tgcgtactct ccctacagac caagtacgta acgggatggc ggaattggta 600
aaaatcgctg tagtagcgca tcaagaagtt tttgaattgt tggagaagta cggcgaagaa 660
ttactacgta ctcattttgg caatatagat gcaactccag agattaaaga aatagcccat 720
cgtttgactt acaaagctat ccataagatg ttggaattgg aagttcccaa cctgcatgag 780
ttagacctag atagggtgat tgcttacggt cacacttgga gtcccacctt ggaacttgcg 840
cctcgtctac ccatgttcca cggacacgcc gttaatgtag atatggcttt ctcggcaacg 900
atcgccgccc gtagaggata tattacaatt gcagaacgcg atcgtatttt aggattaatg 960
agtcgcgttg gtctatccct cgaccatccc atgttggata tagatatttt gtggcgtggt 1020
actgaatcta tcacattaac tcgtgatggt ttgttaagag ctgctatgcc aaaacccatt 1080
ggtgattgtg tcttcgtcaa tgacctgaca agagaagaat tagcagccgc attagctgac 1140
cacaaagaac tttgtaccag ttatccccgt ggtggtgaag gtgtggatgt gtatcccgtt 1200
tatcaaaaag aattaatcgg gagtgttaaa taatgacttt tttgaattca aaatgcaaaa 1260
tactccacgg atacactgcg cgagcgcggt agcatttctg ttcgcggagc gtcccgtagg 1320
gaaagagaag gctacgcaaa taatcggaca ctaattgtct ttaattttga attttgaatt 1380
ttgaattttg aattggagcg aagcgacttg acaaatgtga ttgtccaacc aacagctaga 1440
cctgttacac cattgggaat tttaaccaag cagttagaag ccatagtcca agaggttaag 1500
caacatccag atttacctgg ggaattgata gcaaacatcc atcaggcttg gcgtttagcc 1560
gcaggtatag acccttattt ggaagaatgc accactccag aatctcctga actcgctgca 1620
ttggcaaaaa ccacagccac cgaagcctgg ggagaacact tccacggagg tacaaccgtc 1680
cgtcctctag aacaagagat gctttctggt catatcgaag gacaaacctt aaagatgttt 1740
gttcacatga ccaaagctaa aaaagtctta gaaattggga tgtttaccgg ttattcggcg 1800
ctggcgatgg cggaagcatt accagaggat ggactgcttg tggcttgtga agttgaccct 1860
tacgcggcgg aaattggaca gaaagccttt caacaatctc cccacggtgg aaagattcgt 1920
gtggaattgg atgcagcctt agcaactctt gataagttag cagaagctgg ggagtctttt 1980
gacttggtat ttatcgacgc agataaaaaa gagtatgtag cctattttca caagttgcta 2040
ggtagcagtt tgttagcacc agatggcttt atttgtgtag ataacacctt attacaaggg 2100
gaagtttatc taccagcaga ggaacgtagc gtcaatggtg aagcgatcgc gcaatttaat 2160
catacagtag ctatagaccc ccgtgtagaa caggttttgt tgccgttgcg agatggttta 2220
acaattatcc gcagaataca accttaattg tccaatcgac tatggcacaa tcccttcccc 2280
tttcttccgc acctgctaca ccgtctcttc cttcccagac gaaaatagcc gcaattatcc 2340
aaaatatctg cactttggct ttgttattac tagcattgcc cattaatgcc accattgttt 2400
ttatatcctt gttagtcttc cgaccgcaaa aggtcaaagc agcaaacccc caaaccattc 2460
ttatcagtgg cggtaagatg accaaagctt tacaactagc aaggtcattc cacgcggctg 2520
gacatagagt tgtcttggtg gaaacccata aatactggtt gactggtcat cgtttttccc 2580
aagcagtgga taagttttac acagtccccg caccccagga caatccccaa gcttacattc 2640
aggctttggt agatatcgtc aaacaagaaa acatcgatgt ttatattccc gtcaccagtc 2700
cagtgggtag ctactacgac tcattagcca aaccagagtt atcccattat tgcgaagtgt 2760
ttcactttga cgcagatatt acccaaatgt tggatgataa atttgcgttg acacaaaaag 2820
cgcgatcgct tggtttatca gtacccaaat cctttaaaat tacctcacca gaacaagtca 2880
tcaacttcga tttttctgga gagacacgta aatacatcct caaaagcatt ccctacgact 2940
cagtgcggcg gttggactta accaaactcc cctgtgctac tccagaggaa acagcagcat 3000
tcgtcagaag tttgccaatt actcccgaaa aaccgtggat tatgcaggaa tttatccccg 3060
gtaaggaatt ctgcacccat agcaccgttc ggaatgggga actcagactg cattgctgtt 3120
gcgaatcttc agccttccaa gttaattatg agaatgtaaa taacccgcaa attaccgaat 3180
gggtacagca ttttgtcaag gaactgaaac tgacaggaca gatttccttt gactttatcc 3240
aagccgaaga cggaacagtt tacgccatcg agtgtaaccc ccgcacacat tcagcaatta 3300
ccacatttta cgaccacccc caggtagcag aagcgtactt gagtcaagca ccgacgactg 3360
aaaccataca accactaacg acaagcaagc ctacctattg gacttatcac gaagtttggc 3420
gtttaactgg tatccgttct ttcacccagt tgcaaagatg gctggggaat atttggcgcg 3480
ggactgatgc gatttatcag ccagatgacc ccttaccgtt tttgatggta catcattggc 3540
aaattcccct actgttattg aataatttgc gtcgtcttaa aggttggacg cggatagatt 3600
tcaatattgg gaagttggtg gaattggggg gagattagtt tttaaacgca gagggacgct 3660
gaggttagcg cagcgaaaag ttctggagga gggtttccct ccgtaggaaa cttttcaaga 3720
gagagggacg cggagtgtgt tttctctgcg tctctgcgtg agaaattttt tattattgag 3780
caaagttaga agatatgcag actatagatt ttaatattcg taagttactt gtagagtgga 3840
acgcgaccca cagagattat gatctttccc agagtttaca tgaactaatt gtagctcaag 3900
tagaacgaac acctgaggcg atcgctgtca cctttgacaa gcaacaacta acttatcaag 3960
aactaaatca taaagcaaac cagctaggac attatttaca aacattagga gtccagccag 4020
aaaccctggt aggcgtttgt ttagaacgtt ccttagaaat ggttatctgt cttttaggaa 4080
tcctcaaagc tgggggtgct tatgttccta ttgaccctga atatcctcaa gaacgcatag 4140
cttatatgct agaagattct caggtgaagg tactactaac tcaagaaaaa ttactcaatc 4200
aaattcccca ccatcaagca caaactatct gtgtagatag ggaatgggag aaaatttcca 4260
cacaagctaa taccaatccc aaaagtaata taaaaacgga taatcttgct tatgtaattt 4320
acacctctgg ttccactggt aaaccaaaag gtgcaatgaa cacccacaaa ggtatctgta 4380
atcgcttatt gtggatgcag gaagcttatc aaatcgattc cacagatagc attttacaaa 4440
aaaccccctt tagttttgat gtttccgttt gggagttctt ttggacttta ttaactggcg 4500
cacgtttggt aatagccaaa ccaggcggac ataaagatag tgcttacctc atcgatttaa 4560
ttactcaaga acaaatcact acgttgcatt ttgtcccctc aatgctgcaa gtgtttttac 4620
aaaatcgcca tgtaagcaaa tgcagctctc taaaaagagt tatttgtagc ggtgaagctt 4680
tatctataga tttacaaaat agatttttcc agcatttgca atgtgaatta cataacctct 4740
atggcccgac agaagcagca attgatgtca cattttggca atgtagaaaa gatagtaatt 4800
taaagagtgt acctattggt cgtcccattg ctaatactca aatttatatt cttgatgccg 4860
atttacaacc agtaaatatt ggtgtcactg gtgaaattta tattggtggt gtaggggttg 4920
ctcgtggtta tttgaataaa gaagaattga ccaaagaaaa atttattatt aatccctttc 4980
ccaattctga gtttaagcga ctttataaaa caggtgattt agctcgttat ttacccgatg 5040
gaaatattga atatcttggt agaacagatt atcaagtaaa aattcggggt tatagaattg 5100
aaattggcga gattgaaaat gttttatctt cacacccaca agtcagagaa gctgtagtca 5160
tagcgcggga tgataacgct caagaaaaac aaatcatcgc ttatattacc tataactcca 5220
tcaaacctca gcttgataat ctgcgtgatt tcctaaaagc aaggctacct gattttatga 5280
ttccagccgc ttttgtgatg ctggagcatc ttcctttaac tcccagtggt aaagtagacc 5340
gtaaggcatt acctaagcct gatttattta attatagtga acataattcc tatgtagcgc 5400
ctcggaatga agttgaagaa aaattagtac aaatctggtc gaatattctg catttaccta 5460
aagtaggtgt gacagaaaac tttttcgcta ttggtggtaa ttccctcaaa gctctacatt 5520
taatttctca aattgaagag ttatttgcta aagagatatc cttagcaaca cttttaacaa 5580
atccagtaat tgcagattta gccaaggtta ttcaagcaaa caaccaaatc cataattcac 5640
ccctagttcc aattcaacca caaggtaagc agcagccttt cttttgtata catcctgctg 5700
gtggtcatgt tttatgctat tttaaactcg cacaatatat aggaactgac caaccatttt 5760
atggcttaca agctcaagga ttttatggag atgaagcacc cttgacgcga gttgaagata 5820
tggctagtct ctacgtcaaa actattagag aatttcaacc ccaagggcct tatcgtgtcg 5880
gggggtggtc atttggtgga gtcgtagctt atgaagtagc acagcagtta catagacaag 5940
gacaagaagt atctttacta gcaatattag attcttacgt accgattctg ctggataaac 6000
aaaaacccat tgatgacgtt tatttagttg gtgttctctc cagagttttt ggcggtatgt 6060
ttggtcaaga taatctagtc acacctgaag aaatagaaaa tttaactgta gaagaaaaaa 6120
ttaattacat cattgataaa gcacggagcg ctagaatatt cccgcctggt gtagaacgtc 6180
aaaataatcg ccgtattctt gatgttttgg tgggaacttt aaaagcaact tattcctata 6240
taagacaacc atatccagga aaagtcactg tatttcgagc cagggaaaaa catattatgg 6300
ctcctgaccc gaccttagtt tgggtagaat tattttctgt aatggcggct caagaaatta 6360
agattattga tgtccctgga aaccattatt cgtttgttct agaaccccat gtacaggttt 6420
tagcacagcg tttacaagat tgtctggaaa ataattcata a 6461
<210> 18
<211> 2379
<212> DNA
<213> Escherichia coli W3110
<400> 18
atgtccaaca atggctcgtc accgctggtg ctttggtata accaactcgg catgaatgat 60
gtagacaggg ttgggggcaa aaatgcctcc ctgggtgaaa tgattactaa tctttccgga 120
atgggtgttt ccgttccgaa tggtttcgcc acaaccgccg acgcgtttaa ccagtttctg 180
gaccaaagcg gcgtaaacca gcgcatttat gaactgctgg ataaaacgga tattgacgat 240
gttactcagc ttgcgaaagc gggcgcgcaa atccgccagt ggattatcga cactcccttc 300
cagcctgagc tggaaaacgc catccgcgaa gcctatgcac agctttccgc cgatgacgaa 360
aacgcctctt ttgcggtgcg ctcctccgcc accgcagaag atatgccgga cgcttctttt 420
gccggtcagc aggaaacctt cctcaacgtt cagggttttg acgccgttct cgtggcagtg 480
aaacatgtat ttgcttctct gtttaacgat cgcgccatct cttatcgtgt gcaccagggt 540
tacgatcacc gtggtgtggc gctctccgcc ggtgttcaac ggatggtgcg ctctgacctc 600
gcatcatctg gcgtgatgtt ctccattgat accgaatccg gctttgacca ggtggtgttt 660
atcacttccg catggggcct tggtgagatg gtcgtgcagg gtgcggttaa cccggatgag 720
ttttacgtgc ataaaccgac actggcggcg aatcgcccgg ctatcgtgcg ccgcaccatg 780
gggtcgaaaa aaatccgcat ggtttacgcg ccgacccagg agcacggcaa gcaggttaaa 840
atcgaagacg taccgcagga acagcgtgac atcttctcgc tgaccaacga agaagtgcag 900
gaactggcaa aacaggccgt acaaattgag aaacactacg gtcgcccgat ggatattgag 960
tgggcgaaag atggccacac cggtaaactg ttcattgtgc aggcgcgtcc ggaaaccgtg 1020
cgctcacgcg gtcaggtcat ggagcgttat acgctgcatt cacagggtaa gattatcgcc 1080
gaaggccgtg ctatcggtca tcgcatcggt gcgggtccgg tgaaagtcat ccatgacatc 1140
agcgaaatga accgcatcga acctggcgac gtgctggtta ctgacatgac cgacccggac 1200
tgggaaccga tcatgaagaa agcatctgcc atcgtcacca accgtggcgg tcgtacctgt 1260
cacgcggcga tcatcgctcg tgaactgggc attccggcgg tagtgggctg tggagatgca 1320
acagaacgga tgaaagacgg tgagaacgtc actgtttctt gtgccgaagg tgataccggt 1380
tacgtctatg cggagttgct ggaatttagc gtgaaaagct ccagcgtaga aacgatgccg 1440
gatctgccgt tgaaagtgat gatgaacgtc ggtaacccgg accgtgcttt cgacttcgcc 1500
tgcctaccga acgaaggcgt gggccttgcg cgtctggaat ttatcatcaa ccgtatgatt 1560
ggcgtccacc cacgcgcact gcttgagttt gacgatcagg aaccgcagtt gcaaaacgaa 1620
atccgcgaga tgatgaaagg ttttgattct ccgcgtgaat tttacgttgg tcgtctgact 1680
gaagggatcg cgacgctggg tgccgcgttt tatccgaagc gcgtcattgt ccgtctctct 1740
gattttaaat cgaacgaata tgccaacctg gtcggtggtg agcgttacga gccagatgaa 1800
gagaacccga tgctcggctt ccgtggcgcg ggccgctatg tttccgacag cttccgcgac 1860
tgtttcgcgc tggagtgtga agcagtgaaa cgtgtgcgca acgacatggg actgaccaac 1920
gttgagatca tgatcccgtt cgtgcgtacc gtagatcagg cgaaagcggt ggttgaagaa 1980
ctggcgcgtc aggggctgaa acgtggcgag aacgggctga aaatcatcat gatgtgtgaa 2040
atcccgtcca acgccttgct ggccgagcag ttcctcgaat atttcgacgg cttctcaatt 2100
ggctcaaacg atatgacgca gctggcgctc ggtctggacc gtgactccgg cgtggtgtct 2160
gaattgttcg atgagcgcaa cgatgcggtg aaagcactgc tgtcgatggc tatccgtgcc 2220
gcgaagaaac agggcaaata tgtcgggatt tgcggtcagg gtccgtccga ccacgaagac 2280
tttgccgcat ggttgatgga agaggggatc gatagcctgt ctctgaaccc ggacaccgtg 2340
gtgcaaacct ggttaagcct ggctgaactg aagaaataa 2379
<210> 19
<211> 792
<212> PRT
<213> Escherichia coli W3110
<400> 19
Met Ser Asn Asn Gly Ser Ser Pro Leu Val Leu Trp Tyr Asn Gln Leu
1 5 10 15
Gly Met Asn Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly
20 25 30
Glu Met Ile Thr Asn Leu Ser Gly Met Gly Val Ser Val Pro Asn Gly
35 40 45
Phe Ala Thr Thr Ala Asp Ala Phe Asn Gln Phe Leu Asp Gln Ser Gly
50 55 60
Val Asn Gln Arg Ile Tyr Glu Leu Leu Asp Lys Thr Asp Ile Asp Asp
65 70 75 80
Val Thr Gln Leu Ala Lys Ala Gly Ala Gln Ile Arg Gln Trp Ile Ile
85 90 95
Asp Thr Pro Phe Gln Pro Glu Leu Glu Asn Ala Ile Arg Glu Ala Tyr
100 105 110
Ala Gln Leu Ser Ala Asp Asp Glu Asn Ala Ser Phe Ala Val Arg Ser
115 120 125
Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln
130 135 140
Glu Thr Phe Leu Asn Val Gln Gly Phe Asp Ala Val Leu Val Ala Val
145 150 155 160
Lys His Val Phe Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg
165 170 175
Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Val
180 185 190
Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Ser
195 200 205
Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ser Ala
210 215 220
Trp Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu
225 230 235 240
Phe Tyr Val His Lys Pro Thr Leu Ala Ala Asn Arg Pro Ala Ile Val
245 250 255
Arg Arg Thr Met Gly Ser Lys Lys Ile Arg Met Val Tyr Ala Pro Thr
260 265 270
Gln Glu His Gly Lys Gln Val Lys Ile Glu Asp Val Pro Gln Glu Gln
275 280 285
Arg Asp Ile Phe Ser Leu Thr Asn Glu Glu Val Gln Glu Leu Ala Lys
290 295 300
Gln Ala Val Gln Ile Glu Lys His Tyr Gly Arg Pro Met Asp Ile Glu
305 310 315 320
Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg
325 330 335
Pro Glu Thr Val Arg Ser Arg Gly Gln Val Met Glu Arg Tyr Thr Leu
340 345 350
His Ser Gln Gly Lys Ile Ile Ala Glu Gly Arg Ala Ile Gly His Arg
355 360 365
Ile Gly Ala Gly Pro Val Lys Val Ile His Asp Ile Ser Glu Met Asn
370 375 380
Arg Ile Glu Pro Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp
385 390 395 400
Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly
405 410 415
Gly Arg Thr Cys His Ala Ala Ile Ile Ala Arg Glu Leu Gly Ile Pro
420 425 430
Ala Val Val Gly Cys Gly Asp Ala Thr Glu Arg Met Lys Asp Gly Glu
435 440 445
Asn Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Ala
450 455 460
Glu Leu Leu Glu Phe Ser Val Lys Ser Ser Ser Val Glu Thr Met Pro
465 470 475 480
Asp Leu Pro Leu Lys Val Met Met Asn Val Gly Asn Pro Asp Arg Ala
485 490 495
Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu
500 505 510
Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Arg Ala Leu Leu
515 520 525
Glu Phe Asp Asp Gln Glu Pro Gln Leu Gln Asn Glu Ile Arg Glu Met
530 535 540
Met Lys Gly Phe Asp Ser Pro Arg Glu Phe Tyr Val Gly Arg Leu Thr
545 550 555 560
Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Tyr Pro Lys Arg Val Ile
565 570 575
Val Arg Leu Ser Asp Phe Lys Ser Asn Glu Tyr Ala Asn Leu Val Gly
580 585 590
Gly Glu Arg Tyr Glu Pro Asp Glu Glu Asn Pro Met Leu Gly Phe Arg
595 600 605
Gly Ala Gly Arg Tyr Val Ser Asp Ser Phe Arg Asp Cys Phe Ala Leu
610 615 620
Glu Cys Glu Ala Val Lys Arg Val Arg Asn Asp Met Gly Leu Thr Asn
625 630 635 640
Val Glu Ile Met Ile Pro Phe Val Arg Thr Val Asp Gln Ala Lys Ala
645 650 655
Val Val Glu Glu Leu Ala Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly
660 665 670
Leu Lys Ile Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala
675 680 685
Glu Gln Phe Leu Glu Tyr Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp
690 695 700
Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser
705 710 715 720
Glu Leu Phe Asp Glu Arg Asn Asp Ala Val Lys Ala Leu Leu Ser Met
725 730 735
Ala Ile Arg Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly
740 745 750
Gln Gly Pro Ser Asp His Glu Asp Phe Ala Ala Trp Leu Met Glu Glu
755 760 765
Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Gln Thr Trp
770 775 780
Leu Ser Leu Ala Glu Leu Lys Lys
785 790
<210> 20
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Pn-pps_F
<400> 20
aaaggagctc actagttttg ttcttcccgt gatg 34
<210> 21
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Pn-pps_R
<400> 21
cagggtgtgg tcgatatctt atttcttcag ttcagc 36
<210> 22
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> pps_F
<400> 22
taggagatta acatatgtcc aacaatggct cg 32
<210> 23
<211> 1992
<212> DNA
<213> Escherichia coli W3110
<400> 23
atgtcctcac gtaaagagct tgccaatgct attcgtgcgc tgagcatgga cgcagtacag 60
aaagccaaat ccggtcaccc gggtgcccct atgggtatgg ctgacattgc cgaagtcctg 120
tggcgtgatt tcctgaaaca caacccgcag aatccgtcct gggctgaccg tgaccgcttc 180
gtgctgtcca acggccacgg ctccatgctg atctacagcc tgctgcacct caccggttac 240
gatctgccga tggaagaact gaaaaacttc cgtcagctgc actctaaaac tccgggtcac 300
ccggaagtgg gttacaccgc tggtgtggaa accaccaccg gtccgctggg tcagggtatt 360
gccaacgcag tcggtatggc gattgcagaa aaaacgctgg cggcgcagtt taaccgtccg 420
ggccacgaca ttgtcgacca ctacacctac gccttcatgg gcgacggctg catgatggaa 480
ggcatctccc acgaagtttg ctctctggcg ggtacgctga agctgggtaa actgattgca 540
ttctacgatg acaacggtat ttctatcgat ggtcacgttg aaggctggtt caccgacgac 600
accgcaatgc gtttcgaagc ttacggctgg cacgttattc gcgacatcga cggtcatgac 660
gcggcatcta tcaaacgcgc agtagaagaa gcgcgcgcag tgactgacaa accttccctg 720
ctgatgtgca aaaccatcat cggtttcggt tccccgaaca aagccggtac ccacgactcc 780
cacggtgcgc cgctgggcga cgctgaaatt gccctgaccc gcgaacaact gggctggaaa 840
tatgcgccgt tcgaaatccc gtctgaaatc tatgctcagt gggatgcgaa agaagcaggc 900
caggcgaaag aatccgcatg gaacgagaaa ttcgctgctt acgcgaaagc ttatccgcag 960
gaagccgctg aatttacccg ccgtatgaaa ggcgaaatgc cgtctgactt cgacgctaaa 1020
gcgaaagagt tcatcgctaa actgcaggct aatccggcga aaatcgccag ccgtaaagcg 1080
tctcagaatg ctatcgaagc gttcggtccg ctgttgccgg aattcctcgg cggttctgct 1140
gacctggcgc cgtctaacct gaccctgtgg tctggttcta aagcaatcaa cgaagatgct 1200
gcgggtaact acatccacta cggtgttcgc gagttcggta tgaccgcgat tgctaacggt 1260
atctccctgc acggtggctt cctgccgtac acctccacct tcctgatgtt cgtggaatac 1320
gcacgtaacg ccgtacgtat ggctgcgctg atgaaacagc gtcaggtgat ggtttacacc 1380
cacgactcca tcggtctggg cgaagacggc ccgactcacc agccggttga gcaggtcgct 1440
tctctgcgcg taaccccgaa catgtctaca tggcgtccgt gtgaccaggt tgaatccgcg 1500
gtcgcgtgga aatacggtgt tgagcgtcag gacggcccga ccgcactgat cctctcccgt 1560
cagaacctgg cgcagcagga acgaactgaa gagcaactgg caaacatcgc gcgcggtggt 1620
tatgtgctga aagactgcgc cggtcagccg gaactgattt tcatcgctac cggttcagaa 1680
gttgaactgg ctgttgctgc ctacgaaaaa ctgactgccg aaggcgtgaa agcgcgcgtg 1740
gtgtccatgc cgtctaccga cgcatttgac aagcaggatg ctgcttaccg tgaatccgta 1800
ctgccgaaag cggttactgc acgcgttgct gtagaagcgg gtattgctga ctactggtac 1860
aagtatgttg gcctgaacgg tgctatcgtc ggtatgacca ccttcggtga atctgctccg 1920
gcagagctgc tgtttgaaga gttcggcttc actgttgata acgttgttgc gaaagcaaaa 1980
gaactgctgt aa 1992
<210> 24
<211> 663
<212> PRT
<213> Escherichia coli W3110
<400> 24
Met Ser Ser Arg Lys Glu Leu Ala Asn Ala Ile Arg Ala Leu Ser Met
1 5 10 15
Asp Ala Val Gln Lys Ala Lys Ser Gly His Pro Gly Ala Pro Met Gly
20 25 30
Met Ala Asp Ile Ala Glu Val Leu Trp Arg Asp Phe Leu Lys His Asn
35 40 45
Pro Gln Asn Pro Ser Trp Ala Asp Arg Asp Arg Phe Val Leu Ser Asn
50 55 60
Gly His Gly Ser Met Leu Ile Tyr Ser Leu Leu His Leu Thr Gly Tyr
65 70 75 80
Asp Leu Pro Met Glu Glu Leu Lys Asn Phe Arg Gln Leu His Ser Lys
85 90 95
Thr Pro Gly His Pro Glu Val Gly Tyr Thr Ala Gly Val Glu Thr Thr
100 105 110
Thr Gly Pro Leu Gly Gln Gly Ile Ala Asn Ala Val Gly Met Ala Ile
115 120 125
Ala Glu Lys Thr Leu Ala Ala Gln Phe Asn Arg Pro Gly His Asp Ile
130 135 140
Val Asp His Tyr Thr Tyr Ala Phe Met Gly Asp Gly Cys Met Met Glu
145 150 155 160
Gly Ile Ser His Glu Val Cys Ser Leu Ala Gly Thr Leu Lys Leu Gly
165 170 175
Lys Leu Ile Ala Phe Tyr Asp Asp Asn Gly Ile Ser Ile Asp Gly His
180 185 190
Val Glu Gly Trp Phe Thr Asp Asp Thr Ala Met Arg Phe Glu Ala Tyr
195 200 205
Gly Trp His Val Ile Arg Asp Ile Asp Gly His Asp Ala Ala Ser Ile
210 215 220
Lys Arg Ala Val Glu Glu Ala Arg Ala Val Thr Asp Lys Pro Ser Leu
225 230 235 240
Leu Met Cys Lys Thr Ile Ile Gly Phe Gly Ser Pro Asn Lys Ala Gly
245 250 255
Thr His Asp Ser His Gly Ala Pro Leu Gly Asp Ala Glu Ile Ala Leu
260 265 270
Thr Arg Glu Gln Leu Gly Trp Lys Tyr Ala Pro Phe Glu Ile Pro Ser
275 280 285
Glu Ile Tyr Ala Gln Trp Asp Ala Lys Glu Ala Gly Gln Ala Lys Glu
290 295 300
Ser Ala Trp Asn Glu Lys Phe Ala Ala Tyr Ala Lys Ala Tyr Pro Gln
305 310 315 320
Glu Ala Ala Glu Phe Thr Arg Arg Met Lys Gly Glu Met Pro Ser Asp
325 330 335
Phe Asp Ala Lys Ala Lys Glu Phe Ile Ala Lys Leu Gln Ala Asn Pro
340 345 350
Ala Lys Ile Ala Ser Arg Lys Ala Ser Gln Asn Ala Ile Glu Ala Phe
355 360 365
Gly Pro Leu Leu Pro Glu Phe Leu Gly Gly Ser Ala Asp Leu Ala Pro
370 375 380
Ser Asn Leu Thr Leu Trp Ser Gly Ser Lys Ala Ile Asn Glu Asp Ala
385 390 395 400
Ala Gly Asn Tyr Ile His Tyr Gly Val Arg Glu Phe Gly Met Thr Ala
405 410 415
Ile Ala Asn Gly Ile Ser Leu His Gly Gly Phe Leu Pro Tyr Thr Ser
420 425 430
Thr Phe Leu Met Phe Val Glu Tyr Ala Arg Asn Ala Val Arg Met Ala
435 440 445
Ala Leu Met Lys Gln Arg Gln Val Met Val Tyr Thr His Asp Ser Ile
450 455 460
Gly Leu Gly Glu Asp Gly Pro Thr His Gln Pro Val Glu Gln Val Ala
465 470 475 480
Ser Leu Arg Val Thr Pro Asn Met Ser Thr Trp Arg Pro Cys Asp Gln
485 490 495
Val Glu Ser Ala Val Ala Trp Lys Tyr Gly Val Glu Arg Gln Asp Gly
500 505 510
Pro Thr Ala Leu Ile Leu Ser Arg Gln Asn Leu Ala Gln Gln Glu Arg
515 520 525
Thr Glu Glu Gln Leu Ala Asn Ile Ala Arg Gly Gly Tyr Val Leu Lys
530 535 540
Asp Cys Ala Gly Gln Pro Glu Leu Ile Phe Ile Ala Thr Gly Ser Glu
545 550 555 560
Val Glu Leu Ala Val Ala Ala Tyr Glu Lys Leu Thr Ala Glu Gly Val
565 570 575
Lys Ala Arg Val Val Ser Met Pro Ser Thr Asp Ala Phe Asp Lys Gln
580 585 590
Asp Ala Ala Tyr Arg Glu Ser Val Leu Pro Lys Ala Val Thr Ala Arg
595 600 605
Val Ala Val Glu Ala Gly Ile Ala Asp Tyr Trp Tyr Lys Tyr Val Gly
610 615 620
Leu Asn Gly Ala Ile Val Gly Met Thr Thr Phe Gly Glu Ser Ala Pro
625 630 635 640
Ala Glu Leu Leu Phe Glu Glu Phe Gly Phe Thr Val Asp Asn Val Val
645 650 655
Ala Lys Ala Lys Glu Leu Leu
660
<210> 25
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Pn-tktA_F
<400> 25
aaaggagctc actagtgttt tctcttccgc acaa 34
<210> 26
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Pn-tktA_R
<400> 26
cagggtgtgg tcgatatctt acagcagttc ttttgc 36
<210> 27
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> tktA_F
<400> 27
taggagatta acatatgtcc tcacgtaaag ag 32
<210> 28
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj1-aroG_R
<400> 28
cccgcggttt acccgcgacg cgcttt 26
<210> 29
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj1-pps_F
<400> 29
gcgggtaaac cgcgggctta ttccat 26
<210> 30
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj1-pps_R
<400> 30
cccgcggttt atttcttcag ttcagc 26
<210> 31
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj1-tktA_F
<400> 31
agaaataaac cgcgggctta ttccat 26
<210> 32
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<223> aroD deletion cassette_F
<400> 32
tcatggggtt cggtgcctga caggctgacc gcgtgcagaa agggtaaaaa gctggagctg 60
cttcgaagtt c 71
<210> 33
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> aroD deletion cassette_R
<400> 33
atatattttt tagttcggcg gggagggtgt tcccgccgaa atattattgc gccatggtcc 60
atatgaatat cctccttag 79
<210> 34
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> aroD deletion_F
<400> 34
caaagatttc cctctggaat atg 23
<210> 35
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> aroD deletion_R
<400> 35
cagatgtgat tttccctacg c 21
<210> 36
<211> 1389
<212> DNA
<213> Corynebacterium glutamicum ATCC13032
<400> 36
gtgagttgga cagttgatat ccctaaagaa gttctccctg atttgccacc attgccagaa 60
ggcatgcagc agcagttcga ggacaccatt tcccgtgacg ctaagcagca acctacgtgg 120
gatcgtgcac aggcagaaaa cgtgcgcaag atccttgagt cggttcctcc aatcgttgtt 180
gcccctgagg tacttgagct gaagcagaag cttgctgatg ttgccaacgg taaggccttc 240
ctcttgcagg gtggtgactg tgcggaaact ttcgagtcaa acactgagcc gcacattcgc 300
gccaacgtaa agactctgct gcagatggca gttgttttga cctacggtgc atccactcct 360
gtgatcaaga tggctcgtat tgctggtcag tacgcaaagc ctcgctcttc tgatctggat 420
ggaaatggtc tgccaaacta ccgtggcgat atcgtcaacg gtgtggaggc aaccccagag 480
gctcgtcgcc acgatcctgc ccgcatgatc cgtgcttacg ctaacgcttc tgctgcgatg 540
aacttggtgc gcgcgctcac cagctctggc accgctgatc tttaccgtct cagcgagtgg 600
aaccgcgagt tcgttgcgaa ctccccagct ggtgcacgct acgaggctct tgctcgtgag 660
atcgactccg gtctgcgctt catggaagca tgtggcgtgt ccgatgagtc cctgcgtgct 720
gcagatatct actgctccca cgaggctttg ctggtggatt acgagcgttc catgctgcgt 780
cttgcaaccg atgaggaagg caacgaggaa ctttacgatc tttcagctca ccagctgtgg 840
atcggcgagc gcacccgtgg catggatgat ttccatgtga acttcgcatc catgatctct 900
aacccaatcg gcatcaagat tggtcctggt atcacccctg aagaggctgt tgcatacgct 960
gacaagctcg atccgaactt cgagcctggc cgtttgacca tcgttgctcg catgggccac 1020
gacaaggttc gctccgtact tcctggtgtt atccaggctg ttgaggcatc cggacacaag 1080
gttatttggc agtccgatcc gatgcacggc aacactttca ccgcatccaa tggctacaag 1140
acccgtcact tcgacaaggt tatcgatgag gtccagggct tcttcgaggt ccaccgcgca 1200
ttgggcaccc acccaggcgg aatccacatt gagttcactg gtgaagatgt caccgagtgc 1260
ctcggtggcg ctgaagacat caccgatgtt gatctgccag gccgctacga gtccgcatgc 1320
gatcctcgcc tgaacactca gcagtctttg gagttggctt tcctcgttgc agaaatgctg 1380
cgtaactaa 1389
<210> 37
<211> 462
<212> PRT
<213> Corynebacterium glutamicum ATCC13032
<400> 37
Met Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu Pro Asp Leu Pro
1 5 10 15
Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp Thr Ile Ser Arg
20 25 30
Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln Ala Glu Asn Val
35 40 45
Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val Ala Pro Glu Val
50 55 60
Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn Gly Lys Ala Phe
65 70 75 80
Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu Ser Asn Thr Glu
85 90 95
Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln Met Ala Val Val
100 105 110
Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met Ala Arg Ile Ala
115 120 125
Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp Gly Asn Gly Leu
130 135 140
Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu Ala Thr Pro Glu
145 150 155 160
Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala Tyr Ala Asn Ala
165 170 175
Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser Ser Gly Thr Ala
180 185 190
Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe Val Ala Asn Ser
195 200 205
Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu Ile Asp Ser Gly
210 215 220
Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu Ser Leu Arg Ala
225 230 235 240
Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val Asp Tyr Glu Arg
245 250 255
Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn Glu Glu Leu Tyr
260 265 270
Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg Thr Arg Gly Met
275 280 285
Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser Asn Pro Ile Gly
290 295 300
Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala Val Ala Tyr Ala
305 310 315 320
Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu Thr Ile Val Ala
325 330 335
Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro Gly Val Ile Gln
340 345 350
Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln Ser Asp Pro Met
355 360 365
His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys Thr Arg His Phe
370 375 380
Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu Val His Arg Ala
385 390 395 400
Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe Thr Gly Glu Asp
405 410 415
Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr Asp Val Asp Leu
420 425 430
Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu Asn Thr Gln Gln
435 440 445
Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu Arg Asn
450 455 460
<210> 38
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Pn-cgl aroG_F
<400> 38
ggtatcgata agcttgattc gatctgctcc cattcc 36
<210> 39
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Pn-cgl aroG_R
<400> 39
cggtggcggc cgctctagtt agttacgcag catttc 36
<210> 40
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-cgl aroG_F
<400> 40
cgaaaggaaa cactcgatgt gagttggaca gttgatatc 39
<210> 41
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-cgl aroG_R
<400> 41
ccgccaaaac agctctagtt tagttacgca gcatttc 37
<210> 42
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_ABCD_F
<400> 42
ccaaacacca acaaaaggct ctacccatat gatgagtatc gtccaagcaa agtttgaagc 60
60
<210> 43
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_ABCD_R
<400> 43
agagggtgac gctagtcaga actagtttat gaattatttt ccagacaatc ttgtaaacgc 60
60
<210> 44
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> O2 promoter_F
<400> 44
ccaaacacca acaaaaggct ctacccatat gcaataatcg tgaattttgg cagc 54
<210> 45
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> O2 promoter_R
<400> 45
caaactttgc ttggacgata ctcattgttt tgatctcctc caataatcta tgc 53
<210> 46
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Pn-cgl tkt_F
<400> 46
ggtatcgata agcttgataa gattgatcac acctttg 37
<210> 47
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Pn-cgl tkt_R
<400> 47
cggtggcggc cgctctagtt aaccgttaat ggagtc 36
<210> 48
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-cgl tkt_F
<400> 48
cgaaaggaaa cactcgattt gaccaccttg acgctg 36
<210> 49
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-cgl tkt_R
<400> 49
ccgccaaaac agctctagtt taaccgttaa tggagtc 37
<210> 50
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Ptrc-cgl pps_F
<400> 50
tcacacagga aagatatcat gaccaacagt ttgaac 36
<210> 51
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Ptrc-cgl pps_R
<400> 51
ccgccaaaac agctctagtt tacttcgtgc cggtcattg 39
<210> 52
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-cgl pps_F
<400> 52
cgaaaggaaa cactcgatat gaccaacagt ttgaac 36
<210> 53
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-aroG_F
<400> 53
ttagaaatgg aacctaaaag aaacatccca gcgctac 37
<210> 54
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-aroG_R
<400> 54
tagcgctggg atgtttcttt agttacgcag catttc 36
<210> 55
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-tkt_F
<400> 55
gaaatgctgc gtaactaaag aaacatccca gcgcta 36
<210> 56
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-tkt_R
<400> 56
gtagcgctgg gatgtttctt taaccgttaa tggagtc 37
<210> 57
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-pps_F
<400> 57
gactccatta acggttaaag aaacatccca gcgctac 37
<210> 58
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Pcj7-pps_R
<400> 58
ggagaatact gtcgttcatt tacttcgtgc cggtcattg 39
<210> 59
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_F
<400> 59
ggatccacag tttattcctg gcatcc 26
<210> 60
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_R
<400> 60
tttgcttgga cgatactcat ttgtttgttt atgtgtgttt 40
<210> 61
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_A_F
<400> 61
aaacacacat aaacaaacaa atgagtatcg tccaagcaaa 40
<210> 62
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_A_R
<400> 62
ggatgccagg aataaactgt ttatttaaca ctcccgatta 40
<210> 63
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_F
<400> 63
taatcgggag tgttaaataa acagtttatt cctggcatcc 40
<210> 64
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_R
<400> 64
tggacaatca catttgtcaa ttgtttgttt atgtgtgttt 40
<210> 65
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_B_F
<400> 65
aaacacacat aaacaaacaa ttgacaaatg tgattgtcca 40
<210> 66
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_B_R
<400> 66
gtcgacttaa ggttgtattc tgcgga 26
<210> 67
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_F
<400> 67
ggatccacag tttattcctg gcatcc 26
<210> 68
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_R
<400> 68
aaagagattg attgtgccat ttgtttgttt atgtgtgttt 40
<210> 69
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_C_F
<400> 69
aaacacacat aaacaaacaa atggcacaat caatctcttt 40
<210> 70
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_C_R
<400> 70
ggatgccagg aataaactgt ttagtcgccc cctaattcca 40
<210> 71
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_F
<400> 71
tggaattagg gggcgactaa acagtttatt cctggcatcc 40
<210> 72
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_R
<400> 72
aggatattaa gtactggcat ttgtttgttt atgtgtgttt 40
<210> 73
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_D_F
<400> 73
aaacacacat aaacaaacaa atgccagtac ttaatatcct 40
<210> 74
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Ava_D_R
<400> 74
gtcgactcaa ttttgtaaca cctttt 26
<210> 75
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> TKL1_F
<400> 75
ggatccatga ctcaattcac tgacat 26
<210> 76
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> TKL1_R
<400> 76
gtcgacttag aaagcttttt tcaaag 26
<210> 77
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> ARO4_F
<400> 77
ggatccatga gtgaatctcc aatgtt 26
<210> 78
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> ARO4_R
<400> 78
gtcgacctat ttcttgttaa cttctc 26
<210> 79
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> pps_F
<400> 79
ggatccatgt ccaacaatgg ctcgtc 26
<210> 80
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> pps_R
<400> 80
gtcgacttat ttcttcagtt cagcca 26
<210> 81
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_F
<400> 81
ggatccacag tttattcctg gcatcc 26
<210> 82
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_R
<400> 82
atgtcagtga attgagtcat ttgtttgttt atgtgtgttt 40
<210> 83
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> TKL1_F
<400> 83
aaacacacat aaacaaacaa atgactcaat tcactgacat 40
<210> 84
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> TKL1_R
<400> 84
ggatgccagg aataaactgt ttagaaagct tttttcaaag 40
<210> 85
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_F
<400> 85
ctttgaaaaa agctttctaa acagtttatt cctggcatcc 40
<210> 86
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pGPD_R
<400> 86
aacattggag attcactcat ttgtttgttt atgtgtgttt 40
<210> 87
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> ARO4_F
<400> 87
aaacacacat aaacaaacaa atgagtgaat ctccaatgtt 40
<210> 88
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> ARO4_R
<400> 88
gtcgacctat ttcttgttaa cttctc 26
<210> 89
<211> 438
<212> DNA
<213> Corynebacterium glutamicum ATCC13032
<400> 89
atgcctggaa aaattctcct cctcaacggc ccaaacctga acatgctggg caaacgcgag 60
cctgacattt acggacacga caccttggaa gacgtcgtcg cgctggcaac cgctgaggct 120
gcgaagcacg gccttgaggt tgaggcgctg cagagcaatc acgaaggtga gctaatcgat 180
gcgctgcaca acgctcgcgg cacccacatc ggttgcgtga ttaaccccgg cggcctgact 240
cacacttcgg tggcgctttt ggatgctgtg aaggcgtctg agcttcctac cgttgaggtg 300
cacatttcca atccgcatgc ccgtgaagag ttccgccacc attcttacat ttccctcgcc 360
gcggtctccg ttatcgctgg cgctggcatc cagggttacc gtttcgcggt cgatatcctg 420
gcaaatctca aaaagtag 438
<210> 90
<211> 145
<212> PRT
<213> Corynebacterium glutamicum ATCC13032
<400> 90
Met Pro Gly Lys Ile Leu Leu Leu Asn Gly Pro Asn Leu Asn Met Leu
1 5 10 15
Gly Lys Arg Glu Pro Asp Ile Tyr Gly His Asp Thr Leu Glu Asp Val
20 25 30
Val Ala Leu Ala Thr Ala Glu Ala Ala Lys His Gly Leu Glu Val Glu
35 40 45
Ala Leu Gln Ser Asn His Glu Gly Glu Leu Ile Asp Ala Leu His Asn
50 55 60
Ala Arg Gly Thr His Ile Gly Cys Val Ile Asn Pro Gly Gly Leu Thr
65 70 75 80
His Thr Ser Val Ala Leu Leu Asp Ala Val Lys Ala Ser Glu Leu Pro
85 90 95
Thr Val Glu Val His Ile Ser Asn Pro His Ala Arg Glu Glu Phe Arg
100 105 110
His His Ser Tyr Ile Ser Leu Ala Ala Val Ser Val Ile Ala Gly Ala
115 120 125
Gly Ile Gln Gly Tyr Arg Phe Ala Val Asp Ile Leu Ala Asn Leu Lys
130 135 140
Lys
145
<210> 91
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> aroD_F
<400> 91
gatcggatcc cactggacgt ttgggtgaga cc 32
<210> 92
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> aroD_R
<400> 92
gatcggatcc actagtttta ggttccattt ctaattg 37
<210> 93
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> aroD_F
<400> 93
gatcactagt atgaacgaca gtattctcc 29
<210> 94
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> aroD_D
<400> 94
gatcaagctt gttacatcct gacgttgtgg 30
<210> 95
<211> 2103
<212> DNA
<213> Corynebacterium glutamicum ATCC13032
<400> 95
ttgaccacct tgacgctgtc acctgaactt caggcgctca ctgtacgcaa ttacccctct 60
gattggtccg atgtggacac caaggctgta gacactgttc gtgtcctcgc tgcagacgct 120
gtagaaaact gtggctccgg ccacccaggc accgcaatga gcctggctcc ccttgcatac 180
accttgtacc agcgggttat gaacgtagat ccacaggaca ccaactgggc aggccgtgac 240
cgcttcgttc tttcttgtgg ccactcctct ttgacccagt acatccagct ttacttgggt 300
ggattcggcc ttgagatgga tgacctgaag gctctgcgca cctgggattc cttgacccca 360
ggacaccctg agtaccgcca caccaagggc gttgagatca ccactggccc tcttggccag 420
ggtcttgcat ctgcagttgg tatggccatg gctgctcgtc gtgagcgtgg cctattcgac 480
ccaaccgctg ctgagggcga atccccattc gaccaccaca tctacgtcat tgcttctgat 540
ggtgacctgc aggaaggtgt cacctctgag gcatcctcca tcgctggcac ccagcagctg 600
ggcaacctca tcgtgttctg ggatgacaac cgcatctcca tcgaagacaa cactgagatc 660
gctttcaacg aggacgttgt tgctcgttac aaggcttacg gctggcagac cattgaggtt 720
gaggctggcg aggacgttgc agcaatcgaa gctgcagtgg ctgaggctaa gaaggacacc 780
aagcgaccta ccttcatccg cgttcgcacc atcatcggct tcccagctcc aactatgatg 840
aacaccggtg ctgtgcacgg tgctgctctt ggcgcagctg aggttgcagc aaccaagact 900
gagcttggat tcgatcctga ggctcacttc gcgatcgacg atgaggttat cgctcacacc 960
cgctccctcg cagagcgcgc tgcacagaag aaggctgcat ggcaggtcaa gttcgatgag 1020
tgggcagctg ccaaccctga gaacaaggct ctgttcgatc gcctgaactc ccgtgagctt 1080
ccagcgggct acgctgacga gctcccaaca tgggatgcag atgagaaggg cgtcgcaact 1140
cgtaaggctt ccgaggctgc acttcaggca ctgggcaaga cccttcctga gctgtggggc 1200
ggttccgctg acctcgcagg ttccaacaac accgtgatca agggctcccc ttccttcggc 1260
cctgagtcca tctccaccga gacctggtct gctgagcctt acggccgtaa cctgcacttc 1320
ggtatccgtg agcacgctat gggatccatc ctcaacggca tttccctcca cggtggcacc 1380
cgcccatacg gcggaacctt cctcatcttc tccgactaca tgcgtcctgc agttcgtctt 1440
gcagctctca tggagaccga cgcttactac gtctggaccc acgactccat cggtctgggc 1500
gaagatggcc caacccacca gcctgttgaa accttggctg cactgcgcgc catcccaggt 1560
ctgtccgtcc tgcgtcctgc agatgcgaac gagaccgccc aggcttgggc tgcagcactt 1620
gagtacaagg aaggccctaa gggtcttgca ctgacccgcc agaacgttcc tgttctggaa 1680
ggcaccaagg agaaggctgc tgaaggcgtt cgccgcggtg gctacgtcct ggttgagggt 1740
tccaaggaaa ccccagatgt gatcctcatg ggctccggct ccgaggttca gcttgcagtt 1800
aacgctgcga aggctctgga agctgagggc gttgcagctc gcgttgtttc cgttccttgc 1860
atggattggt tccaggagca ggacgcagag tacatcgagt ccgttctgcc tgcagctgtg 1920
accgctcgtg tgtctgttga agctggcatc gcaatgcctt ggtaccgctt cttgggcacc 1980
cagggccgtg ctgtctccct tgagcacttc ggtgcttctg cggattacca gaccctgttt 2040
gagaagttcg gcatcaccac cgatgcagtc gtggcagcgg ccaaggactc cattaacggt 2100
taa 2103
<210> 96
<211> 700
<212> PRT
<213> Corynebacterium glutamicum ATCC13032
<400> 96
Met Thr Thr Leu Thr Leu Ser Pro Glu Leu Gln Ala Leu Thr Val Arg
1 5 10 15
Asn Tyr Pro Ser Asp Trp Ser Asp Val Asp Thr Lys Ala Val Asp Thr
20 25 30
Val Arg Val Leu Ala Ala Asp Ala Val Glu Asn Cys Gly Ser Gly His
35 40 45
Pro Gly Thr Ala Met Ser Leu Ala Pro Leu Ala Tyr Thr Leu Tyr Gln
50 55 60
Arg Val Met Asn Val Asp Pro Gln Asp Thr Asn Trp Ala Gly Arg Asp
65 70 75 80
Arg Phe Val Leu Ser Cys Gly His Ser Ser Leu Thr Gln Tyr Ile Gln
85 90 95
Leu Tyr Leu Gly Gly Phe Gly Leu Glu Met Asp Asp Leu Lys Ala Leu
100 105 110
Arg Thr Trp Asp Ser Leu Thr Pro Gly His Pro Glu Tyr Arg His Thr
115 120 125
Lys Gly Val Glu Ile Thr Thr Gly Pro Leu Gly Gln Gly Leu Ala Ser
130 135 140
Ala Val Gly Met Ala Met Ala Ala Arg Arg Glu Arg Gly Leu Phe Asp
145 150 155 160
Pro Thr Ala Ala Glu Gly Glu Ser Pro Phe Asp His His Ile Tyr Val
165 170 175
Ile Ala Ser Asp Gly Asp Leu Gln Glu Gly Val Thr Ser Glu Ala Ser
180 185 190
Ser Ile Ala Gly Thr Gln Gln Leu Gly Asn Leu Ile Val Phe Trp Asp
195 200 205
Asp Asn Arg Ile Ser Ile Glu Asp Asn Thr Glu Ile Ala Phe Asn Glu
210 215 220
Asp Val Val Ala Arg Tyr Lys Ala Tyr Gly Trp Gln Thr Ile Glu Val
225 230 235 240
Glu Ala Gly Glu Asp Val Ala Ala Ile Glu Ala Ala Val Ala Glu Ala
245 250 255
Lys Lys Asp Thr Lys Arg Pro Thr Phe Ile Arg Val Arg Thr Ile Ile
260 265 270
Gly Phe Pro Ala Pro Thr Met Met Asn Thr Gly Ala Val His Gly Ala
275 280 285
Ala Leu Gly Ala Ala Glu Val Ala Ala Thr Lys Thr Glu Leu Gly Phe
290 295 300
Asp Pro Glu Ala His Phe Ala Ile Asp Asp Glu Val Ile Ala His Thr
305 310 315 320
Arg Ser Leu Ala Glu Arg Ala Ala Gln Lys Lys Ala Ala Trp Gln Val
325 330 335
Lys Phe Asp Glu Trp Ala Ala Ala Asn Pro Glu Asn Lys Ala Leu Phe
340 345 350
Asp Arg Leu Asn Ser Arg Glu Leu Pro Ala Gly Tyr Ala Asp Glu Leu
355 360 365
Pro Thr Trp Asp Ala Asp Glu Lys Gly Val Ala Thr Arg Lys Ala Ser
370 375 380
Glu Ala Ala Leu Gln Ala Leu Gly Lys Thr Leu Pro Glu Leu Trp Gly
385 390 395 400
Gly Ser Ala Asp Leu Ala Gly Ser Asn Asn Thr Val Ile Lys Gly Ser
405 410 415
Pro Ser Phe Gly Pro Glu Ser Ile Ser Thr Glu Thr Trp Ser Ala Glu
420 425 430
Pro Tyr Gly Arg Asn Leu His Phe Gly Ile Arg Glu His Ala Met Gly
435 440 445
Ser Ile Leu Asn Gly Ile Ser Leu His Gly Gly Thr Arg Pro Tyr Gly
450 455 460
Gly Thr Phe Leu Ile Phe Ser Asp Tyr Met Arg Pro Ala Val Arg Leu
465 470 475 480
Ala Ala Leu Met Glu Thr Asp Ala Tyr Tyr Val Trp Thr His Asp Ser
485 490 495
Ile Gly Leu Gly Glu Asp Gly Pro Thr His Gln Pro Val Glu Thr Leu
500 505 510
Ala Ala Leu Arg Ala Ile Pro Gly Leu Ser Val Leu Arg Pro Ala Asp
515 520 525
Ala Asn Glu Thr Ala Gln Ala Trp Ala Ala Ala Leu Glu Tyr Lys Glu
530 535 540
Gly Pro Lys Gly Leu Ala Leu Thr Arg Gln Asn Val Pro Val Leu Glu
545 550 555 560
Gly Thr Lys Glu Lys Ala Ala Glu Gly Val Arg Arg Gly Gly Tyr Val
565 570 575
Leu Val Glu Gly Ser Lys Glu Thr Pro Asp Val Ile Leu Met Gly Ser
580 585 590
Gly Ser Glu Val Gln Leu Ala Val Asn Ala Ala Lys Ala Leu Glu Ala
595 600 605
Glu Gly Val Ala Ala Arg Val Val Ser Val Pro Cys Met Asp Trp Phe
610 615 620
Gln Glu Gln Asp Ala Glu Tyr Ile Glu Ser Val Leu Pro Ala Ala Val
625 630 635 640
Thr Ala Arg Val Ser Val Glu Ala Gly Ile Ala Met Pro Trp Tyr Arg
645 650 655
Phe Leu Gly Thr Gln Gly Arg Ala Val Ser Leu Glu His Phe Gly Ala
660 665 670
Ser Ala Asp Tyr Gln Thr Leu Phe Glu Lys Phe Gly Ile Thr Thr Asp
675 680 685
Ala Val Val Ala Ala Ala Lys Asp Ser Ile Asn Gly
690 695 700
<210> 97
<211> 1095
<212> DNA
<213> Corynebacterium glutamicum ATCC13032
<400> 97
atgaccaaca gtttgaacat cccgtttgtc cagcgcttcg atgaaggcct ggatcctgtt 60
ctagaagtac tcggtggcaa gggcgcttca ctagtcacca tgacagatgc tggaatgccc 120
gttccacctg gatttgtggt cactactgcc agctttgatg aattcatccg tgaagcaggg 180
gttgctgaac acatcgataa attcctaaac gatctcgatg cagaagatgt taaggaagtg 240
gatcgagttt ctgcgatcat ccgcgatgag ctgtgcagtc ttgacgttcc agagaatgct 300
cgtttcgcag tgcaccaggc ttatcgcgat ctcatggaac gatgcggtgg cgacgtcccg 360
gttgctgtcc ggtcatcggc cactgccgaa gatctgcccg atgcttcctt cgcagggcaa 420
caggacacct atctgtggca agtcggtttg agcgctgtca ctgaacacat ccgtaaatgc 480
tgggcttcgc tgttcacttc ccgtgccatt atctaccgtc tgaaaaacaa catccccaat 540
gagggcctct ccatggcggt agttgttcaa aaaatggtca actctcgtgt cgcaggcgtg 600
gcaatcacta tgaatccttc caacggcgac cgctcgaaga tcaccatcga ttcctcatgg 660
ggtgttggtg aaatggtggt ctcaggtgaa gtgacaccag acaatatctt gctggacaag 720
atcacgctgc aggttgtctc cgaacacatt ggaagcaaac acgctgaact catccccgat 780
gccaccagtg gaagcctcgt ggaaaagccc gttgatgaag aacgcgcaaa ccgccgcagt 840
ctgactgatg aggaaatgct cgctgtggca caaatggcta agcgtgcaga aaaacactac 900
aagtgcccac aagatatcga atgggcgctg gacgctgatc tgccagatgg agaaaacctt 960
ctgttattgc aatcccgccc ggaaactatc cactccaacg gtgtgaagaa ggaaacccca 1020
actccgcagg ctgccaaaac cataggcacc ttcgatttca gctcaatcac cgtcgcaatg 1080
accggcacga agtaa 1095
<210> 98
<211> 364
<212> PRT
<213> Corynebacterium glutamicum ATCC13032
<400> 98
Met Thr Asn Ser Leu Asn Ile Pro Phe Val Gln Arg Phe Asp Glu Gly
1 5 10 15
Leu Asp Pro Val Leu Glu Val Leu Gly Gly Lys Gly Ala Ser Leu Val
20 25 30
Thr Met Thr Asp Ala Gly Met Pro Val Pro Pro Gly Phe Val Val Thr
35 40 45
Thr Ala Ser Phe Asp Glu Phe Ile Arg Glu Ala Gly Val Ala Glu His
50 55 60
Ile Asp Lys Phe Leu Asn Asp Leu Asp Ala Glu Asp Val Lys Glu Val
65 70 75 80
Asp Arg Val Ser Ala Ile Ile Arg Asp Glu Leu Cys Ser Leu Asp Val
85 90 95
Pro Glu Asn Ala Arg Phe Ala Val His Gln Ala Tyr Arg Asp Leu Met
100 105 110
Glu Arg Cys Gly Gly Asp Val Pro Val Ala Val Arg Ser Ser Ala Thr
115 120 125
Ala Glu Asp Leu Pro Asp Ala Ser Phe Ala Gly Gln Gln Asp Thr Tyr
130 135 140
Leu Trp Gln Val Gly Leu Ser Ala Val Thr Glu His Ile Arg Lys Cys
145 150 155 160
Trp Ala Ser Leu Phe Thr Ser Arg Ala Ile Ile Tyr Arg Leu Lys Asn
165 170 175
Asn Ile Pro Asn Glu Gly Leu Ser Met Ala Val Val Val Gln Lys Met
180 185 190
Val Asn Ser Arg Val Ala Gly Val Ala Ile Thr Met Asn Pro Ser Asn
195 200 205
Gly Asp Arg Ser Lys Ile Thr Ile Asp Ser Ser Trp Gly Val Gly Glu
210 215 220
Met Val Val Ser Gly Glu Val Thr Pro Asp Asn Ile Leu Leu Asp Lys
225 230 235 240
Ile Thr Leu Gln Val Val Ser Glu His Ile Gly Ser Lys His Ala Glu
245 250 255
Leu Ile Pro Asp Ala Thr Ser Gly Ser Leu Val Glu Lys Pro Val Asp
260 265 270
Glu Glu Arg Ala Asn Arg Arg Ser Leu Thr Asp Glu Glu Met Leu Ala
275 280 285
Val Ala Gln Met Ala Lys Arg Ala Glu Lys His Tyr Lys Cys Pro Gln
290 295 300
Asp Ile Glu Trp Ala Leu Asp Ala Asp Leu Pro Asp Gly Glu Asn Leu
305 310 315 320
Leu Leu Leu Gln Ser Arg Pro Glu Thr Ile His Ser Asn Gly Val Lys
325 330 335
Lys Glu Thr Pro Thr Pro Gln Ala Ala Lys Thr Ile Gly Thr Phe Asp
340 345 350
Phe Ser Ser Ile Thr Val Ala Met Thr Gly Thr Lys
355 360
<210> 99
<211> 3926
<212> DNA
<213> Saccharomyces cerevisiae
<400> 99
ttggtcatgc ttatgaagct atactaaccc cacaagcatt acatggtgaa tgtgtgtcca 60
ttggtatggt taaagaggcg gaattatccc gttatttcgg tattctctcc cctacccaag 120
ttgcacgtct atccaagatt ttggttgcct acgggttgcc tgtttcgcct gatgagaaat 180
ggtttaaaga gctaacctta cataagaaaa caccattgga tatcttattg aagaaaatga 240
gtattgacaa gaaaaacgag ggttccaaaa agaaggtggt cattttagaa agtattggta 300
agtgctatgg tgactccgct caatttgtta gcgatgaaga cctgagattt attctaacag 360
atgaaaccct cgtttacccc ttcaaggaca tccctgctga tcaacagaaa gttgttatcc 420
cccctggttc taagtccatc tccaatcgtg ctttaattct tgctgccctc ggtgaaggtc 480
aatgtaaaat caagaactta ttacattctg atgatactaa acatatgtta accgctgttc 540
atgaattgaa aggtgctacg atatcatggg aagataatgg tgagacggta gtggtggaag 600
gacatggtgg ttccacattg tcagcttgtg ctgacccctt atatctaggt aatgcaggta 660
ctgcatctag atttttgact tccttggctg ccttggtcaa ttctacttca agccaaaagt 720
atatcgtttt aactggtaac gcaagaatgc aacaaagacc aattgctcct ttggtcgatt 780
ctttgcgtgc taatggtact aaaattgagt acttgaataa tgaaggttcc ctgccaatca 840
aagtttatac tgattcggta ttcaaaggtg gtagaattga attagctgct acagtttctt 900
ctcagtacgt atcctctatc ttgatgtgtg ccccatacgc tgaagaacct gtaactttgg 960
ctcttgttgg tggtaagcca atctctaaat tgtacgtcga tatgacaata aaaatgatgg 1020
aaaaattcgg tatcaatgtt gaaacttcta ctacagaacc ttacacttat tatattccaa 1080
agggacatta tattaaccca tcagaatacg tcattgaaag tgatgcctca agtgctacat 1140
acccattggc cttcgccgca atgactggta ctaccgtaac ggttccaaac attggttttg 1200
agtcgttaca aggtgatgcc agatttgcaa gagatgtctt gaaacctatg ggttgtaaaa 1260
taactcaaac ggcaacttca actactgttt cgggtcctcc tgtaggtact ttaaagccat 1320
taaaacatgt tgatatggag ccaatgactg atgcgttctt aactgcatgt gttgttgccg 1380
ctatttcgca cgacagtgat ccaaattctg caaatacaac caccattgaa ggtattgcaa 1440
accagcgtgt caaagagtgt aacagaattt tggccatggc tacagagctc gccaaatttg 1500
gcgtcaaaac tacagaatta ccagatggta ttcaagtcca tggtttaaac tcgataaaag 1560
atttgaaggt tccttccgac tcttctggac ctgtcggtgt atgcacatat gatgatcatc 1620
gtgtggccat gagtttctcg cttcttgcag gaatggtaaa ttctcaaaat gaacgtgacg 1680
aagttgctaa tcctgtaaga atacttgaaa gacattgtac tggtaaaacc tggcctggct 1740
ggtgggatgt gttacattcc gaactaggtg ccaaattaga tggtgcagaa cctttagagt 1800
gcacatccaa aaagaactca aagaaaagcg ttgtcattat tggcatgaga gcagctggca 1860
aaactactat aagtaaatgg tgcgcatccg ctctgggtta caaattagtt gacctagacg 1920
agctgtttga gcaacagcat aacaatcaaa gtgttaaaca atttgttgtg gagaacggtt 1980
gggagaagtt ccgtgaggaa gaaacaagaa ttttcaagga agttattcaa aattacggcg 2040
atgatggata tgttttctca acaggtggcg gtattgttga aagcgctgag tctagaaaag 2100
ccttaaaaga ttttgcctca tcaggtggat acgttttaca cttacatagg gatattgagg 2160
agacaattgt ctttttacaa agtgatcctt caagacctgc ctatgtggaa gaaattcgtg 2220
aagtttggaa cagaagggag gggtggtata aagaatgctc aaatttctct ttctttgctc 2280
ctcattgctc cgcagaagct gagttccaag ctctaagaag atcgtttagt aagtacattg 2340
caaccattac aggtgtcaga gaaatagaaa ttccaagcgg aagatctgcc tttgtgtgtt 2400
taacctttga tgacttaact gaacaaactg agaatttgac tccaatctgt tatggttgtg 2460
aggctgtaga ggtcagagta gaccatttgg ctaattactc tgctgatttc gtgagtaaac 2520
agttatctat attgcgtaaa gccactgaca gtattcctat catttttact gtgcgaacca 2580
tgaagcaagg tggcaacttt cctgatgaag agttcaaaac cttgagagag ctatacgata 2640
ttgccttgaa gaatggtgtt gaattccttg acttagaact aactttacct actgatatcc 2700
aatatgaggt tattaacaaa aggggcaaca ccaagatcat tggttcccat catgacttcc 2760
aaggattata ctcctgggac gacgctgaat gggaaaacag attcaatcaa gcgttaactc 2820
ttgatgtgga tgttgtaaaa tttgtgggta cggctgttaa tttcgaagat aatttgagac 2880
tggaacactt tagggataca cacaagaata agcctttaat tgcagttaat atgacttcta 2940
aaggtagcat ttctcgtgtt ttgaataatg ttttaacacc tgtgacatca gatttattgc 3000
ctaactccgc tgcccctggc caattgacag tagcacaaat taacaagatg tatacatcta 3060
tgggaggtat cgagcctaag gaactgtttg ttgttggaaa gccaattggc cactctagat 3120
cgccaatttt acataacact ggctatgaaa ttttaggttt acctcacaag ttcgataaat 3180
ttgaaactga atccgcacaa ttggtgaaag aaaaactttt ggacggaaac aagaactttg 3240
gcggtgctgc agtcacaatt cctctgaaat tagatataat gcagtacatg gatgaattga 3300
ctgatgctgc taaagttatt ggtgctgtaa acacagttat accattgggt aacaagaagt 3360
ttaagggtga taataccgac tggttaggta tccgtaatgc cttaattaac aatggcgttc 3420
ccgaatatgt tggtcatacc gctggtttgg ttatcggtgc aggtggcact tctagagccg 3480
ccctttacgc cttgcacagt ttaggttgca aaaagatctt cataatcaac aggacaactt 3540
cgaaattgaa gccattaata gagtcacttc catctgaatt caacattatt ggaatagagt 3600
ccactaaatc tatagaagag attaaggaac acgttggcgt tgctgtcagc tgtgtaccag 3660
ccgacaaacc attagatgac gaacttttaa gtaagctgga gagattcctt gtgaaaggtg 3720
cccatgctgc ttttgtacca accttattgg aagccgcata caaaccaagc gttactcccg 3780
ttatgacaat ttcacaagac aaatatcaat ggcacgttgt ccctggatca caaatgttag 3840
tacaccaagg tgtagctcag tttgaaaagt ggacaggatt caagggccct ttcaaggcca 3900
tttttgatgc cgttacgaaa gagtag 3926
<210> 100
<211> 2247
<212> DNA
<213> Anabaena variabilis ATCC29413
<400> 100
atgagtatcg tccaagcaaa gtttgaagct aaggaaacat cttttcatgt agaaggttac 60
gaaaagattg agtatgattt ggtgtatgta gatggtattt ttgaaatcca gaattctgca 120
ctagcagatg tatatcaagg ttttggacga tgcttggcga ttgtagatgc taacgtcagt 180
cggttgtatg gtaatcaaat tcaggcatat ttccagtatt atggtataga actgaggcta 240
tttcctatta ccattactga accagataag actattcaaa ctttcgagag agttatagat 300
gtctttgcag atttcaaatt agtccgcaaa gaaccagtat tagtcgtggg tggcggttta 360
attacagatg ttgtcggctt tgcttgttct acatatcgtc gcagcagcaa ttacatccgc 420
attcctacta cattgattgg attaattgat gccagtgtag caattaaggt agcagttaat 480
catcgcaaac tgaaaaaccg tttgggtgct tatcatgctt ctcgcaaagt atttttagat 540
ttctccttgt tgcgtactct ccctacagac caagtacgta acgggatggc ggaattggta 600
aaaatcgctg tagtagcgca tcaagaagtt tttgaattgt tggagaagta cggcgaagaa 660
ttactacgta ctcattttgg caatatagat gcaactccag agattaaaga aatagcccat 720
cgtttgactt acaaagctat ccataagatg ttggaattgg aagttcccaa cctgcatgag 780
ttagacctag atagggtgat tgcttacggt cacacttgga gtcccacctt ggaacttgcg 840
cctcgtctac ccatgttcca cggacacgcc gttaatgtag atatggcttt ctcggcaacg 900
atcgccgccc gtagaggata tattacaatt gcagaacgcg atcgtatttt aggattaatg 960
agtcgcgttg gtctatccct cgaccatccc atgttggata tagatatttt gtggcgtggt 1020
actgaatcta tcacattaac tcgtgatggt ttgttaagag ctgctatgcc aaaacccatt 1080
ggtgattgtg tcttcgtcaa tgacctgaca agagaagaat tagcagccgc attagctgac 1140
cacaaagaac tttgtaccag ttatccccgt ggtggtgaag gtgtggatgt gtatcccgtt 1200
tatcaaaaag aattaatcgg gagtgttaaa taatgacttt tttgaattca aaatgcaaaa 1260
tactccacgg atacactgcg cgagcgcggt agcatttctg ttcgcggagc gtcccgtagg 1320
gaaagagaag gctacgcaaa taatcggaca ctaattgtct ttaattttga attttgaatt 1380
ttgaattttg aattggagcg aagcgacttg acaaatgtga ttgtccaacc aacagctaga 1440
cctgttacac cattgggaat tttaaccaag cagttagaag ccatagtcca agaggttaag 1500
caacatccag atttacctgg ggaattgata gcaaacatcc atcaggcttg gcgtttagcc 1560
gcaggtatag acccttattt ggaagaatgc accactccag aatctcctga actcgctgca 1620
ttggcaaaaa ccacagccac cgaagcctgg ggagaacact tccacggagg tacaaccgtc 1680
cgtcctctag aacaagagat gctttctggt catatcgaag gacaaacctt aaagatgttt 1740
gttcacatga ccaaagctaa aaaagtctta gaaattggga tgtttaccgg ttattcggcg 1800
ctggcgatgg cggaagcatt accagaggat ggactgcttg tggcttgtga agttgaccct 1860
tacgcggcgg aaattggaca gaaagccttt caacaatctc cccacggtgg aaagattcgt 1920
gtggaattgg atgcagcctt agcaactctt gataagttag cagaagctgg ggagtctttt 1980
gacttggtat ttatcgacgc agataaaaaa gagtatgtag cctattttca caagttgcta 2040
ggtagcagtt tgttagcacc agatggcttt atttgtgtag ataacacctt attacaaggg 2100
gaagtttatc taccagcaga ggaacgtagc gtcaatggtg aagcgatcgc gcaatttaat 2160
catacagtag ctatagaccc ccgtgtagaa caggttttgt tgccgttgcg agatggttta 2220
acaattatcc gcagaataca accttaa 2247
<210> 101
<211> 3532
<212> DNA
<213> Anabaena variabilis ATCC29413
<400> 101
tccagaattc tgcactagca gatgtatatc aaggttttgg acgatgcttg gcgattgtag 60
atgctaacgt cagtcggttg tatggtaatc aaattcaggc atatttccag tattatggta 120
tagaactgag gctatttcct attaccatta ctgaaccaga taagactatt caaactttcg 180
agagagttat agatgtcttt gcagatttca aattagtccg caaagaacca gtattagtcg 240
tgggtggcgg tttaattaca gatgttgtcg gctttgcttg ttctacatat cgtcgcagca 300
gcaattacat ccgcattcct actacattga ttggattaat tgatgccagt gtagcaatta 360
aggtagcagt taatcatcgc aaactgaaaa accgtttggg tgcttatcat gcttctcgca 420
aagtattttt agatttctcc ttgttgcgta ctctccctac agaccaagta cgtaacggga 480
tggcggaatt ggtaaaaatc gctgtagtag cgcatcaaga agtttttgaa ttgttggaga 540
agtacggcga agaattacta cgtactcatt ttggcaatat agatgcaact ccagagatta 600
aagaaatagc ccatcgtttg acttacaaag ctatccataa gatgttggaa ttggaagttc 660
ccaacctgca tgagttagac ctagataggg tgattgctta cggtcacact tggagtccca 720
ccttggaact tgcgcctcgt ctacccatgt tccacggaca cgccgttaat gtagatatgg 780
ctttctcggc aacgatcgcc gcccgtagag gatatattac aattgcagaa cgcgatcgta 840
ttttaggatt aatgagtcgc gttggtctat ccctcgacca tcccatgttg gatatagata 900
ttttgtggcg tggtactgaa tctatcacat taactcgtga tggtttgtta agagctgcta 960
tgccaaaacc cattggtgat tgtgtcttcg tcaatgacct gacaagagaa gaattagcag 1020
ccgcattagc tgaccacaaa gaactttgta ccagttatcc ccgtggtggt gaaggtgtgg 1080
atgtgtatcc cgtttatcaa aaagaattaa tcgggagtgt taaataatga cttttttgaa 1140
ttcaaaatgc aaaatactcc acggatacac tgcgcgagcg cggtagcatt tctgttcgcg 1200
gagcgtcccg tagggaaaga gaaggctacg caaataatcg gacactaatt gtctttaatt 1260
ttgaattttg aattttgaat tttgaattgg agcgaagcga cttgacaaat gtgattgtcc 1320
aaccaacagc tagacctgtt acaccattgg gaattttaac caagcagtta gaagccatag 1380
tccaagaggt taagcaacat ccagatttac ctggggaatt gatagcaaac atccatcagg 1440
cttggcgttt agccgcaggt atagaccctt atttggaaga atgcaccact ccagaatctc 1500
ctgaactcgc tgcattggca aaaaccacag ccaccgaagc ctggggagaa cacttccacg 1560
gaggtacaac cgtccgtcct ctagaacaag agatgctttc tggtcatatc gaaggacaaa 1620
ccttaaagat gtttgttcac atgaccaaag ctaaaaaagt cttagaaatt gggatgttta 1680
ccggttattc ggcgctggcg atggcggaag cattaccaga ggatggactg cttgtggctt 1740
gtgaagttga cccttacgcg gcggaaattg gacagaaagc ctttcaacaa tctccccacg 1800
gtggaaagat tcgtgtggaa ttggatgcag ccttagcaac tcttgataag ttagcagaag 1860
ctggggagtc ttttgacttg gtatttatcg acgcagataa aaaagagtat gtagcctatt 1920
ttcacaagtt gctaggtagc agtttgttag caccagatgg ctttatttgt gtagataaca 1980
ccttattaca aggggaagtt tatctaccag cagaggaacg tagcgtcaat ggtgaagcga 2040
tcgcgcaatt taatcataca gtagctatag acccccgtgt agaacaggtt ttgttgccgt 2100
tgcgagatgg tttaacaatt atccgcagaa tacaacctta attgtccaat cgactatggc 2160
acaatccctt cccctttctt ccgcacctgc tacaccgtct cttccttccc agacgaaaat 2220
agccgcaatt atccaaaata tctgcacttt ggctttgtta ttactagcat tgcccattaa 2280
tgccaccatt gtttttatat ccttgttagt cttccgaccg caaaaggtca aagcagcaaa 2340
cccccaaacc attcttatca gtggcggtaa gatgaccaaa gctttacaac tagcaaggtc 2400
attccacgcg gctggacata gagttgtctt ggtggaaacc cataaatact ggttgactgg 2460
tcatcgtttt tcccaagcag tggataagtt ttacacagtc cccgcacccc aggacaatcc 2520
ccaagcttac attcaggctt tggtagatat cgtcaaacaa gaaaacatcg atgtttatat 2580
tcccgtcacc agtccagtgg gtagctacta cgactcatta gccaaaccag agttatccca 2640
ttattgcgaa gtgtttcact ttgacgcaga tattacccaa atgttggatg ataaatttgc 2700
gttgacacaa aaagcgcgat cgcttggttt atcagtaccc aaatccttta aaattacctc 2760
accagaacaa gtcatcaact tcgatttttc tggagagaca cgtaaataca tcctcaaaag 2820
cattccctac gactcagtgc ggcggttgga cttaaccaaa ctcccctgtg ctactccaga 2880
ggaaacagca gcattcgtca gaagtttgcc aattactccc gaaaaaccgt ggattatgca 2940
ggaatttatc cccggtaagg aattctgcac ccatagcacc gttcggaatg gggaactcag 3000
actgcattgc tgttgcgaat cttcagcctt ccaagttaat tatgagaatg taaataaccc 3060
gcaaattacc gaatgggtac agcattttgt caaggaactg aaactgacag gacagatttc 3120
ctttgacttt atccaagccg aagacggaac agtttacgcc atcgagtgta acccccgcac 3180
acattcagca attaccacat tttacgacca cccccaggta gcagaagcgt acttgagtca 3240
agcaccgacg actgaaacca tacaaccact aacgacaagc aagcctacct attggactta 3300
tcacgaagtt tggcgtttaa ctggtatccg ttctttcacc cagttgcaaa gatggctggg 3360
gaatatttgg cgcgggactg atgcgattta tcagccagat gaccccttac cgtttttgat 3420
ggtacatcat tggcaaattc ccctactgtt attgaataat ttgcgtcgtc ttaaaggttg 3480
gacgcggata gatttcaata ttgggaagtt ggtggaattg gggggagatt ag 3532
<210> 102
<211> 1233
<212> DNA
<213> Anabaena variabilis ATCC29413
<400> 102
atgagtatcg tccaagcaaa gtttgaagct aaggaaacat cttttcatgt agaaggttac 60
gaaaagattg agtatgattt ggtgtatgta gatggtattt ttgaaatcca gaattctgca 120
ctagcagatg tatatcaagg ttttggacga tgcttggcga ttgtagatgc taacgtcagt 180
cggttgtatg gtaatcaaat tcaggcatat ttccagtatt atggtataga actgaggcta 240
tttcctatta ccattactga accagataag actattcaaa ctttcgagag agttatagat 300
gtctttgcag atttcaaatt agtccgcaaa gaaccagtat tagtcgtggg tggcggttta 360
attacagatg ttgtcggctt tgcttgttct acatatcgtc gcagcagcaa ttacatccgc 420
attcctacta cattgattgg attaattgat gccagtgtag caattaaggt agcagttaat 480
catcgcaaac tgaaaaaccg tttgggtgct tatcatgctt ctcgcaaagt atttttagat 540
ttctccttgt tgcgtactct ccctacagac caagtacgta acgggatggc ggaattggta 600
aaaatcgctg tagtagcgca tcaagaagtt tttgaattgt tggagaagta cggcgaagaa 660
ttactacgta ctcattttgg caatatagat gcaactccag agattaaaga aatagcccat 720
cgtttgactt acaaagctat ccataagatg ttggaattgg aagttcccaa cctgcatgag 780
ttagacctag atagggtgat tgcttacggt cacacttgga gtcccacctt ggaacttgcg 840
cctcgtctac ccatgttcca cggacacgcc gttaatgtag atatggcttt ctcggcaacg 900
atcgccgccc gtagaggata tattacaatt gcagaacgcg atcgtatttt aggattaatg 960
agtcgcgttg gtctatccct cgaccatccc atgttggata tagatatttt gtggcgtggt 1020
actgaatcta tcacattaac tcgtgatggt ttgttaagag ctgctatgcc aaaacccatt 1080
ggtgattgtg tcttcgtcaa tgacctgaca agagaagaat tagcagccgc attagctgac 1140
cacaaagaac tttgtaccag ttatccccgt ggtggtgaag gtgtggatgt gtatcccgtt 1200
tatcaaaaag aattaatcgg gagtgttaaa taa 1233
<210> 103
<211> 840
<212> DNA
<213> Anabaena variabilis ATCC29413
<400> 103
ttgacaaatg tgattgtcca accaacagct agacctgtta caccattggg aattttaacc 60
aagcagttag aagccatagt ccaagaggtt aagcaacatc cagatttacc tggggaattg 120
atagcaaaca tccatcaggc ttggcgttta gccgcaggta tagaccctta tttggaagaa 180
tgcaccactc cagaatctcc tgaactcgct gcattggcaa aaaccacagc caccgaagcc 240
tggggagaac acttccacgg aggtacaacc gtccgtcctc tagaacaaga gatgctttct 300
ggtcatatcg aaggacaaac cttaaagatg tttgttcaca tgaccaaagc taaaaaagtc 360
ttagaaattg ggatgtttac cggttattcg gcgctggcga tggcggaagc attaccagag 420
gatggactgc ttgtggcttg tgaagttgac ccttacgcgg cggaaattgg acagaaagcc 480
tttcaacaat ctccccacgg tggaaagatt cgtgtggaat tggatgcagc cttagcaact 540
cttgataagt tagcagaagc tggggagtct tttgacttgg tatttatcga cgcagataaa 600
aaagagtatg tagcctattt tcacaagttg ctaggtagca gtttgttagc accagatggc 660
tttatttgtg tagataacac cttattacaa ggggaagttt atctaccagc agaggaacgt 720
agcgtcaatg gtgaagcgat cgcgcaattt aatcatacag tagctataga cccccgtgta 780
gaacaggttt tgttgccgtt gcgagatggt ttaacaatta tccgcagaat acaaccttaa 840
840
<210> 104
<211> 1377
<212> DNA
<213> Anabaena variabilis ATCC29413
<400> 104
atggcacaat cccttcccct ttcttccgca cctgctacac cgtctcttcc ttcccagacg 60
aaaatagccg caattatcca aaatatctgc actttggctt tgttattact agcattgccc 120
attaatgcca ccattgtttt tatatccttg ttagtcttcc gaccgcaaaa ggtcaaagca 180
gcaaaccccc aaaccattct tatcagtggc ggtaagatga ccaaagcttt acaactagca 240
aggtcattcc acgcggctgg acatagagtt gtcttggtgg aaacccataa atactggttg 300
actggtcatc gtttttccca agcagtggat aagttttaca cagtccccgc accccaggac 360
aatccccaag cttacattca ggctttggta gatatcgtca aacaagaaaa catcgatgtt 420
tatattcccg tcaccagtcc agtgggtagc tactacgact cattagccaa accagagtta 480
tcccattatt gcgaagtgtt tcactttgac gcagatatta cccaaatgtt ggatgataaa 540
tttgcgttga cacaaaaagc gcgatcgctt ggtttatcag tacccaaatc ctttaaaatt 600
acctcaccag aacaagtcat caacttcgat ttttctggag agacacgtaa atacatcctc 660
aaaagcattc cctacgactc agtgcggcgg ttggacttaa ccaaactccc ctgtgctact 720
ccagaggaaa cagcagcatt cgtcagaagt ttgccaatta ctcccgaaaa accgtggatt 780
atgcaggaat ttatccccgg taaggaattc tgcacccata gcaccgttcg gaatggggaa 840
ctcagactgc attgctgttg cgaatcttca gccttccaag ttaattatga gaatgtaaat 900
aacccgcaaa ttaccgaatg ggtacagcat tttgtcaagg aactgaaact gacaggacag 960
atttcctttg actttatcca agccgaagac ggaacagttt acgccatcga gtgtaacccc 1020
cgcacacatt cagcaattac cacattttac gaccaccccc aggtagcaga agcgtacttg 1080
agtcaagcac cgacgactga aaccatacaa ccactaacga caagcaagcc tacctattgg 1140
acttatcacg aagtttggcg tttaactggt atccgttctt tcacccagtt gcaaagatgg 1200
ctggggaata tttggcgcgg gactgatgcg atttatcagc cagatgaccc cttaccgttt 1260
ttgatggtac atcattggca aattccccta ctgttattga ataatttgcg tcgtcttaaa 1320
ggttggacgc ggatagattt caatattggg aagttggtgg aattgggggg agattag 1377
<210> 105
<211> 2358
<212> DNA
<213> Anabaena variabilis ATCC29413
<400> 105
gttcctattg accctgaata tcctcaagaa cgcatagctt atatgctaga agattctcag 60
gtgaaggtac tactaactca agaaaaatta ctcaatcaaa ttccccacca tcaagcacaa 120
actatctgtg tagataggga atgggagaaa atttccacac aagctaatac caatcccaaa 180
agtaatataa aaacggataa tcttgcttat gtaatttaca cctctggttc cactggtaaa 240
ccaaaaggtg caatgaacac ccacaaaggt atctgtaatc gcttattgtg gatgcaggaa 300
gcttatcaaa tcgattccac agatagcatt ttacaaaaaa ccccctttag ttttgatgtt 360
tccgtttggg agttcttttg gactttatta actggcgcac gtttggtaat agccaaacca 420
ggcggacata aagatagtgc ttacctcatc gatttaatta ctcaagaaca aatcactacg 480
ttgcattttg tcccctcaat gctgcaagtg tttttacaaa atcgccatgt aagcaaatgc 540
agctctctaa aaagagttat ttgtagcggt gaagctttat ctatagattt acaaaataga 600
tttttccagc atttgcaatg tgaattacat aacctctatg gcccgacaga agcagcaatt 660
gatgtcacat tttggcaatg tagaaaagat agtaatttaa agagtgtacc tattggtcgt 720
cccattgcta atactcaaat ttatattctt gatgccgatt tacaaccagt aaatattggt 780
gtcactggtg aaatttatat tggtggtgta ggggttgctc gtggttattt gaataaagaa 840
gaattgacca aagaaaaatt tattattaat ccctttccca attctgagtt taagcgactt 900
tataaaacag gtgatttagc tcgttattta cccgatggaa atattgaata tcttggtaga 960
acagattatc aagtaaaaat tcggggttat agaattgaaa ttggcgagat tgaaaatgtt 1020
ttatcttcac acccacaagt cagagaagct gtagtcatag cgcgggatga taacgctcaa 1080
gaaaaacaaa tcatcgctta tattacctat aactccatca aacctcagct tgataatctg 1140
cgtgatttcc taaaagcaag gctacctgat tttatgattc cagccgcttt tgtgatgctg 1200
gagcatcttc ctttaactcc cagtggtaaa gtagaccgta aggcattacc taagcctgat 1260
ttatttaatt atagtgaaca taattcctat gtagcgcctc ggaatgaagt tgaagaaaaa 1320
ttagtacaaa tctggtcgaa tattctgcat ttacctaaag taggtgtgac agaaaacttt 1380
ttcgctattg gtggtaattc cctcaaagct ctacatttaa tttctcaaat tgaagagtta 1440
tttgctaaag agatatcctt agcaacactt ttaacaaatc cagtaattgc agatttagcc 1500
aaggttattc aagcaaacaa ccaaatccat aattcacccc tagttccaat tcaaccacaa 1560
ggtaagcagc agcctttctt ttgtatacat cctgctggtg gtcatgtttt atgctatttt 1620
aaactcgcac aatatatagg aactgaccaa ccattttatg gcttacaagc tcaaggattt 1680
tatggagatg aagcaccctt gacgcgagtt gaagatatgg ctagtctcta cgtcaaaact 1740
attagagaat ttcaacccca agggccttat cgtgtcgggg ggtggtcatt tggtggagtc 1800
gtagcttatg aagtagcaca gcagttacat agacaaggac aagaagtatc tttactagca 1860
atattagatt cttacgtacc gattctgctg gataaacaaa aacccattga tgacgtttat 1920
ttagttggtg ttctctccag agtttttggc ggtatgtttg gtcaagataa tctagtcaca 1980
cctgaagaaa tagaaaattt aactgtagaa gaaaaaatta attacatcat tgataaagca 2040
cggagcgcta gaatattccc gcctggtgta gaacgtcaaa ataatcgccg tattcttgat 2100
gttttggtgg gaactttaaa agcaacttat tcctatataa gacaaccata tccaggaaaa 2160
gtcactgtat ttcgagccag ggaaaaacat attatggctc ctgacccgac cttagtttgg 2220
gtagaattat tttctgtaat ggcggctcaa gaaattaaga ttattgatgt ccctggaaac 2280
cattattcgt ttgttctaga accccatgta caggttttag cacagcgttt acaagattgt 2340
ctggaaaata attcataa 2358
<210> 106
<211> 1233
<212> DNA
<213> Nostoc punctiforme ATCC29133
<400> 106
atgagtaatg ttcaagcatc gtttgaagca acggaagctg aattccgcgt ggaaggttac 60
gaaaaaattg agtttagtct tgtctatgta aatggtgcat ttgatatcag taacagagaa 120
attgcagaca gctatgagaa gtttggccgt tgtctgactg tgattgatgc taatgtcaac 180
agattatatg gcaagcaaat caagtcatat tttagacact atggtattga tctgaccgta 240
gttcccattg tgattactga gcctactaaa acccttgcaa cctttgagaa aattgttgat 300
gctttttctg actttggttt aatccgcaag gaaccagtat tagtagtggg tggtggttta 360
accactgatg tagctgggtt tgcgtgtgct gcttaccgtc gtaagagtaa ctatattcgg 420
gttccgacaa cgctgattgg tctgattgat gcaggtgtag cgattaaggt tgcagtcaac 480
catcgcaagt taaaaaatcg cttgggtgca tatcatgctc ctttgaaagt catcctcgat 540
ttctccttct tgcaaacatt accaacggct caagttcgta atgggatggc agagttggtc 600
aaaattgctg ttgtggcgaa ctctgaagtc tttgaattgt tgtatgaata tggcgaagag 660
ttgctttcca ctcactttgg atatgtgaat ggtacaaagg aactgaaagc gatcgcacat 720
aaactcaatt acgaggcaat aaaaactatg ctggagttgg aaactccaaa cttgcatgag 780
ttagacctcg atcgcgtcat tgcctacggt cacacttgga gtccgacctt agaattagct 840
ccgatgatac cgttgtttca cggtcatgcc gtcaatatag acatggcttt gtctgcaact 900
attgcggcaa gacgtggcta cattacatca ggagaacgcg atcgcatttt gagcttgatg 960
agtcgtatag gtttatcaat cgatcatcct ctactagatg gcgatttgct ctggtatgct 1020
acccaatcta ttagcttgac gcgagacggg aaacaacgcg cagctatgcc taaacccatt 1080
ggtgagtgct tctttgtcaa cgatttcacc cgtgaagaac tagatgcagc tttagctgaa 1140
cacaaacgtc tgtgtgctac ataccctcgt ggtggagatg gcattgacgc ttacatagaa 1200
actcaagaag aatccaaact attgggagtg tga 1233
<210> 107
<211> 834
<212> DNA
<213> Nostoc punctiforme ATCC29133
<400> 107
atgaccagta ttttaggacg agataccgca agaccaataa cgccacatag cattctggta 60
gcacagctac aaaaaaccct cagaatggca gaggaaagta atattccttc agagatactg 120
acttctctgc gccaagggtt gcaattagca gcaggtttag atccctatct ggatgattgc 180
actacccctg aatcgaccgc attgacagca ctagcgcaga agacaagcat tgaagactgg 240
agtaaacgct tcagtgatgg tgaaacagtg cgtcaattag agcaagaaat gctctcagga 300
catcttgaag gacaaacact aaagatgttt gtgcatatca ctaaggctaa aagcatccta 360
gaagtgggaa tgttcacagg atattcagct ttggcaatgg cagaggcgtt accagatgat 420
gggcgactga ttgcttgtga agtagactcc tatgtggccg agtttgctca aacttgcttt 480
caagagtctc cccacggccg caagattgtt gtagaagtgg cacctgcact agagacgctg 540
cacaagctgg tggctaaaaa agaatccttt gatctgatct tcattgatgc ggataaaaag 600
gagtatatag aatacttcca aattatcttg gatagccatt tactagctcc cgacggatta 660
atctgtgtag ataatacttt gttgcaagga caagtttacc tgccatcaga acagcgtaca 720
gccaatggtg aagcgatcgc tcaattcaac cgcattgtcg ccgcagatcc tcgtgtagag 780
caagttctgt tacccatacg agatggtata accctgatta gacgcttggt ataa 834
<210> 108
<211> 1086
<212> DNA
<213> Nostoc punctiforme ATCC29133
<400> 108
tactggttat cagggcatag attctcaaat tctgtgagtc gtttttatac agttcctgca 60
ccacaagacg acccagaagg ctatacccaa gcgctattgg aaattgtcaa acgagagaag 120
attgacgttt atgtacccgt atgcagccct gtagctagtt attacgactc tttggcaaag 180
tctgcactat cagaatattg tgaggttttt cactttgatg ctgatataac caagatgctg 240
gatgataaat ttgcctttac cgatcgggcg cgatcgcttg gtttatcagc cccgaaatct 300
tttaaaatta ccgatcctga acaagttatc aacttcgatt ttagtaaaga gacgcgcaaa 360
tatattctta agagtatttc ttacgactca gttcgccgct taaatttaac caaacttcct 420
tgtgataccc cagaagagac agcagcgttt gtcaagagtt tacccatcag cccagaaaaa 480
ccttggatta tgcaagaatt tattcctggg aaagaattat gcacccatag cacagtccga 540
gacggcgaat taaggttgca ttgctgttca aattcttcag cgtttcagat taactatgaa 600
aatgtcgaaa atccccaaat tcaagaatgg gtacaacatt tcgtcaaaag tttacggctg 660
actggacaaa tatctcttga ctttatccaa gctgaagatg gtacagctta tgccattgaa 720
tgtaatcctc gcacccattc ggcgatcaca atgttctaca atcacccagg tgttgcagaa 780
gcctatcttg gtaaaactcc tctagctgca cctttggaac ctcttgcaga tagcaagccc 840
acttactgga tatatcacga aatctggcga ttgactggga ttcgctctgg acaacaatta 900
caaacttggt ttgggagatt agtcagaggt acagatgcca tttatcgcct ggacgatccg 960
ataccatttt taactttgca ccattggcag attactttac ttttgctaca aaatttgcaa 1020
cgactcaaag gttgggtaaa gatcgatttt aatatcggta aactcgtgga attagggggc 1080
gactaa 1086
<210> 109
<211> 1047
<212> DNA
<213> Nostoc punctiforme ATCC29133
<400> 109
atgccagtac ttaatatcct tcatttagtt gggtctgcac acgataagtt ttactgtgat 60
ttatcacgtc tttatgccca agactgttta gctgcaacag cagatccatc gctttataac 120
tttcaaattg catatatcac acccgatcgg cagtggcgat ttcctgactc tctcagtcga 180
gaagatattg ctcttaccaa accgattcct gtgtttgatg ccatacaatt tctaacaggc 240
caaaacattg acatgatgtt accacaaatg ttttgtattc ctggaatgac tcagtaccgt 300
gccctattcg atctgctcaa gatcccttat ataggaaata ccccagatat tatggcgatc 360
gcggcccaca aagccagagc caaagcaatt gtcgaagcag caggggtaaa agtgcctcgt 420
ggagaattgc ttcgccaagg agatattcca acaattacac ctccagcagt cgtcaaacct 480
gtaagttctg acaactcttt aggagtagtc ttagttaaag atgtgactga atatgatgct 540
gccttaaaga aagcatttga atatgcttcg gaggtcatcg tagaagcatt catcgaactt 600
ggtcgagaag tcagatgcgg catcattgta aaagacggtg agctaatagg tttacccctt 660
gaagagtatc tggtagaccc acacgataaa cctatccgta actatgctga taaactccaa 720
caaactgacg atggcgactt gcatttgact gctaaagata atatcaaggc ttggatttta 780
gaccctaacg acccaatcac ccaaaaggtt cagcaagtgg ctaaaaggtg tcatcaggct 840
ttgggttgtc gccactacag tttatttgac ttccgaatcg atccaaaggg acaaccttgg 900
ttcttagaag ctggattata ttgttctttt gcccccaaaa gtgtgatttc ttctatggcg 960
aaagcagccg gaatccctct aaatgattta ttaataaccg ctattaatga aacattgggt 1020
agtaataaaa aggtgttaca aaattga 1047
<210> 110
<211> 1626
<212> DNA
<213> Saccharomyces cerevisiae CEN.PK-1D
<400> 110
aacaagccgg gctttacctt gtctgacaac tacacctatg ttttcttggg tgacggttgt 60
ttgcaagaag gtatttcttc agaagcttcc tccttggctg gtcatttgaa attgggtaac 120
ttgattgcca tctacgatga caacaagatc actatcgatg gtgctaccag tatctcattc 180
gatgaagatg ttgctaagag atacgaagcc tacggttggg aagttttgta cgtagaaaat 240
ggtaacgaag atctagccgg tattgccaag gctattgctc aagctaagtt atccaaggac 300
aaaccaactt tgatcaaaat gaccacaacc attggttacg gttccttgca tgccggctct 360
cactctgtgc acggtgcccc attgaaagca gatgatgtta aacaactaaa gagcaaattc 420
ggtttcaacc cagacaagtc ctttgttgtt ccacaagaag tttacgacca ctaccaaaag 480
acaattttaa agccaggtgt cgaagccaac aacaagtgga acaagttgtt cagcgaatac 540
caaaagaaat tcccagaatt aggtgctgaa ttggctagaa gattgagcgg ccaactaccc 600
gcaaattggg aatctaagtt gccaacttac accgccaagg actctgccgt ggccactaga 660
aaattatcag aaactgttct tgaggatgtt tacaatcaat tgccagagtt gattggtggt 720
tctgccgatt taacaccttc taacttgacc agatggaagg aagcccttga cttccaacct 780
ccttcttccg gttcaggtaa ctactctggt agatacatta ggtacggtat tagagaacac 840
gctatgggtg ccataatgaa cggtatttca gctttcggtg ccaactacaa accatacggt 900
ggtactttct tgaacttcgt ttcttatgct gctggtgccg ttagattgtc cgctttgtct 960
ggccacccag ttatttgggt tgctacacat gactctatcg gtgtcggtga agatggtcca 1020
acacatcaac ctattgaaac tttagcacac ttcagatccc taccaaacat tcaagtttgg 1080
agaccagctg atggtaacga agtttctgcc gcctacaaga actctttaga atccaagcat 1140
actccaagta tcattgcttt gtccagacaa aacttgccac aattggaagg tagctctatt 1200
gaaagcgctt ctaagggtgg ttacgtacta caagatgttg ctaacccaga tattatttta 1260
gtggctactg gttccgaagt gtctttgagt gttgaagctg ctaagacttt ggccgcaaag 1320
aacatcaagg ctcgtgttgt ttctctacca gatttcttca cttttgacaa acaaccccta 1380
gaatacagac tatcagtctt accagacaac gttccaatca tgtctgttga agttttggct 1440
accacatgtt ggggcaaata cgctcatcaa tccttcggta ttgacagatt tggtgcctcc 1500
ggtaaggcac cagaagtctt caagttcttc ggtttcaccc cagaaggtgt tgctgaaaga 1560
gctcaaaaga ccattgcatt ctataagggt gacaagctaa tttctccttt gaaaaaagct 1620
ttctaa 1626
<210> 111
<211> 1113
<212> DNA
<213> Saccharomyces cerevisiae CEN.PK-1D
<400> 111
atgagtgaat ctccaatgtt cgctgccaac ggcatgccaa aggtaaatca aggtgctgaa 60
gaagatgtca gaattttagg ttacgaccca ttagcttctc cagctctcct tcaagtgcaa 120
atcccagcca caccaacttc tttggaaact gccaagagag gtagaagaga agctatagat 180
attattaccg gtaaagacga cagagttctt gtcattgtcg gtccttgttc catccatgat 240
ctagaagccg ctcaagaata cgctttgaga ttaaagaaat tgtcagatga attaaaaggt 300
gatttatcca tcattatgag agcatacttg gagaagccaa gaacaaccgt cggctggaaa 360
ggtctaatta atgaccctga tgttaacaac actttcaaca tcaacaaggg tttgcaatcc 420
gctagacaat tgtttgtcaa cttgacaaat atcggtttgc caattggttc tgaaatgctt 480
gataccattt ctcctcaata cttggctgat ttggtctcct tcggtgccat tggtgccaga 540
accaccgaat ctcaactgca cagagaattg gcctccggtt tgtctttccc agttggtttc 600
aagaacggta ccgatggtac cttaaatgtt gctgtggatg cttgtcaagc cgctgctcat 660
tctcaccatt tcatgggtgt tactaagcat ggtgttgctg ctatcaccac tactaagggt 720
aacgaacact gcttcgttat tctaagaggt ggtaaaaagg gtaccaacta cgacgctaag 780
tccgttgcag aagctaaggc tcaattgcct gccggttcca acggtctaat gattgactac 840
tctcacggta actccaataa ggatttcaga aaccaaccaa aggtcaatga cgttgtttgt 900
gagcaaatcg ctaacggtga aaacgccatt accggtgtca tgattgaatc aaacatcaac 960
gaaggtaacc aaggcatccc agccgaaggt aaagccggct tgaaatatgg tgtttccatc 1020
actgatgctt gtataggttg ggaaactact gaagacgtct tgaggaaatt ggctgctgct 1080
gtcagacaaa gaagagaagt taacaagaaa tag 1113
<210> 112
<211> 1588
<212> PRT
<213> Saccharomyces cerevisiae
<400> 112
Met Val Gln Leu Ala Lys Val Pro Ile Leu Gly Asn Asp Ile Ile His
1 5 10 15
Val Gly Tyr Asn Ile His Asp His Leu Val Glu Thr Ile Ile Lys His
20 25 30
Cys Pro Ser Ser Thr Tyr Val Ile Cys Asn Asp Thr Asn Leu Ser Lys
35 40 45
Val Pro Tyr Tyr Gln Gln Leu Val Leu Glu Phe Lys Ala Ser Leu Pro
50 55 60
Glu Gly Ser Arg Leu Leu Thr Tyr Val Val Lys Pro Gly Glu Thr Ser
65 70 75 80
Lys Ser Arg Glu Thr Lys Ala Gln Leu Glu Asp Tyr Leu Leu Val Glu
85 90 95
Gly Cys Thr Arg Asp Thr Val Met Val Ala Ile Gly Gly Gly Val Ile
100 105 110
Gly Asp Met Ile Gly Phe Val Ala Ser Thr Phe Met Arg Gly Val Arg
115 120 125
Val Val Gln Val Pro Thr Ser Leu Leu Ala Met Val Asp Ser Ser Ile
130 135 140
Gly Gly Lys Thr Ala Ile Asp Thr Pro Leu Gly Lys Asn Phe Ile Gly
145 150 155 160
Ala Phe Trp Gln Pro Lys Phe Val Leu Val Asp Ile Lys Trp Leu Glu
165 170 175
Thr Leu Ala Lys Arg Glu Phe Ile Asn Gly Met Ala Glu Val Ile Lys
180 185 190
Thr Ala Cys Ile Trp Asn Ala Asp Glu Phe Thr Arg Leu Glu Ser Asn
195 200 205
Ala Ser Leu Phe Leu Asn Val Val Asn Gly Ala Lys Asn Val Lys Val
210 215 220
Thr Asn Gln Leu Thr Asn Glu Ile Asp Glu Ile Ser Asn Thr Asp Ile
225 230 235 240
Glu Ala Met Leu Asp His Thr Tyr Lys Leu Val Leu Glu Ser Ile Lys
245 250 255
Val Lys Ala Glu Val Val Ser Ser Asp Glu Arg Glu Ser Ser Leu Arg
260 265 270
Asn Leu Leu Asn Phe Gly His Ser Ile Gly His Ala Tyr Glu Ala Ile
275 280 285
Leu Thr Pro Gln Ala Leu His Gly Glu Cys Val Ser Ile Gly Met Val
290 295 300
Lys Glu Ala Glu Leu Ser Arg Tyr Phe Gly Ile Leu Ser Pro Thr Gln
305 310 315 320
Val Ala Arg Leu Ser Lys Ile Leu Val Ala Tyr Gly Leu Pro Val Ser
325 330 335
Pro Asp Glu Lys Trp Phe Lys Glu Leu Thr Leu His Lys Lys Thr Pro
340 345 350
Leu Asp Ile Leu Leu Lys Lys Met Ser Ile Asp Lys Lys Asn Glu Gly
355 360 365
Ser Lys Lys Lys Val Val Ile Leu Glu Ser Ile Gly Lys Cys Tyr Gly
370 375 380
Asp Ser Ala Gln Phe Val Ser Asp Glu Asp Leu Arg Phe Ile Leu Thr
385 390 395 400
Asp Glu Thr Leu Val Tyr Pro Phe Lys Asp Ile Pro Ala Asp Gln Gln
405 410 415
Lys Val Val Ile Pro Pro Gly Ser Lys Ser Ile Ser Asn Arg Ala Leu
420 425 430
Ile Leu Ala Ala Leu Gly Glu Gly Gln Cys Lys Ile Lys Asn Leu Leu
435 440 445
His Ser Asp Asp Thr Lys His Met Leu Thr Ala Val His Glu Leu Lys
450 455 460
Gly Ala Thr Ile Ser Trp Glu Asp Asn Gly Glu Thr Val Val Val Glu
465 470 475 480
Gly His Gly Gly Ser Thr Leu Ser Ala Cys Ala Asp Pro Leu Tyr Leu
485 490 495
Gly Asn Ala Gly Thr Ala Ser Arg Phe Leu Thr Ser Leu Ala Ala Leu
500 505 510
Val Asn Ser Thr Ser Ser Gln Lys Tyr Ile Val Leu Thr Gly Asn Ala
515 520 525
Arg Met Gln Gln Arg Pro Ile Ala Pro Leu Val Asp Ser Leu Arg Ala
530 535 540
Asn Gly Thr Lys Ile Glu Tyr Leu Asn Asn Glu Gly Ser Leu Pro Ile
545 550 555 560
Lys Val Tyr Thr Asp Ser Val Phe Lys Gly Gly Arg Ile Glu Leu Ala
565 570 575
Ala Thr Val Ser Ser Gln Tyr Val Ser Ser Ile Leu Met Cys Ala Pro
580 585 590
Tyr Ala Glu Glu Pro Val Thr Leu Ala Leu Val Gly Gly Lys Pro Ile
595 600 605
Ser Lys Leu Tyr Val Asp Met Thr Ile Lys Met Met Glu Lys Phe Gly
610 615 620
Ile Asn Val Glu Thr Ser Thr Thr Glu Pro Tyr Thr Tyr Tyr Ile Pro
625 630 635 640
Lys Gly His Tyr Ile Asn Pro Ser Glu Tyr Val Ile Glu Ser Asp Ala
645 650 655
Ser Ser Ala Thr Tyr Pro Leu Ala Phe Ala Ala Met Thr Gly Thr Thr
660 665 670
Val Thr Val Pro Asn Ile Gly Phe Glu Ser Leu Gln Gly Asp Ala Arg
675 680 685
Phe Ala Arg Asp Val Leu Lys Pro Met Gly Cys Lys Ile Thr Gln Thr
690 695 700
Ala Thr Ser Thr Thr Val Ser Gly Pro Pro Val Gly Thr Leu Lys Pro
705 710 715 720
Leu Lys His Val Asp Met Glu Pro Met Thr Asp Ala Phe Leu Thr Ala
725 730 735
Cys Val Val Ala Ala Ile Ser His Asp Ser Asp Pro Asn Ser Ala Asn
740 745 750
Thr Thr Thr Ile Glu Gly Ile Ala Asn Gln Arg Val Lys Glu Cys Asn
755 760 765
Arg Ile Leu Ala Met Ala Thr Glu Leu Ala Lys Phe Gly Val Lys Thr
770 775 780
Thr Glu Leu Pro Asp Gly Ile Gln Val His Gly Leu Asn Ser Ile Lys
785 790 795 800
Asp Leu Lys Val Pro Ser Asp Ser Ser Gly Pro Val Gly Val Cys Thr
805 810 815
Tyr Asp Asp His Arg Val Ala Met Ser Phe Ser Leu Leu Ala Gly Met
820 825 830
Val Asn Ser Gln Asn Glu Arg Asp Glu Val Ala Asn Pro Val Arg Ile
835 840 845
Leu Glu Arg His Cys Thr Gly Lys Thr Trp Pro Gly Trp Trp Asp Val
850 855 860
Leu His Ser Glu Leu Gly Ala Lys Leu Asp Gly Ala Glu Pro Leu Glu
865 870 875 880
Cys Thr Ser Lys Lys Asn Ser Lys Lys Ser Val Val Ile Ile Gly Met
885 890 895
Arg Ala Ala Gly Lys Thr Thr Ile Ser Lys Trp Cys Ala Ser Ala Leu
900 905 910
Gly Tyr Lys Leu Val Asp Leu Asp Glu Leu Phe Glu Gln Gln His Asn
915 920 925
Asn Gln Ser Val Lys Gln Phe Val Val Glu Asn Gly Trp Glu Lys Phe
930 935 940
Arg Glu Glu Glu Thr Arg Ile Phe Lys Glu Val Ile Gln Asn Tyr Gly
945 950 955 960
Asp Asp Gly Tyr Val Phe Ser Thr Gly Gly Gly Ile Val Glu Ser Ala
965 970 975
Glu Ser Arg Lys Ala Leu Lys Asp Phe Ala Ser Ser Gly Gly Tyr Val
980 985 990
Leu His Leu His Arg Asp Ile Glu Glu Thr Ile Val Phe Leu Gln Ser
995 1000 1005
Asp Pro Ser Arg Pro Ala Tyr Val Glu Glu Ile Arg Glu Val Trp Asn
1010 1015 1020
Arg Arg Glu Gly Trp Tyr Lys Glu Cys Ser Asn Phe Ser Phe Phe Ala
1025 1030 1035 1040
Pro His Cys Ser Ala Glu Ala Glu Phe Gln Ala Leu Arg Arg Ser Phe
1045 1050 1055
Ser Lys Tyr Ile Ala Thr Ile Thr Gly Val Arg Glu Ile Glu Ile Pro
1060 1065 1070
Ser Gly Arg Ser Ala Phe Val Cys Leu Thr Phe Asp Asp Leu Thr Glu
1075 1080 1085
Gln Thr Glu Asn Leu Thr Pro Ile Cys Tyr Gly Cys Glu Ala Val Glu
1090 1095 1100
Val Arg Val Asp His Leu Ala Asn Tyr Ser Ala Asp Phe Val Ser Lys
1105 1110 1115 1120
Gln Leu Ser Ile Leu Arg Lys Ala Thr Asp Ser Ile Pro Ile Ile Phe
1125 1130 1135
Thr Val Arg Thr Met Lys Gln Gly Gly Asn Phe Pro Asp Glu Glu Phe
1140 1145 1150
Lys Thr Leu Arg Glu Leu Tyr Asp Ile Ala Leu Lys Asn Gly Val Glu
1155 1160 1165
Phe Leu Asp Leu Glu Leu Thr Leu Pro Thr Asp Ile Gln Tyr Glu Val
1170 1175 1180
Ile Asn Lys Arg Gly Asn Thr Lys Ile Ile Gly Ser His His Asp Phe
1185 1190 1195 1200
Gln Gly Leu Tyr Ser Trp Asp Asp Ala Glu Trp Glu Asn Arg Phe Asn
1205 1210 1215
Gln Ala Leu Thr Leu Asp Val Asp Val Val Lys Phe Val Gly Thr Ala
1220 1225 1230
Val Asn Phe Glu Asp Asn Leu Arg Leu Glu His Phe Arg Asp Thr His
1235 1240 1245
Lys Asn Lys Pro Leu Ile Ala Val Asn Met Thr Ser Lys Gly Ser Ile
1250 1255 1260
Ser Arg Val Leu Asn Asn Val Leu Thr Pro Val Thr Ser Asp Leu Leu
1265 1270 1275 1280
Pro Asn Ser Ala Ala Pro Gly Gln Leu Thr Val Ala Gln Ile Asn Lys
1285 1290 1295
Met Tyr Thr Ser Met Gly Gly Ile Glu Pro Lys Glu Leu Phe Val Val
1300 1305 1310
Gly Lys Pro Ile Gly His Ser Arg Ser Pro Ile Leu His Asn Thr Gly
1315 1320 1325
Tyr Glu Ile Leu Gly Leu Pro His Lys Phe Asp Lys Phe Glu Thr Glu
1330 1335 1340
Ser Ala Gln Leu Val Lys Glu Lys Leu Leu Asp Gly Asn Lys Asn Phe
1345 1350 1355 1360
Gly Gly Ala Ala Val Thr Ile Pro Leu Lys Leu Asp Ile Met Gln Tyr
1365 1370 1375
Met Asp Glu Leu Thr Asp Ala Ala Lys Val Ile Gly Ala Val Asn Thr
1380 1385 1390
Val Ile Pro Leu Gly Asn Lys Lys Phe Lys Gly Asp Asn Thr Asp Trp
1395 1400 1405
Leu Gly Ile Arg Asn Ala Leu Ile Asn Asn Gly Val Pro Glu Tyr Val
1410 1415 1420
Gly His Thr Ala Gly Leu Val Ile Gly Ala Gly Gly Thr Ser Arg Ala
1425 1430 1435 1440
Ala Leu Tyr Ala Leu His Ser Leu Gly Cys Lys Lys Ile Phe Ile Ile
1445 1450 1455
Asn Arg Thr Thr Ser Lys Leu Lys Pro Leu Ile Glu Ser Leu Pro Ser
1460 1465 1470
Glu Phe Asn Ile Ile Gly Ile Glu Ser Thr Lys Ser Ile Glu Glu Ile
1475 1480 1485
Lys Glu His Val Gly Val Ala Val Ser Cys Val Pro Ala Asp Lys Pro
1490 1495 1500
Leu Asp Asp Glu Leu Leu Ser Lys Leu Glu Arg Phe Leu Val Lys Gly
1505 1510 1515 1520
Ala His Ala Ala Phe Val Pro Thr Leu Leu Glu Ala Ala Tyr Lys Pro
1525 1530 1535
Ser Val Thr Pro Val Met Thr Ile Ser Gln Asp Lys Tyr Gln Trp His
1540 1545 1550
Val Val Pro Gly Ser Gln Met Leu Val His Gln Gly Val Ala Gln Phe
1555 1560 1565
Glu Lys Trp Thr Gly Phe Lys Gly Pro Phe Lys Ala Ile Phe Asp Ala
1570 1575 1580
Val Thr Lys Glu
1585
<210> 113
<211> 820
<212> PRT
<213> Anabaena variabilis ATCC29413
<400> 113
Met Ser Ile Val Gln Ala Lys Phe Glu Ala Lys Glu Thr Ser Phe His
1 5 10 15
Val Glu Gly Tyr Glu Lys Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly
20 25 30
Ile Phe Glu Ile Gln Asn Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe
35 40 45
Gly Arg Cys Leu Ala Ile Val Asp Ala Asn Val Ser Arg Leu Tyr Gly
50 55 60
Asn Gln Ile Gln Ala Tyr Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu
65 70 75 80
Phe Pro Ile Thr Ile Thr Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu
85 90 95
Arg Val Ile Asp Val Phe Ala Asp Phe Lys Leu Val Arg Lys Glu Pro
100 105 110
Val Leu Val Val Gly Gly Gly Leu Ile Thr Asp Val Val Gly Phe Ala
115 120 125
Cys Ser Thr Tyr Arg Arg Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr
130 135 140
Leu Ile Gly Leu Ile Asp Ala Ser Val Ala Ile Lys Val Ala Val Asn
145 150 155 160
His Arg Lys Leu Lys Asn Arg Leu Gly Ala Tyr His Ala Ser Arg Lys
165 170 175
Val Phe Leu Asp Phe Ser Leu Leu Arg Thr Leu Pro Thr Asp Gln Val
180 185 190
Arg Asn Gly Met Ala Glu Leu Val Lys Ile Ala Val Val Ala His Gln
195 200 205
Glu Val Phe Glu Leu Leu Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr
210 215 220
His Phe Gly Asn Ile Asp Ala Thr Pro Glu Ile Lys Glu Ile Ala His
225 230 235 240
Arg Leu Thr Tyr Lys Ala Ile His Lys Met Leu Glu Leu Glu Val Pro
245 250 255
Asn Leu His Glu Leu Asp Leu Asp Arg Val Ile Ala Tyr Gly His Thr
260 265 270
Trp Ser Pro Thr Leu Glu Leu Ala Pro Arg Leu Pro Met Phe His Gly
275 280 285
His Ala Val Asn Val Asp Met Ala Phe Ser Ala Thr Ile Ala Ala Arg
290 295 300
Arg Gly Tyr Ile Thr Ile Ala Glu Arg Asp Arg Ile Leu Gly Leu Met
305 310 315 320
Ser Arg Val Gly Leu Ser Leu Asp His Pro Met Leu Asp Ile Asp Ile
325 330 335
Leu Trp Arg Gly Thr Glu Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu
340 345 350
Arg Ala Ala Met Pro Lys Pro Ile Gly Asp Cys Val Phe Val Asn Asp
355 360 365
Leu Thr Arg Glu Glu Leu Ala Ala Ala Leu Ala Asp His Lys Glu Leu
370 375 380
Cys Thr Ser Tyr Pro Arg Gly Gly Glu Gly Val Asp Val Tyr Pro Val
385 390 395 400
Tyr Gln Lys Glu Leu Ile Gly Ser Val Lys Met Ser Ile Val Gln Ala
405 410 415
Lys Phe Glu Ala Lys Glu Thr Ser Phe His Val Glu Gly Tyr Glu Lys
420 425 430
Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly Ile Phe Glu Ile Gln Asn
435 440 445
Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe Gly Arg Cys Leu Ala Ile
450 455 460
Val Asp Ala Asn Val Ser Arg Leu Tyr Gly Asn Gln Ile Gln Ala Tyr
465 470 475 480
Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu Phe Pro Ile Thr Ile Thr
485 490 495
Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu Arg Val Ile Asp Val Phe
500 505 510
Ala Asp Phe Lys Leu Val Arg Lys Glu Pro Val Leu Val Val Gly Gly
515 520 525
Gly Leu Ile Thr Asp Val Val Gly Phe Ala Cys Ser Thr Tyr Arg Arg
530 535 540
Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr Leu Ile Gly Leu Ile Asp
545 550 555 560
Ala Ser Val Ala Ile Lys Val Ala Val Asn His Arg Lys Leu Lys Asn
565 570 575
Arg Leu Gly Ala Tyr His Ala Ser Arg Lys Val Phe Leu Asp Phe Ser
580 585 590
Leu Leu Arg Thr Leu Pro Thr Asp Gln Val Arg Asn Gly Met Ala Glu
595 600 605
Leu Val Lys Ile Ala Val Val Ala His Gln Glu Val Phe Glu Leu Leu
610 615 620
Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr His Phe Gly Asn Ile Asp
625 630 635 640
Ala Thr Pro Glu Ile Lys Glu Ile Ala His Arg Leu Thr Tyr Lys Ala
645 650 655
Ile His Lys Met Leu Glu Leu Glu Val Pro Asn Leu His Glu Leu Asp
660 665 670
Leu Asp Arg Val Ile Ala Tyr Gly His Thr Trp Ser Pro Thr Leu Glu
675 680 685
Leu Ala Pro Arg Leu Pro Met Phe His Gly His Ala Val Asn Val Asp
690 695 700
Met Ala Phe Ser Ala Thr Ile Ala Ala Arg Arg Gly Tyr Ile Thr Ile
705 710 715 720
Ala Glu Arg Asp Arg Ile Leu Gly Leu Met Ser Arg Val Gly Leu Ser
725 730 735
Leu Asp His Pro Met Leu Asp Ile Asp Ile Leu Trp Arg Gly Thr Glu
740 745 750
Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu Arg Ala Ala Met Pro Lys
755 760 765
Pro Ile Gly Asp Cys Val Phe Val Asn Asp Leu Thr Arg Glu Glu Leu
770 775 780
Ala Ala Ala Leu Ala Asp His Lys Glu Leu Cys Thr Ser Tyr Pro Arg
785 790 795 800
Gly Gly Glu Gly Val Asp Val Tyr Pro Val Tyr Gln Lys Glu Leu Ile
805 810 815
Gly Ser Val Lys
820
<210> 114
<211> 1099
<212> PRT
<213> Anabaena variabilis ATCC29413
<400> 114
Met Ser Ile Val Gln Ala Lys Phe Glu Ala Lys Glu Thr Ser Phe His
1 5 10 15
Val Glu Gly Tyr Glu Lys Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly
20 25 30
Ile Phe Glu Ile Gln Asn Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe
35 40 45
Gly Arg Cys Leu Ala Ile Val Asp Ala Asn Val Ser Arg Leu Tyr Gly
50 55 60
Asn Gln Ile Gln Ala Tyr Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu
65 70 75 80
Phe Pro Ile Thr Ile Thr Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu
85 90 95
Arg Val Ile Asp Val Phe Ala Asp Phe Lys Leu Val Arg Lys Glu Pro
100 105 110
Val Leu Val Val Gly Gly Gly Leu Ile Thr Asp Val Val Gly Phe Ala
115 120 125
Cys Ser Thr Tyr Arg Arg Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr
130 135 140
Leu Ile Gly Leu Ile Asp Ala Ser Val Ala Ile Lys Val Ala Val Asn
145 150 155 160
His Arg Lys Leu Lys Asn Arg Leu Gly Ala Tyr His Ala Ser Arg Lys
165 170 175
Val Phe Leu Asp Phe Ser Leu Leu Arg Thr Leu Pro Thr Asp Gln Val
180 185 190
Arg Asn Gly Met Ala Glu Leu Val Lys Ile Ala Val Val Ala His Gln
195 200 205
Glu Val Phe Glu Leu Leu Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr
210 215 220
His Phe Gly Asn Ile Asp Ala Thr Pro Glu Ile Lys Glu Ile Ala His
225 230 235 240
Arg Leu Thr Tyr Lys Ala Ile His Lys Met Leu Glu Leu Glu Val Pro
245 250 255
Asn Leu His Glu Leu Asp Leu Asp Arg Val Ile Ala Tyr Gly His Thr
260 265 270
Trp Ser Pro Thr Leu Glu Leu Ala Pro Arg Leu Pro Met Phe His Gly
275 280 285
His Ala Val Asn Val Asp Met Ala Phe Ser Ala Thr Ile Ala Ala Arg
290 295 300
Arg Gly Tyr Ile Thr Ile Ala Glu Arg Asp Arg Ile Leu Gly Leu Met
305 310 315 320
Ser Arg Val Gly Leu Ser Leu Asp His Pro Met Leu Asp Ile Asp Ile
325 330 335
Leu Trp Arg Gly Thr Glu Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu
340 345 350
Arg Ala Ala Met Pro Lys Pro Ile Gly Asp Cys Val Phe Val Asn Asp
355 360 365
Leu Thr Arg Glu Glu Leu Ala Ala Ala Leu Ala Asp His Lys Glu Leu
370 375 380
Cys Thr Ser Tyr Pro Arg Gly Gly Glu Gly Val Asp Val Tyr Pro Val
385 390 395 400
Tyr Gln Lys Glu Leu Ile Gly Ser Val Lys Met Ser Ile Val Gln Ala
405 410 415
Lys Phe Glu Ala Lys Glu Thr Ser Phe His Val Glu Gly Tyr Glu Lys
420 425 430
Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly Ile Phe Glu Ile Gln Asn
435 440 445
Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe Gly Arg Cys Leu Ala Ile
450 455 460
Val Asp Ala Asn Val Ser Arg Leu Tyr Gly Asn Gln Ile Gln Ala Tyr
465 470 475 480
Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu Phe Pro Ile Thr Ile Thr
485 490 495
Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu Arg Val Ile Asp Val Phe
500 505 510
Ala Asp Phe Lys Leu Val Arg Lys Glu Pro Val Leu Val Val Gly Gly
515 520 525
Gly Leu Ile Thr Asp Val Val Gly Phe Ala Cys Ser Thr Tyr Arg Arg
530 535 540
Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr Leu Ile Gly Leu Ile Asp
545 550 555 560
Ala Ser Val Ala Ile Lys Val Ala Val Asn His Arg Lys Leu Lys Asn
565 570 575
Arg Leu Gly Ala Tyr His Ala Ser Arg Lys Val Phe Leu Asp Phe Ser
580 585 590
Leu Leu Arg Thr Leu Pro Thr Asp Gln Val Arg Asn Gly Met Ala Glu
595 600 605
Leu Val Lys Ile Ala Val Val Ala His Gln Glu Val Phe Glu Leu Leu
610 615 620
Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr His Phe Gly Asn Ile Asp
625 630 635 640
Ala Thr Pro Glu Ile Lys Glu Ile Ala His Arg Leu Thr Tyr Lys Ala
645 650 655
Ile His Lys Met Leu Glu Leu Glu Val Pro Asn Leu His Glu Leu Asp
660 665 670
Leu Asp Arg Val Ile Ala Tyr Gly His Thr Trp Ser Pro Thr Leu Glu
675 680 685
Leu Ala Pro Arg Leu Pro Met Phe His Gly His Ala Val Asn Val Asp
690 695 700
Met Ala Phe Ser Ala Thr Ile Ala Ala Arg Arg Gly Tyr Ile Thr Ile
705 710 715 720
Ala Glu Arg Asp Arg Ile Leu Gly Leu Met Ser Arg Val Gly Leu Ser
725 730 735
Leu Asp His Pro Met Leu Asp Ile Asp Ile Leu Trp Arg Gly Thr Glu
740 745 750
Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu Arg Ala Ala Met Pro Lys
755 760 765
Pro Ile Gly Asp Cys Val Phe Val Asn Asp Leu Thr Arg Glu Glu Leu
770 775 780
Ala Ala Ala Leu Ala Asp His Lys Glu Leu Cys Thr Ser Tyr Pro Arg
785 790 795 800
Gly Gly Glu Gly Val Asp Val Tyr Pro Val Tyr Gln Lys Glu Leu Ile
805 810 815
Gly Ser Val Lys Met Thr Asn Val Ile Val Gln Pro Thr Ala Arg Pro
820 825 830
Val Thr Pro Leu Gly Ile Leu Thr Lys Gln Leu Glu Ala Ile Val Gln
835 840 845
Glu Val Lys Gln His Pro Asp Leu Pro Gly Glu Leu Ile Ala Asn Ile
850 855 860
His Gln Ala Trp Arg Leu Ala Ala Gly Ile Asp Pro Tyr Leu Glu Glu
865 870 875 880
Cys Thr Thr Pro Glu Ser Pro Glu Leu Ala Ala Leu Ala Lys Thr Thr
885 890 895
Ala Thr Glu Ala Trp Gly Glu His Phe His Gly Gly Thr Thr Val Arg
900 905 910
Pro Leu Glu Gln Glu Met Leu Ser Gly His Ile Glu Gly Gln Thr Leu
915 920 925
Lys Met Phe Val His Met Thr Lys Ala Lys Lys Val Leu Glu Ile Gly
930 935 940
Met Phe Thr Gly Tyr Ser Ala Leu Ala Met Ala Glu Ala Leu Pro Glu
945 950 955 960
Asp Gly Leu Leu Val Ala Cys Glu Val Asp Pro Tyr Ala Ala Glu Ile
965 970 975
Gly Gln Lys Ala Phe Gln Gln Ser Pro His Gly Gly Lys Ile Arg Val
980 985 990
Glu Leu Asp Ala Ala Leu Ala Thr Leu Asp Lys Leu Ala Glu Ala Gly
995 1000 1005
Glu Ser Phe Asp Leu Val Phe Ile Asp Ala Asp Lys Lys Glu Tyr Val
1010 1015 1020
Ala Tyr Phe His Lys Leu Leu Gly Ser Ser Leu Leu Ala Pro Asp Gly
1025 1030 1035 1040
Phe Ile Cys Val Asp Asn Thr Leu Leu Gln Gly Glu Val Tyr Leu Pro
1045 1050 1055
Ala Glu Glu Arg Ser Val Asn Gly Glu Ala Ile Ala Gln Phe Asn His
1060 1065 1070
Thr Val Ala Ile Asp Pro Arg Val Glu Gln Val Leu Leu Pro Leu Arg
1075 1080 1085
Asp Gly Leu Thr Ile Ile Arg Arg Ile Gln Pro
1090 1095
<210> 115
<211> 410
<212> PRT
<213> Anabaena variabilis ATCC29413
<400> 115
Met Ser Ile Val Gln Ala Lys Phe Glu Ala Lys Glu Thr Ser Phe His
1 5 10 15
Val Glu Gly Tyr Glu Lys Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly
20 25 30
Ile Phe Glu Ile Gln Asn Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe
35 40 45
Gly Arg Cys Leu Ala Ile Val Asp Ala Asn Val Ser Arg Leu Tyr Gly
50 55 60
Asn Gln Ile Gln Ala Tyr Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu
65 70 75 80
Phe Pro Ile Thr Ile Thr Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu
85 90 95
Arg Val Ile Asp Val Phe Ala Asp Phe Lys Leu Val Arg Lys Glu Pro
100 105 110
Val Leu Val Val Gly Gly Gly Leu Ile Thr Asp Val Val Gly Phe Ala
115 120 125
Cys Ser Thr Tyr Arg Arg Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr
130 135 140
Leu Ile Gly Leu Ile Asp Ala Ser Val Ala Ile Lys Val Ala Val Asn
145 150 155 160
His Arg Lys Leu Lys Asn Arg Leu Gly Ala Tyr His Ala Ser Arg Lys
165 170 175
Val Phe Leu Asp Phe Ser Leu Leu Arg Thr Leu Pro Thr Asp Gln Val
180 185 190
Arg Asn Gly Met Ala Glu Leu Val Lys Ile Ala Val Val Ala His Gln
195 200 205
Glu Val Phe Glu Leu Leu Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr
210 215 220
His Phe Gly Asn Ile Asp Ala Thr Pro Glu Ile Lys Glu Ile Ala His
225 230 235 240
Arg Leu Thr Tyr Lys Ala Ile His Lys Met Leu Glu Leu Glu Val Pro
245 250 255
Asn Leu His Glu Leu Asp Leu Asp Arg Val Ile Ala Tyr Gly His Thr
260 265 270
Trp Ser Pro Thr Leu Glu Leu Ala Pro Arg Leu Pro Met Phe His Gly
275 280 285
His Ala Val Asn Val Asp Met Ala Phe Ser Ala Thr Ile Ala Ala Arg
290 295 300
Arg Gly Tyr Ile Thr Ile Ala Glu Arg Asp Arg Ile Leu Gly Leu Met
305 310 315 320
Ser Arg Val Gly Leu Ser Leu Asp His Pro Met Leu Asp Ile Asp Ile
325 330 335
Leu Trp Arg Gly Thr Glu Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu
340 345 350
Arg Ala Ala Met Pro Lys Pro Ile Gly Asp Cys Val Phe Val Asn Asp
355 360 365
Leu Thr Arg Glu Glu Leu Ala Ala Ala Leu Ala Asp His Lys Glu Leu
370 375 380
Cys Thr Ser Tyr Pro Arg Gly Gly Glu Gly Val Asp Val Tyr Pro Val
385 390 395 400
Tyr Gln Lys Glu Leu Ile Gly Ser Val Lys
405 410
<210> 116
<211> 410
<212> PRT
<213> Anabaena variabilis ATCC29413
<400> 116
Met Ser Ile Val Gln Ala Lys Phe Glu Ala Lys Glu Thr Ser Phe His
1 5 10 15
Val Glu Gly Tyr Glu Lys Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly
20 25 30
Ile Phe Glu Ile Gln Asn Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe
35 40 45
Gly Arg Cys Leu Ala Ile Val Asp Ala Asn Val Ser Arg Leu Tyr Gly
50 55 60
Asn Gln Ile Gln Ala Tyr Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu
65 70 75 80
Phe Pro Ile Thr Ile Thr Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu
85 90 95
Arg Val Ile Asp Val Phe Ala Asp Phe Lys Leu Val Arg Lys Glu Pro
100 105 110
Val Leu Val Val Gly Gly Gly Leu Ile Thr Asp Val Val Gly Phe Ala
115 120 125
Cys Ser Thr Tyr Arg Arg Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr
130 135 140
Leu Ile Gly Leu Ile Asp Ala Ser Val Ala Ile Lys Val Ala Val Asn
145 150 155 160
His Arg Lys Leu Lys Asn Arg Leu Gly Ala Tyr His Ala Ser Arg Lys
165 170 175
Val Phe Leu Asp Phe Ser Leu Leu Arg Thr Leu Pro Thr Asp Gln Val
180 185 190
Arg Asn Gly Met Ala Glu Leu Val Lys Ile Ala Val Val Ala His Gln
195 200 205
Glu Val Phe Glu Leu Leu Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr
210 215 220
His Phe Gly Asn Ile Asp Ala Thr Pro Glu Ile Lys Glu Ile Ala His
225 230 235 240
Arg Leu Thr Tyr Lys Ala Ile His Lys Met Leu Glu Leu Glu Val Pro
245 250 255
Asn Leu His Glu Leu Asp Leu Asp Arg Val Ile Ala Tyr Gly His Thr
260 265 270
Trp Ser Pro Thr Leu Glu Leu Ala Pro Arg Leu Pro Met Phe His Gly
275 280 285
His Ala Val Asn Val Asp Met Ala Phe Ser Ala Thr Ile Ala Ala Arg
290 295 300
Arg Gly Tyr Ile Thr Ile Ala Glu Arg Asp Arg Ile Leu Gly Leu Met
305 310 315 320
Ser Arg Val Gly Leu Ser Leu Asp His Pro Met Leu Asp Ile Asp Ile
325 330 335
Leu Trp Arg Gly Thr Glu Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu
340 345 350
Arg Ala Ala Met Pro Lys Pro Ile Gly Asp Cys Val Phe Val Asn Asp
355 360 365
Leu Thr Arg Glu Glu Leu Ala Ala Ala Leu Ala Asp His Lys Glu Leu
370 375 380
Cys Thr Ser Tyr Pro Arg Gly Gly Glu Gly Val Asp Val Tyr Pro Val
385 390 395 400
Tyr Gln Lys Glu Leu Ile Gly Ser Val Lys
405 410
<210> 117
<211> 279
<212> PRT
<213> Anabaena variabilis ATCC29413
<400> 117
Met Thr Asn Val Ile Val Gln Pro Thr Ala Arg Pro Val Thr Pro Leu
1 5 10 15
Gly Ile Leu Thr Lys Gln Leu Glu Ala Ile Val Gln Glu Val Lys Gln
20 25 30
His Pro Asp Leu Pro Gly Glu Leu Ile Ala Asn Ile His Gln Ala Trp
35 40 45
Arg Leu Ala Ala Gly Ile Asp Pro Tyr Leu Glu Glu Cys Thr Thr Pro
50 55 60
Glu Ser Pro Glu Leu Ala Ala Leu Ala Lys Thr Thr Ala Thr Glu Ala
65 70 75 80
Trp Gly Glu His Phe His Gly Gly Thr Thr Val Arg Pro Leu Glu Gln
85 90 95
Glu Met Leu Ser Gly His Ile Glu Gly Gln Thr Leu Lys Met Phe Val
100 105 110
His Met Thr Lys Ala Lys Lys Val Leu Glu Ile Gly Met Phe Thr Gly
115 120 125
Tyr Ser Ala Leu Ala Met Ala Glu Ala Leu Pro Glu Asp Gly Leu Leu
130 135 140
Val Ala Cys Glu Val Asp Pro Tyr Ala Ala Glu Ile Gly Gln Lys Ala
145 150 155 160
Phe Gln Gln Ser Pro His Gly Gly Lys Ile Arg Val Glu Leu Asp Ala
165 170 175
Ala Leu Ala Thr Leu Asp Lys Leu Ala Glu Ala Gly Glu Ser Phe Asp
180 185 190
Leu Val Phe Ile Asp Ala Asp Lys Lys Glu Tyr Val Ala Tyr Phe His
195 200 205
Lys Leu Leu Gly Ser Ser Leu Leu Ala Pro Asp Gly Phe Ile Cys Val
210 215 220
Asp Asn Thr Leu Leu Gln Gly Glu Val Tyr Leu Pro Ala Glu Glu Arg
225 230 235 240
Ser Val Asn Gly Glu Ala Ile Ala Gln Phe Asn His Thr Val Ala Ile
245 250 255
Asp Pro Arg Val Glu Gln Val Leu Leu Pro Leu Arg Asp Gly Leu Thr
260 265 270
Ile Ile Arg Arg Ile Gln Pro
275
<210> 118
<211> 888
<212> PRT
<213> Anabaena variabilis ATCC29413
<400> 118
Met Gln Thr Ile Asp Phe Asn Ile Arg Lys Leu Leu Val Glu Trp Asn
1 5 10 15
Ala Thr His Arg Asp Tyr Asp Leu Ser Gln Ser Leu His Glu Leu Ile
20 25 30
Val Ala Gln Val Glu Arg Thr Pro Glu Ala Ile Ala Val Thr Phe Asp
35 40 45
Lys Gln Gln Leu Thr Tyr Gln Glu Leu Asn His Lys Ala Asn Gln Leu
50 55 60
Gly His Tyr Leu Gln Thr Leu Gly Val Gln Pro Glu Thr Leu Val Gly
65 70 75 80
Val Cys Leu Glu Arg Ser Leu Glu Met Val Ile Cys Leu Leu Gly Ile
85 90 95
Leu Lys Ala Gly Gly Ala Tyr Val Pro Ile Asp Pro Glu Tyr Pro Gln
100 105 110
Glu Arg Ile Ala Tyr Met Leu Glu Asp Ser Gln Val Lys Val Leu Leu
115 120 125
Thr Gln Glu Lys Leu Leu Asn Gln Ile Pro His His Gln Ala Gln Thr
130 135 140
Ile Cys Val Asp Arg Glu Trp Glu Lys Ile Ser Thr Gln Ala Asn Thr
145 150 155 160
Asn Pro Lys Ser Asn Ile Lys Thr Asp Asn Leu Ala Tyr Val Ile Tyr
165 170 175
Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Ala Met Asn Thr His Lys
180 185 190
Gly Ile Cys Asn Arg Leu Leu Trp Met Gln Glu Ala Tyr Gln Ile Asp
195 200 205
Ser Thr Asp Ser Ile Leu Gln Lys Thr Pro Phe Ser Phe Asp Val Ser
210 215 220
Val Trp Glu Phe Phe Trp Thr Leu Leu Thr Gly Ala Arg Leu Val Ile
225 230 235 240
Ala Lys Pro Gly Gly His Lys Asp Ser Ala Tyr Leu Ile Asp Leu Ile
245 250 255
Thr Gln Glu Gln Ile Thr Thr Leu His Phe Val Pro Ser Met Leu Gln
260 265 270
Val Phe Leu Gln Asn Arg His Val Ser Lys Cys Ser Ser Leu Lys Arg
275 280 285
Val Ile Cys Ser Gly Glu Ala Leu Ser Ile Asp Leu Gln Asn Arg Phe
290 295 300
Phe Gln His Leu Gln Cys Glu Leu His Asn Leu Tyr Gly Pro Thr Glu
305 310 315 320
Ala Ala Ile Asp Val Thr Phe Trp Gln Cys Arg Lys Asp Ser Asn Leu
325 330 335
Lys Ser Val Pro Ile Gly Arg Pro Ile Ala Asn Thr Gln Ile Tyr Ile
340 345 350
Leu Asp Ala Asp Leu Gln Pro Val Asn Ile Gly Val Thr Gly Glu Ile
355 360 365
Tyr Ile Gly Gly Val Gly Val Ala Arg Gly Tyr Leu Asn Lys Glu Glu
370 375 380
Leu Thr Lys Glu Lys Phe Ile Ile Asn Pro Phe Pro Asn Ser Glu Phe
385 390 395 400
Lys Arg Leu Tyr Lys Thr Gly Asp Leu Ala Arg Tyr Leu Pro Asp Gly
405 410 415
Asn Ile Glu Tyr Leu Gly Arg Thr Asp Tyr Gln Val Lys Ile Arg Gly
420 425 430
Tyr Arg Ile Glu Ile Gly Glu Ile Glu Asn Val Leu Ser Ser His Pro
435 440 445
Gln Val Arg Glu Ala Val Val Ile Ala Arg Asp Asp Asn Ala Gln Glu
450 455 460
Lys Gln Ile Ile Ala Tyr Ile Thr Tyr Asn Ser Ile Lys Pro Gln Leu
465 470 475 480
Asp Asn Leu Arg Asp Phe Leu Lys Ala Arg Leu Pro Asp Phe Met Ile
485 490 495
Pro Ala Ala Phe Val Met Leu Glu His Leu Pro Leu Thr Pro Ser Gly
500 505 510
Lys Val Asp Arg Lys Ala Leu Pro Lys Pro Asp Leu Phe Asn Tyr Ser
515 520 525
Glu His Asn Ser Tyr Val Ala Pro Arg Asn Glu Val Glu Glu Lys Leu
530 535 540
Val Gln Ile Trp Ser Asn Ile Leu His Leu Pro Lys Val Gly Val Thr
545 550 555 560
Glu Asn Phe Phe Ala Ile Gly Gly Asn Ser Leu Lys Ala Leu His Leu
565 570 575
Ile Ser Gln Ile Glu Glu Leu Phe Ala Lys Glu Ile Ser Leu Ala Thr
580 585 590
Leu Leu Thr Asn Pro Val Ile Ala Asp Leu Ala Lys Val Ile Gln Ala
595 600 605
Asn Asn Gln Ile His Asn Ser Pro Leu Val Pro Ile Gln Pro Gln Gly
610 615 620
Lys Gln Gln Pro Phe Phe Cys Ile His Pro Ala Gly Gly His Val Leu
625 630 635 640
Cys Tyr Phe Lys Leu Ala Gln Tyr Ile Gly Thr Asp Gln Pro Phe Tyr
645 650 655
Gly Leu Gln Ala Gln Gly Phe Tyr Gly Asp Glu Ala Pro Leu Thr Arg
660 665 670
Val Glu Asp Met Ala Ser Leu Tyr Val Lys Thr Ile Arg Glu Phe Gln
675 680 685
Pro Gln Gly Pro Tyr Arg Val Gly Gly Trp Ser Phe Gly Gly Val Val
690 695 700
Ala Tyr Glu Val Ala Gln Gln Leu His Arg Gln Gly Gln Glu Val Ser
705 710 715 720
Leu Leu Ala Ile Leu Asp Ser Tyr Val Pro Ile Leu Leu Asp Lys Gln
725 730 735
Lys Pro Ile Asp Asp Val Tyr Leu Val Gly Val Leu Ser Arg Val Phe
740 745 750
Gly Gly Met Phe Gly Gln Asp Asn Leu Val Thr Pro Glu Glu Ile Glu
755 760 765
Asn Leu Thr Val Glu Glu Lys Ile Asn Tyr Ile Ile Asp Lys Ala Arg
770 775 780
Ser Ala Arg Ile Phe Pro Pro Gly Val Glu Arg Gln Asn Asn Arg Arg
785 790 795 800
Ile Leu Asp Val Leu Val Gly Thr Leu Lys Ala Thr Tyr Ser Tyr Ile
805 810 815
Arg Gln Pro Tyr Pro Gly Lys Val Thr Val Phe Arg Ala Arg Glu Lys
820 825 830
His Ile Met Ala Pro Asp Pro Thr Leu Val Trp Val Glu Leu Phe Ser
835 840 845
Val Met Ala Ala Gln Glu Ile Lys Ile Ile Asp Val Pro Gly Asn His
850 855 860
Tyr Ser Phe Val Leu Glu Pro His Val Gln Val Leu Ala Gln Arg Leu
865 870 875 880
Gln Asp Cys Leu Glu Asn Asn Ser
885
<210> 119
<211> 410
<212> PRT
<213> Nostoc punctiforme ATCC 29133
<400> 119
Met Ser Asn Val Gln Ala Ser Phe Glu Ala Thr Glu Ala Glu Phe Arg
1 5 10 15
Val Glu Gly Tyr Glu Lys Ile Glu Phe Ser Leu Val Tyr Val Asn Gly
20 25 30
Ala Phe Asp Ile Ser Asn Arg Glu Ile Ala Asp Ser Tyr Glu Lys Phe
35 40 45
Gly Arg Cys Leu Thr Val Ile Asp Ala Asn Val Asn Arg Leu Tyr Gly
50 55 60
Lys Gln Ile Lys Ser Tyr Phe Arg His Tyr Gly Ile Asp Leu Thr Val
65 70 75 80
Val Pro Ile Val Ile Thr Glu Pro Thr Lys Thr Leu Ala Thr Phe Glu
85 90 95
Lys Ile Val Asp Ala Phe Ser Asp Phe Gly Leu Ile Arg Lys Glu Pro
100 105 110
Val Leu Val Val Gly Gly Gly Leu Thr Thr Asp Val Ala Gly Phe Ala
115 120 125
Cys Ala Ala Tyr Arg Arg Lys Ser Asn Tyr Ile Arg Val Pro Thr Thr
130 135 140
Leu Ile Gly Leu Ile Asp Ala Gly Val Ala Ile Lys Val Ala Val Asn
145 150 155 160
His Arg Lys Leu Lys Asn Arg Leu Gly Ala Tyr His Ala Pro Leu Lys
165 170 175
Val Ile Leu Asp Phe Ser Phe Leu Gln Thr Leu Pro Thr Ala Gln Val
180 185 190
Arg Asn Gly Met Ala Glu Leu Val Lys Ile Ala Val Val Ala Asn Ser
195 200 205
Glu Val Phe Glu Leu Leu Tyr Glu Tyr Gly Glu Glu Leu Leu Ser Thr
210 215 220
His Phe Gly Tyr Val Asn Gly Thr Lys Glu Leu Lys Ala Ile Ala His
225 230 235 240
Lys Leu Asn Tyr Glu Ala Ile Lys Thr Met Leu Glu Leu Glu Thr Pro
245 250 255
Asn Leu His Glu Leu Asp Leu Asp Arg Val Ile Ala Tyr Gly His Thr
260 265 270
Trp Ser Pro Thr Leu Glu Leu Ala Pro Met Ile Pro Leu Phe His Gly
275 280 285
His Ala Val Asn Ile Asp Met Ala Leu Ser Ala Thr Ile Ala Ala Arg
290 295 300
Arg Gly Tyr Ile Thr Ser Gly Glu Arg Asp Arg Ile Leu Ser Leu Met
305 310 315 320
Ser Arg Ile Gly Leu Ser Ile Asp His Pro Leu Leu Asp Gly Asp Leu
325 330 335
Leu Trp Tyr Ala Thr Gln Ser Ile Ser Leu Thr Arg Asp Gly Lys Gln
340 345 350
Arg Ala Ala Met Pro Lys Pro Ile Gly Glu Cys Phe Phe Val Asn Asp
355 360 365
Phe Thr Arg Glu Glu Leu Asp Ala Ala Leu Ala Glu His Lys Arg Leu
370 375 380
Cys Ala Thr Tyr Pro Arg Gly Gly Asp Gly Ile Asp Ala Tyr Ile Glu
385 390 395 400
Thr Gln Glu Glu Ser Lys Leu Leu Gly Val
405 410
<210> 120
<211> 277
<212> PRT
<213> Nostoc punctiforme ATCC 29133
<400> 120
Met Thr Ser Ile Leu Gly Arg Asp Thr Ala Arg Pro Ile Thr Pro His
1 5 10 15
Ser Ile Leu Val Ala Gln Leu Gln Lys Thr Leu Arg Met Ala Glu Glu
20 25 30
Ser Asn Ile Pro Ser Glu Ile Leu Thr Ser Leu Arg Gln Gly Leu Gln
35 40 45
Leu Ala Ala Gly Leu Asp Pro Tyr Leu Asp Asp Cys Thr Thr Pro Glu
50 55 60
Ser Thr Ala Leu Thr Ala Leu Ala Gln Lys Thr Ser Ile Glu Asp Trp
65 70 75 80
Ser Lys Arg Phe Ser Asp Gly Glu Thr Val Arg Gln Leu Glu Gln Glu
85 90 95
Met Leu Ser Gly His Leu Glu Gly Gln Thr Leu Lys Met Phe Val His
100 105 110
Ile Thr Lys Ala Lys Ser Ile Leu Glu Val Gly Met Phe Thr Gly Tyr
115 120 125
Ser Ala Leu Ala Met Ala Glu Ala Leu Pro Asp Asp Gly Arg Leu Ile
130 135 140
Ala Cys Glu Val Asp Ser Tyr Val Ala Glu Phe Ala Gln Thr Cys Phe
145 150 155 160
Gln Glu Ser Pro His Gly Arg Lys Ile Val Val Glu Val Ala Pro Ala
165 170 175
Leu Glu Thr Leu His Lys Leu Val Ala Lys Lys Glu Ser Phe Asp Leu
180 185 190
Ile Phe Ile Asp Ala Asp Lys Lys Glu Tyr Ile Glu Tyr Phe Gln Ile
195 200 205
Ile Leu Asp Ser His Leu Leu Ala Pro Asp Gly Leu Ile Cys Val Asp
210 215 220
Asn Thr Leu Leu Gln Gly Gln Val Tyr Leu Pro Ser Glu Gln Arg Thr
225 230 235 240
Ala Asn Gly Glu Ala Ile Ala Gln Phe Asn Arg Ile Val Ala Ala Asp
245 250 255
Pro Arg Val Glu Gln Val Leu Leu Pro Ile Arg Asp Gly Ile Thr Leu
260 265 270
Ile Arg Arg Leu Val
275
<210> 121
<211> 461
<212> PRT
<213> Nostoc punctiforme ATCC 29133
<400> 121
Met Ala Gln Ser Ile Ser Leu Ser Leu Pro Gln Ser Thr Thr Pro Ser
1 5 10 15
Lys Gly Val Arg Leu Lys Ile Ala Ala Leu Leu Lys Thr Ile Gly Thr
20 25 30
Leu Ile Leu Leu Leu Ile Ala Leu Pro Leu Asn Ala Leu Ile Val Leu
35 40 45
Ile Ser Leu Met Cys Arg Pro Phe Thr Lys Lys Pro Ala Val Ala Thr
50 55 60
His Pro Gln Asn Ile Leu Val Ser Gly Gly Lys Met Thr Lys Ala Leu
65 70 75 80
Gln Leu Ala Arg Ser Phe His Ala Ala Gly His Arg Val Ile Leu Ile
85 90 95
Glu Gly His Lys Tyr Trp Leu Ser Gly His Arg Phe Ser Asn Ser Val
100 105 110
Ser Arg Phe Tyr Thr Val Pro Ala Pro Gln Asp Asp Pro Glu Gly Tyr
115 120 125
Thr Gln Ala Leu Leu Glu Ile Val Lys Arg Glu Lys Ile Asp Val Tyr
130 135 140
Val Pro Val Cys Ser Pro Val Ala Ser Tyr Tyr Asp Ser Leu Ala Lys
145 150 155 160
Ser Ala Leu Ser Glu Tyr Cys Glu Val Phe His Phe Asp Ala Asp Ile
165 170 175
Thr Lys Met Leu Asp Asp Lys Phe Ala Phe Thr Asp Arg Ala Arg Ser
180 185 190
Leu Gly Leu Ser Ala Pro Lys Ser Phe Lys Ile Thr Asp Pro Glu Gln
195 200 205
Val Ile Asn Phe Asp Phe Ser Lys Glu Thr Arg Lys Tyr Ile Leu Lys
210 215 220
Ser Ile Ser Tyr Asp Ser Val Arg Arg Leu Asn Leu Thr Lys Leu Pro
225 230 235 240
Cys Asp Thr Pro Glu Glu Thr Ala Ala Phe Val Lys Ser Leu Pro Ile
245 250 255
Ser Pro Glu Lys Pro Trp Ile Met Gln Glu Phe Ile Pro Gly Lys Glu
260 265 270
Leu Cys Thr His Ser Thr Val Arg Asp Gly Glu Leu Arg Leu His Cys
275 280 285
Cys Ser Asn Ser Ser Ala Phe Gln Ile Asn Tyr Glu Asn Val Glu Asn
290 295 300
Pro Gln Ile Gln Glu Trp Val Gln His Phe Val Lys Ser Leu Arg Leu
305 310 315 320
Thr Gly Gln Ile Ser Leu Asp Phe Ile Gln Ala Glu Asp Gly Thr Ala
325 330 335
Tyr Ala Ile Glu Cys Asn Pro Arg Thr His Ser Ala Ile Thr Met Phe
340 345 350
Tyr Asn His Pro Gly Val Ala Glu Ala Tyr Leu Gly Lys Thr Pro Leu
355 360 365
Ala Ala Pro Leu Glu Pro Leu Ala Asp Ser Lys Pro Thr Tyr Trp Ile
370 375 380
Tyr His Glu Ile Trp Arg Leu Thr Gly Ile Arg Ser Gly Gln Gln Leu
385 390 395 400
Gln Thr Trp Phe Gly Arg Leu Val Arg Gly Thr Asp Ala Ile Tyr Arg
405 410 415
Leu Asp Asp Pro Ile Pro Phe Leu Thr Leu His His Trp Gln Ile Thr
420 425 430
Leu Leu Leu Leu Gln Asn Leu Gln Arg Leu Lys Gly Trp Val Lys Ile
435 440 445
Asp Phe Asn Ile Gly Lys Leu Val Glu Leu Gly Gly Asp
450 455 460
<210> 122
<211> 348
<212> PRT
<213> Nostoc punctiforme ATCC 29133
<400> 122
Met Pro Val Leu Asn Ile Leu His Leu Val Gly Ser Ala His Asp Lys
1 5 10 15
Phe Tyr Cys Asp Leu Ser Arg Leu Tyr Ala Gln Asp Cys Leu Ala Ala
20 25 30
Thr Ala Asp Pro Ser Leu Tyr Asn Phe Gln Ile Ala Tyr Ile Thr Pro
35 40 45
Asp Arg Gln Trp Arg Phe Pro Asp Ser Leu Ser Arg Glu Asp Ile Ala
50 55 60
Leu Thr Lys Pro Ile Pro Val Phe Asp Ala Ile Gln Phe Leu Thr Gly
65 70 75 80
Gln Asn Ile Asp Met Met Leu Pro Gln Met Phe Cys Ile Pro Gly Met
85 90 95
Thr Gln Tyr Arg Ala Leu Phe Asp Leu Leu Lys Ile Pro Tyr Ile Gly
100 105 110
Asn Thr Pro Asp Ile Met Ala Ile Ala Ala His Lys Ala Arg Ala Lys
115 120 125
Ala Ile Val Glu Ala Ala Gly Val Lys Val Pro Arg Gly Glu Leu Leu
130 135 140
Arg Gln Gly Asp Ile Pro Thr Ile Thr Pro Pro Ala Val Val Lys Pro
145 150 155 160
Val Ser Ser Asp Asn Ser Leu Gly Val Val Leu Val Lys Asp Val Thr
165 170 175
Glu Tyr Asp Ala Ala Leu Lys Lys Ala Phe Glu Tyr Ala Ser Glu Val
180 185 190
Ile Val Glu Ala Phe Ile Glu Leu Gly Arg Glu Val Arg Cys Gly Ile
195 200 205
Ile Val Lys Asp Gly Glu Leu Ile Gly Leu Pro Leu Glu Glu Tyr Leu
210 215 220
Val Asp Pro His Asp Lys Pro Ile Arg Asn Tyr Ala Asp Lys Leu Gln
225 230 235 240
Gln Thr Asp Asp Gly Asp Leu His Leu Thr Ala Lys Asp Asn Ile Lys
245 250 255
Ala Trp Ile Leu Asp Pro Asn Asp Pro Ile Thr Gln Lys Val Gln Gln
260 265 270
Val Ala Lys Arg Cys His Gln Ala Leu Gly Cys Arg His Tyr Ser Leu
275 280 285
Phe Asp Phe Arg Ile Asp Pro Lys Gly Gln Pro Trp Phe Leu Glu Ala
290 295 300
Gly Leu Tyr Cys Ser Phe Ala Pro Lys Ser Val Ile Ser Ser Met Ala
305 310 315 320
Lys Ala Ala Gly Ile Pro Leu Asn Asp Leu Leu Ile Thr Ala Ile Asn
325 330 335
Glu Thr Leu Gly Ser Asn Lys Lys Val Leu Gln Asn
340 345
<210> 123
<211> 680
<212> PRT
<213> Saccharomyces cerevisiae CEN.PK-1D
<400> 123
Met Thr Gln Phe Thr Asp Ile Asp Lys Leu Ala Val Ser Thr Ile Arg
1 5 10 15
Ile Leu Ala Val Asp Thr Val Ser Lys Ala Asn Ser Gly His Pro Gly
20 25 30
Ala Pro Leu Gly Met Ala Pro Ala Ala His Val Leu Trp Ser Gln Met
35 40 45
Arg Met Asn Pro Thr Asn Pro Asp Trp Ile Asn Arg Asp Arg Phe Val
50 55 60
Leu Ser Asn Gly His Ala Val Ala Leu Leu Tyr Ser Met Leu His Leu
65 70 75 80
Thr Gly Tyr Asp Leu Ser Ile Glu Asp Leu Lys Gln Phe Arg Gln Leu
85 90 95
Gly Ser Arg Thr Pro Gly His Pro Glu Phe Glu Leu Pro Gly Val Glu
100 105 110
Val Thr Thr Gly Pro Leu Gly Gln Gly Ile Ser Asn Ala Val Gly Met
115 120 125
Ala Met Ala Gln Ala Asn Leu Ala Ala Thr Tyr Asn Lys Pro Gly Phe
130 135 140
Thr Leu Ser Asp Asn Tyr Thr Tyr Val Phe Leu Gly Asp Gly Cys Leu
145 150 155 160
Gln Glu Gly Ile Ser Ser Glu Ala Ser Ser Leu Ala Gly His Leu Lys
165 170 175
Leu Gly Asn Leu Ile Ala Ile Tyr Asp Asp Asn Lys Ile Thr Ile Asp
180 185 190
Gly Ala Thr Ser Ile Ser Phe Asp Glu Asp Val Ala Lys Arg Tyr Glu
195 200 205
Ala Tyr Gly Trp Glu Val Leu Tyr Val Glu Asn Gly Asn Glu Asp Leu
210 215 220
Ala Gly Ile Ala Lys Ala Ile Ala Gln Ala Lys Leu Ser Lys Asp Lys
225 230 235 240
Pro Thr Leu Ile Lys Met Thr Thr Thr Ile Gly Tyr Gly Ser Leu His
245 250 255
Ala Gly Ser His Ser Val His Gly Ala Pro Leu Lys Ala Asp Asp Val
260 265 270
Lys Gln Leu Lys Ser Lys Phe Gly Phe Asn Pro Asp Lys Ser Phe Val
275 280 285
Val Pro Gln Glu Val Tyr Asp His Tyr Gln Lys Thr Ile Leu Lys Pro
290 295 300
Gly Val Glu Ala Asn Asn Lys Trp Asn Lys Leu Phe Ser Glu Tyr Gln
305 310 315 320
Lys Lys Phe Pro Glu Leu Gly Ala Glu Leu Ala Arg Arg Leu Ser Gly
325 330 335
Gln Leu Pro Ala Asn Trp Glu Ser Lys Leu Pro Thr Tyr Thr Ala Lys
340 345 350
Asp Ser Ala Val Ala Thr Arg Lys Leu Ser Glu Thr Val Leu Glu Asp
355 360 365
Val Tyr Asn Gln Leu Pro Glu Leu Ile Gly Gly Ser Ala Asp Leu Thr
370 375 380
Pro Ser Asn Leu Thr Arg Trp Lys Glu Ala Leu Asp Phe Gln Pro Pro
385 390 395 400
Ser Ser Gly Ser Gly Asn Tyr Ser Gly Arg Tyr Ile Arg Tyr Gly Ile
405 410 415
Arg Glu His Ala Met Gly Ala Ile Met Asn Gly Ile Ser Ala Phe Gly
420 425 430
Ala Asn Tyr Lys Pro Tyr Gly Gly Thr Phe Leu Asn Phe Val Ser Tyr
435 440 445
Ala Ala Gly Ala Val Arg Leu Ser Ala Leu Ser Gly His Pro Val Ile
450 455 460
Trp Val Ala Thr His Asp Ser Ile Gly Val Gly Glu Asp Gly Pro Thr
465 470 475 480
His Gln Pro Ile Glu Thr Leu Ala His Phe Arg Ser Leu Pro Asn Ile
485 490 495
Gln Val Trp Arg Pro Ala Asp Gly Asn Glu Val Ser Ala Ala Tyr Lys
500 505 510
Asn Ser Leu Glu Ser Lys His Thr Pro Ser Ile Ile Ala Leu Ser Arg
515 520 525
Gln Asn Leu Pro Gln Leu Glu Gly Ser Ser Ile Glu Ser Ala Ser Lys
530 535 540
Gly Gly Tyr Val Leu Gln Asp Val Ala Asn Pro Asp Ile Ile Leu Val
545 550 555 560
Ala Thr Gly Ser Glu Val Ser Leu Ser Val Glu Ala Ala Lys Thr Leu
565 570 575
Ala Ala Lys Asn Ile Lys Ala Arg Val Val Ser Leu Pro Asp Phe Phe
580 585 590
Thr Phe Asp Lys Gln Pro Leu Glu Tyr Arg Leu Ser Val Leu Pro Asp
595 600 605
Asn Val Pro Ile Met Ser Val Glu Val Leu Ala Thr Thr Cys Trp Gly
610 615 620
Lys Tyr Ala His Gln Ser Phe Gly Ile Asp Arg Phe Gly Ala Ser Gly
625 630 635 640
Lys Ala Pro Glu Val Phe Lys Phe Phe Gly Phe Thr Pro Glu Gly Val
645 650 655
Ala Glu Arg Ala Gln Lys Thr Ile Ala Phe Tyr Lys Gly Asp Lys Leu
660 665 670
Ile Ser Pro Leu Lys Lys Ala Phe
675 680
<210> 124
<211> 370
<212> PRT
<213> Saccharomyces cerevisiae CEN.PK-1D
<400> 124
Met Ser Glu Ser Pro Met Phe Ala Ala Asn Gly Met Pro Lys Val Asn
1 5 10 15
Gln Gly Ala Glu Glu Asp Val Arg Ile Leu Gly Tyr Asp Pro Leu Ala
20 25 30
Ser Pro Ala Leu Leu Gln Val Gln Ile Pro Ala Thr Pro Thr Ser Leu
35 40 45
Glu Thr Ala Lys Arg Gly Arg Arg Glu Ala Ile Asp Ile Ile Thr Gly
50 55 60
Lys Asp Asp Arg Val Leu Val Ile Val Gly Pro Cys Ser Ile His Asp
65 70 75 80
Leu Glu Ala Ala Gln Glu Tyr Ala Leu Arg Leu Lys Lys Leu Ser Asp
85 90 95
Glu Leu Lys Gly Asp Leu Ser Ile Ile Met Arg Ala Tyr Leu Glu Lys
100 105 110
Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro Asp Val
115 120 125
Asn Asn Thr Phe Asn Ile Asn Lys Gly Leu Gln Ser Ala Arg Gln Leu
130 135 140
Phe Val Asn Leu Thr Asn Ile Gly Leu Pro Ile Gly Ser Glu Met Leu
145 150 155 160
Asp Thr Ile Ser Pro Gln Tyr Leu Ala Asp Leu Val Ser Phe Gly Ala
165 170 175
Ile Gly Ala Arg Thr Thr Glu Ser Gln Leu His Arg Glu Leu Ala Ser
180 185 190
Gly Leu Ser Phe Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr Leu
195 200 205
Asn Val Ala Val Asp Ala Cys Gln Ala Ala Ala His Ser His His Phe
210 215 220
Met Gly Val Thr Lys His Gly Val Ala Ala Ile Thr Thr Thr Lys Gly
225 230 235 240
Asn Glu His Cys Phe Val Ile Leu Arg Gly Gly Lys Lys Gly Thr Asn
245 250 255
Tyr Asp Ala Lys Ser Val Ala Glu Ala Lys Ala Gln Leu Pro Ala Gly
260 265 270
Ser Asn Gly Leu Met Ile Asp Tyr Ser His Gly Asn Ser Asn Lys Asp
275 280 285
Phe Arg Asn Gln Pro Lys Val Asn Asp Val Val Cys Glu Gln Ile Ala
290 295 300
Asn Gly Glu Asn Ala Ile Thr Gly Val Met Ile Glu Ser Asn Ile Asn
305 310 315 320
Glu Gly Asn Gln Gly Ile Pro Ala Glu Gly Lys Ala Gly Leu Lys Tyr
325 330 335
Gly Val Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Thr Thr Glu Asp
340 345 350
Val Leu Arg Lys Leu Ala Ala Ala Val Arg Gln Arg Arg Glu Val Asn
355 360 365
Lys Lys
370
<---
Группа изобретений относится к модифицированному микроорганизму, продуцирующему микоспорин-подобную аминокислоту (MAA), и способу получения MAA с использованием указанного микроорганизма. Предложен модифицированный микроорганизм, предназначенный для продуцирования микоспорин-подобной аминокислоты, где микоспорин-подобная аминокислота представляет собой соединение, которое имеет центральное кольцо циклогексанона или циклогексенимина. При этом микроорганизм экспрессирует кластер генов биосинтеза MAA и где активность по меньшей мере одного белка, выбранного из группы, состоящей из 2-дегидро-3-дезоксифосфогептонатальдолазы (AroG), фосфоенолпируватсинтетазы (Pps) и транскетолазы (TktA), модифицирована для усиления путем введения гена, кодирующего указанный по меньшей мере один белок, в данный микроорганизм, экспрессирующий кластер генов биосинтеза MAA. При этом микроорганизм демонстрирует увеличенную продукцию микоспорин-подобной аминокислоты по сравнению с родительским или немодифицированным микроорганизмом, не имеющим указанную модификацию и экспрессирующим только кластер генов биосинтеза MAA. Также предложен способ получения микоспорин-подобной аминокислоты, включающий культивирование указанного модифицированного микроорганизма в среде и выделение микоспорин-подобной аминокислоты из культивированного микроорганизма или среды. Группа изобретений может быть эффективно использована в получении микоспорин-подобной аминокислоты. 2 н. и 5 з.п. ф-лы, 27 табл., 19 пр.
Препарат aphanizomenon flos aquae, экстракты и очищенные компоненты экстрактов для лечения неврологических, нейродегенеративных и аффективных расстройств