Труба вгп что это: Что такое труба ВГП? Применение и базовые характеристики.
alexxlab | 22.06.1994 | 0 | Разное
Что такое труба ВГП? Применение и базовые характеристики.
ВГП – что означает аббревиатура?
Аббревиатура расшифровывается следующим образом: В – водо, Г – газо, П – проводная. Из названия сразу становится ясно, основное назначение такого вида стройматериалов – создание трубопроводов для проведения воды и газа. Производится труба ВГП строго по нормам ГОСТ 3262 из стали.
Особенность, отличающая трубу ВГП, – наличие усиленного электросварного шва. Это позволяет допустить более высокое внутритрубное давление. Также труба ГОСТ 3262 отличается высокой стойкостью к образованию коррозии.
Характеристики
Трубы ГОСТ 3262 целиком и полностью следуют характеристикам, которые им прописал государственный стандарт.
- Длина
Существует три вида труб:
- мерные (длина от 4мдо 12м)
- кратные мерным. Их длина колеблется от 4 до 12 м, но на каждый рез производится припуск в 5 мм, а на всю длину допустимо продольное отклонение в 10 мм
- немерные
Важно, что если резьба была нанесена накатыванием, то нормой считается уменьшение внутреннего диаметра на 1 -10%.
- Масса
Масса газоводопроводной трубы полностью зависит от толщины стен трубы и размера наружного диаметра. При выборе ВГП также стоит брать во внимание то, что оцинкованные трубы легче необработанных.
Далее приведена таблица примерных значений веса труб, в зависимости от диаметра. Важно, что значения масс приблизительны и подходят для выбранной вами трубы, если только плотность стали, использованной в производстве, была = 7,85 г/см3.
- Условный проход (далее УП)
От него зависит пропускная способность трубы ВГП. Обычно, параметры УП не совпадают с размером внутреннего сечения стальной трубы, так как первый напрямую зависит от ширины стенки. Параметры и значения УП регулируются и контролируются ГОСТом 28338-89.
Группа Точности
Водогазопроводные трубы подразделяются на 2 группы точности:
- ВГП обычной точности
- ВГП повышенной точности
Из материалов первой группы создают бытовые водогазопроводы и проводят отопительные системы. Ну а стальные ВГП трубы повышенной точности используют как детали сложных конструкций, транспортирующих воду и газ.
Компания “ТриоСтрой” предлагает широкий ассортимент водогазопроводных труб разных диаметров и длин. Пройдя в каталог, вы можете подобрать металлопрокатные изделия подходящие вам по всем параметрам.
расшифровка, что значит и описание, как выбрать
На чтение 8 мин. Просмотров 3.9k. Обновлено
Труба ВГП это — стальная электросварная труба для бытовых и магистральных газо- и водопроводов: Водо — В, Газо — Г, Проводная — П. Не деформируется под влиянием высоких температур, прочная, износостойкая. Для предотвращения коррозии, ВГП производится по ГОСТу 3262 из оцинкованной стали.
Для прокладки теплотрассы или водопроводной линии чаще используются стальные водогазопроводные трубы. Ведь далеко не везде, можно применять пластиковые — в газовой промышленности они запрещены.
Мы расскажем, что собой представляет труба и как расшифровывается аббревиатура ВГП, как какие есть виды, как она маркируется. Вы узнаете о технологии изготовления, и о том, какую выбрать трубу для конкретной области применения, отталкиваясь основных характеристик.
ВГП труба
Что означает маркировка труба — ВГП ? Это вид профильного металлопроката, с особыми характеристиками. К ним относится усиленный шов, который позволяет им работать и перекачивать жидкость в условиях повышенного давления.
Маркировка и расшифровка
Для маркировки используется аббревиатура ВГП. Как расшифровать ВГП — это означает водогазопроводная труба. Понятно, что её предназначение — газовые и водопроводные магистрали. Ещё одно встречающееся обозначение ДУ, расшифровывается — условный проход.
Рассмотрим на примере как расшифровывать маркировку ВГП ДУ50 — металлопрокат с диаметром 2 дюйма, если ВГП ДУ25 — 1 дюйм.
Кроме того, можно встретить следующие обозначения:
- «П» — расшифровывается, как изделие повышенной точности;
- «Р» — наличие резьбы;
- «Д» — длинная резьба;
- «Н» — некатаная резьба;
- «М» — муфта;
- «Ц» — оцинкованное покрытие.
На трубопроводе с диаметром более чем 159 мм, и толщиной стен 3,5 мм, маркировка ставится на каждом изделии. Если диаметр или толщина стен меньше, или металлопрокат имеет светлую поверхность, то маркировка указана на ярлыке, расположенном на пакете.
Для клеймения газоводопроводной продукции используется не смываемая краска. На изделиях клеймо размещается на расстоянии 20 — 500 мм от края, и подчёркивается краской яркого цвета.
В маркировке указан диаметр и длина изделия ВГП, марка стали, товарный знак или название производителя.
Наличие в маркировке надписи — «Страна — изготовитель» означит, что изделие было изготовлено на экспорт, и имеет повышенное качество.
ГОСТ
Ассортимент, качество и иные характеристики водогазопроводных трубопроводов указаны в госстандарте 3262-75. В этом документе прописаны их функциональные особенности и возможности применения.
Краткая информация из Госта:
- оцинкованные виды тяжелее «чёрных» на 3%;
- расхождения по массе возможны максимум на 8%;
- допустимая кривизна 2 мм на 1 м.
Особое значение в описании труб ВГП отводится условному проходу (ДУ) и толщине стен. Эти показатели, плюс диаметр, должны отвечать нормам ГОСТа. Стандартные проходы по ГОСТу 3262-75 — 6, 8, 10, 15, 20 мм.
Кроме того, согласно стандартам к ВГП металлопрокату предъявляется ряд требований:
- Отсутствие вздутий и сколов;
- Не должно быть расслоений и трещин с торцов;
- Резка изделия строго под прямым углом, допустимое несоответствие — 2 градуса;
- Резочные заусенцы максимум 0,5 мм.
По ГОСТу возможны небольшие дефекты: рябизна или вмятины, но они не должны отражаться на эксплуатационных характеристиках продукции.
Трубопроводы ВГП имеют гигиенические сертификаты, они выдаются после прохождения санитарно-эпидемиологической экспертизы.
Классификация водогазопроводных труб
Сырьём для газоводопроводных труб служит углеродистая сталь. Трубопровод имеет форму цилиндра, стандартный размер 4 — 12 метров. Сортируется по материалу изготовления, методике производства и обработки.
Металлопрокат бывает двух видов:
- Чёрный — сделанный из чёрной стали, с поверхностью без защитного слоя. Показатель точности обычный.
- Оцинкованный стальной — имеет цинковое покрытие 30 мкм, за счёт него, увеличивается срок службы. Данные модели более точно следуют требования ГОСТа в плане длины, толщины стенок, наружного диаметра, они имеют высокую антикоррозийную способность.
Оцинкованные изделия весят больше не оцинкованных. Помимо этого, они различаются размером, он определяется условным проходом. Наружный диаметр не изменён, отличие только в толщине стен, и соответственно в размере ДУ. Толщина стен в приделах 2 — 5,5 мм, диаметр снаружи 10 — 165 мм.
Трубопровод ВГП бывает электросварным и бесшовным:
- Бесшовный — для его производства применяются стальные изделия не имеющие швов. По способу изготовления бывают горячекатаными или холоднокатаными. Холоднокатаные модели более устойчивые.
- Электросварной — производится из листов проката путём сварки или формовки. Есть прямошовные — шов проходит вдоль трубы, спиралешовные — шов по спирали.
Кроме этого, водогазопроводный металлопрокат встречается:
- без резьбы;
- с резьбой с обоих краёв, которая нанесена накаткой или нарезкой.
Толщина стен трубного проката из «чёрного» металла различна, именно она влияет на его разделение на:
- лёгкие;
- обыкновенные;
- усиленные.
Лёгкие виды применяются при давлении не более 25 кгс/см2, усиленные — 32 кгс/см2.
Преимущества и недостатки использования
Водогазопроводный трубопровод — универсальное изделие, его преимущества:
- высокое качество стали;
- повышенная устойчивость к коррозии — это достигается за счёт того, что изделия стали оцинковывать, этот слой защищает их от образования ржавчины;
- наличие усиленных швов у «чёрных» моделей;
- высокий показатель прочности, при незначительном весе;
- стойкость к повышенному давлению — что увеличивает срок службы;
- многообразие в выборе — лёгкие, обыкновенные, усиленные;
- разнообразие резьбы — возможно нанесение на заказ;
- строгое соответствие ГОСТу — осуществляется обязательный гидровихревой контроль;
- высокое качество, при не высокой цене;
- большой выбор — бесшовные, горячекатаные, с электросварным швом, холоднокатаные;
- разнообразие фитингов — муфты, тройники;
- низкий коэффициент расширения — не деформируется под воздействием температур;
- имеет хорошую теплопроводность;
- допускается применение в напорных конструкциях;
- герметичен — может использоваться для доставки газа, кислот.
Высокий уровень теплопроводности приводит к охлаждению транспортируемого сырья. Чтобы это избежать, рекомендовано при использовании водогазопроводного металлопроката производить дополнительную теплоизоляцию.
К недостаткам можно отнести только наличие сварных швов, точнее, их некачественную сварку.
Технология изготовления
Трубы оцинкованного и неоцинкованного типа изготавливаются из углеродистой стали, по строгим требованиям ГОСТа 1050. Производятся на автоматизированных линиях, поэтому продукция высокого качества.
Существует две методики изготовления:
- бесшовные — путём проката или прессования;
- со швом — с помощью электросварки делается шов.
Бесшовные виды — на них отсутствует шов. Изготавливаются двумя способами — холодным или горячим. Горячедеформированные модели получаются из сплошной заготовки путём горячей деформации.
Холоднодеформированные производятся по следующим методикам:
- методом холодной катки;
- путём вытягивания.
Все холоднокатаные модели подвергаются гидравлическому испытанию, химической и термообработке. Они имеют повышенную прочность, надёжность, долговечность, по сравнению с видами произведёнными по горячей методике.
Технология производства сварных видов следующая:
- подготовка стальных заготовок (штрипсов) — длинных металлических полос, изготовленных согласно ГОСТу, методом горячей катки;
- загибка стальных полос в трубы на специализированном оборудовании;
- электросварка полученного стыка.
У сварных водогазопроводных моделей, шов должен быть усиленный, так как — это самое хрупкое место. Поэтому, он обязательно исследуется на рентгенографии.
Где применяется
Сфера применения водогазопроводных трубопроводов — холодные и горячие водомагистрали, газопроводы низкого давления, отопительные системы. В водопроводных магистралях трубы ВГП соединяются сваркой или резьбовыми соединениями.
Ещё, водогазопроводный металлопрокат применяется в сельскохозяйственной сфере, и в отрасли, связанной с добычей нефти.
Кроме того, трубопровод из стали используют при изготовлении металлоконструкций — заборов, небольших архитектурных форм.
Как выбрать, на что обратить внимание
Рекомендовано приобретать водогазопроводный трубопровод известных на рынке компаний. При покупке нужно отталкиваться от назначения, классификации, технических характеристик и эксплуатационных условий. Эти моменты оговорены в ГОСТах, справочнике металлопроката и описаны в нашей статье выше.
Особое внимание надо обращать на сырьё и способ изготовления. Оцинкованные виды меньше подвержены коррозийному воздействию, соответственно служат они дольше.
В помощь тем, кто хочет приобрести трубы ВГП, предусмотрено нормирование размера:
- Считается мерной длиной — от 4 до 12 метров;
- Есть немерная — но она должна быть в рамках мерной.
Вся продукция проходит контроль качества, но по требованию клиента в специальной лаборатории осуществляется повторный анализ. Каждая труба ещё раз визуально осматривается на кривизну, а одно изделие из партии проверяется на качество.
Если вы не уверены в своих силах в этой области, то лучше в вопросе выбора довериться специалистам.
Цены на рынке
При покупке нужно знать, что стоимость указана не за единицу длины, а за единицу массы, обычно прописывается цена за одну тонну. При этом, надо понимать, что изделия с оцинкованным покрытием весят на 3% больше, чем «чёрные».
Цены на модели из стали формируются с учётом технических свойств, на неё влияет внутренний диаметр и толщина стен. Стоимость лёгких видов с тонкими стенами ниже, чем у средних, или имеющих толстые стенки.
В зависимости от размера партии, общая цена может корректироваться. Чем больше партия, тем цена будет ниже.
Особенности монтажа
Специалисты при установке металлопроката ВГП используют следующие методики:
- Трубопровод соединяется муфтами на специальных станках. Этот способ используется только на обыкновенных трубах.
- Соединение осуществляется электросваркой.
Подводя итог, скажем, что хотя сегодня широкое распространение получили изделия из полимера, но водогазопроводные трубы не заменимы, и продолжают повсеместно использоваться особенно в сфере ЖКХ.
Трубы водогазопроводные – Металлобаза МеталлСтандарт Санкт-Петербург
При производстве конструкции используется сталь с высокой концентрацией углерода, при этом по своим характеристикам металл должен соответствовать государственным стандартам. Такие характеристики стали способны выдержать различные условия использования, кроме того, у них нет ограничений по процессу сваривания.
При производстве используется сталь листового типа, которая подвергается процессу сварки на специализированном оборудовании. При этом в месте соединения можно допустить незначительное уменьшение размера изделия.
Труба данного типа может иметь стороны различной толщины (тонкие, средние или усиленные). Именно от толщины деталей зависит, какой уровень давления способно выдержать изделие.
Такая труба повсеместно применяется в жилищных условиях, при оказании коммунальных услуг. Именно из этих труб состоит весь механизм водоснабжения, с помощью них осуществляется подача отопления в современные квартиры.
Что касается теоретического веса таких конструкций, то он вычисляется в соответствии с параметрами номинального типа (это справочное значение). В качестве наиболее распространенного размера этого проката выступает значение 6 метров, однако можно встретить и другие параметры.
Купить трубы электросварные водогазопроводные
Хотите купить такую трубу? Обратитесь в компанию «МеталлСтандарт»: наша фирма на протяжении нескольких лет занимается продажами качественных конструкций, изготовленных из металла. Свою деятельность мы осуществляем на территории СПб, области и некоторых других регионов страны.
Чем выгодно сотрудничество именно с нами? Вот основные причины:
- При изготовлении таких изделий используются качественные материалы, которые отличаются прочностью, надежностью и износостойкостью. Именно поэтому трубы прослужат длительное время без протечек и других неприятностей.
- Конструкции изготавливаются на современном оборудовании, способном изготавливать изделия с максимальной степенью точности.
- Стоимость таких деталей вполне приемлема, поэтому позволить себе закупку труб может любой клиент. С точной ценой вы можете ознакомиться в каталоге.
- Благодаря широкому ассортименту у вас появляется возможность выбрать трубу любой толщины, в зависимости от потребностей.
- Клиент может рассчитывать на оперативную доставку товара по определенному адресу, это позволяет существенно сэкономить время.
- У нас имеется удобный каталог с четкими фотографиями и подробным описанием каждой продукции. Это существенно облегчает выбор клиента.
Таким образом, труба для транспортировки газа и воды – это нужное изделие, которое широко применяется в хозяйственной сфере. Для того чтобы сделать заказ, просто позвоните нам по телефону, допускается также оставить заявку на сайте. Если у вас возникли вопросы по поводу выбора, всегда можно обратиться к специалисту, который расскажет вам о характеристиках определенного проката, его специфике и достоинствах, особенностях применения и цене. Благодаря этому вы совершите действительно полезную покупку.
Что касается оплаты, то она осуществляется как наличными денежными средствами, так и безналичным способом (мы стараемся, чтобы каждому клиенту было удобно сотрудничать с нами). Продукция отправляется на доставку сразу же после оплаты, срок доставки зависит от вашего населенного пункта.
Трубы электросварные и водогазопроводные отличия
При приобретении труб стальных прямошовных клиенты сталкиваются с вопросом – что лучше: труба электросварная или труба водогазопроводная? Можно ли заменить трубу ВГП на электросварную?
На первый взгляд данные трубы имеют схожий внешний вид, но технические характеристики и сферы применения у них разные.
И электросварные трубы и трубы ВГП производят из листового проката на специальных станах. Продольный сварочный шов выполняют сперва с наружной, а потом внутренней стороны. У труб ВГП шов более усилен. Поэтому стоимость труб водогазопроводной будет чуть выше, чем электросварных.
Отличия трубы э/с и трубы ВГП приведены в таблице:
ТРУБА ЭЛЕКТРОСВАРНАЯ |
ТРУБА ВОДОГАЗОПРОВОДНАЯ |
ГОСТ | |
10704-91 (сортамент) 10705-80 ( технические условия) |
3262-75 |
СТАЛЬ | |
Ст.1, ст.2, ст.3, ст.4, ст. 08, ст.20, ст.10 | Ст1пс, ст2пс, ст3пс, ст1сп, ст2сп, ст3сп, ст1кп, ст2кп, ст3кп, ст10, ст.20, ст 08пс, ст.08кп |
ГИДРАВЛИЧЕСКОЕ ДАВЛЕНИЕ | |
6 МПа (трубы диаметра 10-102 мм) 3 МПа ( трубы диаметра более 102 мм) |
2.4 МПа (3.1 МПа – для усиленных) |
НАРУЖНЫЙ ДИАМЕТР | |
10.0-1420.0 мм | 10.2-165.0 мм |
ТОЛЩИНА СТЕНОК | |
1.0 – 32.0 мм | 2.0-5.5 мм |
МАРКИРОВКА | |
Измеряют и обозначают по наружному диаметру | Измеряют и обозначают по условному проходу |
ПРИМЕНЕНИЕ | |
|
|
Электросварные трубы имеют широкое применения, в то время как трубы ВГП в основном применяют для внутреннего водоснабжения, для небольших газопроводов. Наиболее востребованы жилищно-коммунальными службами.
Стоит также отменить, что согласно ГОСТ отклонения в толщине у труб ВГП может быть не более 15%, в то время как у электросварных – не более 10%.
У труб ВГП маркировка обозначается по ДУ и четко выдержан размер условного прохода, что объясняет спрос у коммунальных служб.
Заменять водогазопроводные трубы на электросварные не целесообразно, так как меньший диаметр не позволяет создавать больший поток и сложные системы.
Узнать цену и наличие на складе трубы ВГП здесь.
Возврат к списку
Распродажа полосы оцинкованной 40х6,0 и 25х4,0 дл.6м !
|
Труба водогазопроводная (труба вгп): одна из разновидностей электросварных труб, оснащенная усиленным швом. Такая труба отличается более высокой прочностью, а благодаря редуцированию становится устойчивой к коррозии. Изготавливают водогазопроводные трубы из черной стали в соответствии с ГОСТ 3262-75. Такие трубы могут иметь накатанную или нарезанную цилиндрическую резьбу, также для увеличения антикоррозионной стойкости могут быть оцинкованные (масса таких труб будет больше, чем у обычных, на 3 %). Одной из основных характеристик водогазопроводных труб является условный проход – соотношение диаметра внутреннего сечения с внешним и с толщиной стенки. Трубы вгп разделяют на легкие, обычные и усиленные, в зависимости от толщины стенки.
Трубы водогазопроводные, применяемые для водопроводов и газопроводов, а также для системы отопления и деталей конструкций по длине трубы изготавливают от 4 до 12 м. ГОСТ 3262-75 трубы стальные водогазопроводные
Труба водогазопроводная широко используется при монтаже систем водопровода, подачи газа и отопления в жилых домах. Труба водогазопроводная оцинкованная нашла применение при прокладке в агрессивных и влажных средах, а также для изготовления различных конструкций, машин и механизмов. По сути, этот вид труб стал основой работы не только всей газовой службы, но и всего коммунального хозяйства. Без них на сегодняшний день невозможно ввести в эксплуатацию ни жилые, ни промышленные объекты. Все трубы имеют установленный срок использования, по истечению которого их меняют на новые в плановом порядке. Связано это с особенностью и огромным значением для жизнеобеспечения жилых районов транспортируемых по ним сред.
Трубы водогазопроводные различаются по размерам. В строительстве и коммунальном хозяйстве одновременно используется, чуть ли не весь сортамент выпускаемой продукции этого наименования. Цены на трубы указывают в расчете на их вес, а точнее за одну тонну.При необходимости, для более удобного расчета, цены на трубы вгп указываются за метр погонный. При отсутствии под рукой необходимых справочных данных вы можете связаться с менеджерами нашей компании для получения более точных расчетов. Размеры труб водогазопроводных определяются по условному проходу, выраженному в миллиметрах или дюймах. При этом внешний размер трубы остается неизменным, а меняется только размер условного прохода и толщина стенки изделия. |
ВГП – это… Что такое ВГП?
ВИРТУАЛЬНЫЙ ГЕОМАГНИТНЫЙ ПОЛЮС — (ВГП) – положение геомагнитного полюса, определенное по элементам геомагнитного поля, например, по склонению и наклонению, измеренным в некоторой точке (прямые обсерваторские наблюдения или по естественной остаточной намагниченности) в… … Палеомагнитология, петромагнитология и геология. Словарь-справочник.
Венгрия — Венгерская Республика, гос во в Центр. Европе. Название от этнонима венгры. Сами же венгры называют себя мадьяры, а свою страну Мадьярорсаг (Magyarorszag) страна мадьяров . См. также Трансильвания. Географические названия мира: Топонимический… … Географическая энциклопедия
ПАЛЕОМАГНИТОЛОГИЯ — учение о палеомагнетизме … Физическая энциклопедия
Труба (изделие) — Стиль этой статьи неэнциклопедичен или нарушает нормы русского языка. Статью следует исправить согласно стилистическим правилам Википедии. У этого термина существуют и другие значения, см. Труба. Труба … Википедия
Структура почвенного покрова — (СПП) закономерное пространственное размещение почв на небольших территориях, выявляемое при детальном картографировании их почвенного покрова и образованное многократным повторением одного или нескольких различных основных образующих её… … Википедия
Вяртсиля — У этого термина существуют и другие значения, см. Вяртсиля (значения). Посёлок городского типа Вяртсиля Герб … Википедия
Окна открой! — Дата(ы) конец июня Место(а) проведения Санкт Петербург, Россия Года 2000 настоящее время Жанр(ы) рок музыка … Википедия
Борский трубный завод — Открытое акционерное общество Борский трубный завод Тип Открытое акционерное общество Год основания 1935 год Расположение … Википедия
КОРОЛЕВСКИЙ ТРУБНЫЙ ЗАВОД — Находится в г. Москва, Россия. Выпускает:трубы ВГП ГОСТ 3262 75 Ду 25 50 мм;трубы электросварные ГОСТ 10704 91 диаметром 57 108 мм … Металлургический словарь
Поиск по сайту Новости 04.12.21 Открытие магазина 07.12.2021 7 декабря 2021 года открытие нашего розничного магазина сантехники и крепежа КрепСантех, по адресу: г. Тверь, Петербургское ш., д. 45. Ждём Вас в гости к нам! 09.08.21 Открытие магазина Скоро открытие нашего розничного магазина САНТЕХНИКИ И КРЕПЕЖА! 06.04.21 Труба 30х30х2 AISI304 / 1.4301 / X5CrNi18-10 / 08Х18Н10 К нам на склад поступило большое количество нержавеющей профильной трубы 30х30х2 AISI304 / 1.4301 / X5CrNi18-10 / 08Х18Н10. В наличии более 5000м – по всем вопросам звоните нашему менеджеру Алексею +7-963-154-88-04 06.08.20 Приход метизов Поступление на склад метизов производства Северсталь 06.08.20 Чушка свинцовая Приход чушки свинцовой |
Труба водогазопроводная – это стальная сварная труба, которая применяется для газопроводов и водопроводов, а также для системы отопления и деталей конструкций. Материал, из которого производится труба стальная ВГП – углеродистая сталь. Технология производства состоит в следующем:
Основной документ, который регламентирует нормативное качество изготовленных изделий ВГП труб – ГОСТ 3262-75. По материалу, методу изготовления и способу обработки труб ВГП их классифицируют по следующему принципу:
Кроме перечисленных параметров, при изготовлении труб учитываются также некоторые размеры трубы ВГП: условный проход (обозначается как ДУ) и толщина стенки. Диаметры ВГП труб и прочие параметры должны в точности соответствовать ГОСТу. Трубы ВГП выпускают в следующих группах точности:
По длине трубы изготовляют от 4 до 12 м: а) мерной или кратной мерной длины с припуском на каждый рез по 5 мм и предельным отклонением на всю длину плюс 10 мм; б) немерной длины. Стоимость таких труб устанавливается, отталкиваясь не от длины изделия, а от его веса. Вес трубы ВГП стальной оцинкованного типа отличается от веса обычных на 3% в большую сторону. Для изготовления труб ВГП стальных повышенной точности применяют стали согласно ГОСТ 1050, причем их состав и механические свойства не подлежат нормированию. Труба ВГП черная в зависимости от толщины стенки подразделяется на следующие типы:
ГОСТ 3262-75 нормирует толщину стенки этих изделий. Также в этом ГОСТе в табличном виде представлены такие параметры, как наружный диаметр труб ВГП, условный проход, масса и толщина стенки. ВГП трубы предназначены для работы при гидравлическом давлении в 25 кгс/см2 (для легких труб) и 32 кгс/см2 (для усиленных).
|
Сборочный трубопровод ВГП
Достижения в области технологий секвенирования за последние несколько десятилетий произвели революцию в области геномики, позволив сократить как время, так и ресурсы, необходимые для сборки генома de novo . До недавнего времени технологии секвенирования второго поколения (также известные как секвенирование следующего поколения или NGS) позволяли производить высокоточные, но короткие (до 800 п.н.) риды, протяженность которых была недостаточной, чтобы справиться с трудностями, связанными с повторяющимися областями.Сегодня так называемые технологии секвенирования третьего поколения (TGS), обычно известные как одномолекулярное секвенирование в реальном времени (SMRT), стали доминирующими в de novo сборке больших геномов. TGS может использовать нативную ДНК без амплификации, что снижает ошибку и погрешность секвенирования (Hon et al. 2020, Giani et al. 2020). Совсем недавно компания Pacific Biosciences представила высокоточное секвенирование (HiFi), которое дает риды длиной 10-25 кб с минимальной точностью 99% (Q20).В этом руководстве вы будете использовать чтения HiFi в сочетании с данными дополнительных технологий секвенирования для создания высококачественной сборки генома.
Расшифровка структурной организации сложных геномов позвоночных в настоящее время является одной из самых больших проблем в геномике (Frenkel et al. 2012). Несмотря на значительный прогресс, достигнутый за последние годы, остается ключевой вопрос: какая комбинация данных и инструментов может обеспечить сборку высочайшего качества? Чтобы адекватно ответить на этот вопрос, необходимо проанализировать два основных фактора, определяющих сложность процессов сборки генома: повторяющееся содержание и гетерозиготность.
Повторяющиеся элементы можно разделить на две категории: вкрапленные повторы, такие как мобильные элементы (TE), которые встречаются в нескольких локусах по всему геному, и тандемные повторы (TR), которые встречаются в одном локусе (Tørresen et al. 2019) . Повторяющиеся элементы являются важным компонентом эукариотических геномов, составляя более трети генома млекопитающих (Sotero-Caio et al. 2017, Chalopin et al. 2015). Что касается тандемных повторов, то, по разным оценкам, они присутствуют по крайней мере в одной трети белковых последовательностей человека (Marcotte et al. 1999). Содержание TE является одним из основных факторов, обусловливающих отсутствие преемственности в реконструкции геномов, особенно в случае крупных, поскольку содержание TE сильно коррелирует с размером генома (Sotero-Caio et al. 2017). С другой стороны, TR обычно приводят к коллапсу локальной сборки генома, особенно когда их длина близка к длине прочтений (Tørresen et al. 2019).
Гетерозиготность также является важным фактором сборки генома. Фазирование гаплотипов, то есть идентификация аллелей, расположенных на одной и той же хромосоме, стало фундаментальной проблемой в гетерозиготных и полиплоидных сборках генома (Zhang et al. 2020). Когда эталонная последовательность недоступна, современная стратегия состоит в построении строкового графа с вершинами, представляющими чтения, и ребрами, представляющими согласованные перекрытия. На таком графе после транзитивной редукции гетерозиготные аллели в графе строк представлены кружками. В сочетании с данными Hi-C этот подход позволяет выполнить полную диплоидную реконструкцию (Angel et al. 2018, Zhang et al. 2020, Dida and Yi 2021).
Консорциум G10K запустил проект Vertebrate Genomes Project (VGP), целью которого является создание высококачественных, почти безошибочных, без пробелов, аннотированных эталонных геномных сборок на уровне хромосом, с разбивкой по фазам гаплотипов для каждого вида позвоночных (Rhie и др. 2021). В этом учебном пособии вы шаг за шагом проведете сборку высококачественного генома с использованием конвейера сборки VGP.
Повестка дня
В этом уроке мы рассмотрим:
- Обзор сборочного конвейера ВГП
- Получить данные
- Анализ профиля генома
- Получение спектров k-mer с помощью Meryl
- Профилирование генома с помощью GenomeScope2
- Поэтапная сборка HiFi с hifiasm
- Сборка Genome с hifiasm
- Первоначальная оценка сборки
- Обработка после сборки
- Удаление гаплотипической дупликации с помощью purge_dups
- Второй этап оценки сборки
- Гибридные леса
- Гибридные леса с использованием данных Bionano
- Гибридные леса на основе картографических данных Hi-C
- Заключение
Этот тренинг является адаптацией конвейера сборки VGP 2.0 (рис. 1).
Рисунок 1: Конвейер VPG 2.0. Конвейер начинается со сборки считываний HiFi в контиги, в результате чего получаются первичная и альтернативная сборки. Затем дублированные и ошибочно назначенные контиги будут удалены с помощью purge_dups. Наконец, оптические карты Bionano и данные HiC используются для создания первичной сборки каркаса.Чтобы облегчить понимание, обучение было организовано в четыре основных раздела: анализ профиля генома, поэтапная сборка HiFi с hifiasm, обработка после сборки и гибридные леса.
Чтобы сократить время вычислений, мы будем собирать образцы из дрожжей Saccharomyces cerevisiae S288C, широко используемого лабораторного штамма, выделенного в 1950-х годах Робертом Мортимером. Использование S. cerevisae , одного из наиболее интенсивно изучаемых эукариотических модельных организмов, имеет дополнительное преимущество, позволяющее нам с большой точностью оценить окончательный результат нашей сборки. Для этого руководства мы создали набор синтетических прочтений HiFi, соответствующих теоретическому диплоидному геному.
детали Генерация синтетических ридовСинтетические чтения HiFi были созданы с использованием сборки S288C в качестве эталонного генома. С этой целью мы использовали HIsim, симулятор дробовика HiFi. Используемые команды подробно описаны ниже:
./FastK -T8 -Nsynthetic -k40 -t4 ./hifi_reads.fastq.gz ./FastK -T8 -Nsynthetic -k40 -p:synthetic.ktab .hifi_reads.fastq.gz ./Histex -G синтетический > синтетический.гистограмма ./GeneScopeFK.R -i синтетическая.гистограмма -o ./синтетика -к 40 -п 1 ./HImodel -v -osynthetic -g10:55 -e5 -T8 ./synthetic ./HIsim ./GCF_000146045.2_R64_genomic.fasta ./synthetic.model -p.2,.2 -c30 -r1 -U -f -h -e
Выбранная частота мутаций составила 2%. Обратите внимание, что HIsim генерирует синтетические чтения в формате FASTA. Это прекрасно подходит для иллюстрации рабочего процесса, но вы должны знать, что обычно вы будете работать с считываниями HiFi в формате FASTQ.
Первый шаг — получить наборы данных от Зенодо.Конвейер сборки VGP использует данные, сгенерированные различными технологиями, включая чтение PacBio HiFi, оптические карты Bionano и карты взаимодействия хроматина Hi-C.
практические занятия Практические занятия: загрузка данных
- Создать новую историю для этого урока
Импорт файлов из Zenodo
Импорт оставшихся наборов данных из Zenodo
HiFi считывает предварительную обработку с помощью
CutadaptОбрезка адаптера обычно означает обрезку последовательности адаптера на концах операций чтения, где последовательность адаптера обычно находится в операциях чтения NGS.Однако из-за характера технологии секвенирования SMRT адаптеры не имеют определенного предсказуемого местоположения в считываниях HiFi. Кроме того, считывания, содержащие последовательность адаптера, могут быть в целом более низкого качества по сравнению с остальными считываниями. Таким образом, мы будем использовать Cutadapt не для обрезки, а для удаления всего рида, если внутри рида будет обнаружен адаптер.
практические занятия Практические занятия: удаление грунтовки с помощью Cutadapt
- Cutadapt Инструмент: сарай.g2.bx.psu.edu/repos/lparsons/cutadapt/cutadapt/3.4 со следующими параметрами:
- «Односторонние или парные чтения?» :
односторонний
- коллекция параметров «Файл FASTQ/A» :
Коллекция HiFi
- В «Опции чтения 1» :
- В «5- или 3-дюймовые (любые) адаптеры» :
- param-repeat «Вставьте 5-дюймовые или 3-футовые (любые) адаптеры»
- «Источник» :
Введите пользовательскую последовательность
- «Введите имя пользовательского 5- или 3-дюймового адаптера» :
Первый адаптер
- «Введите пользовательскую последовательность 5-дюймового или 3-дюймового адаптера» :
ATCTCTCTCAACAACAACAACGGAGGAGGAGGAAAAGAGAGAGAT
- param-repeat «Вставка 5-дюймовых или 3-дюймовых (любых) адаптеров»
- «Источник» :
Введите пользовательскую последовательность
- «Введите имя пользовательского 5- или 3-дюймового адаптера» :
Второй адаптер
- «Введите пользовательскую последовательность 5’ или 3’ адаптера» :
ATCTCTCTCTTTTCCTCCTCCTCCGTTGTTGTTGTTGAGAGAGAT
- В «Параметры адаптера» :
- «Максимальная частота ошибок» :
0.1
- «Минимальная длина перекрытия» :
35
- «Искать адаптеры в обратном дополнении» :
Да
- В «Параметры фильтра» :
- «Отменить усеченные чтения» :
Да
подсказка Подсказка: выберите набор данных коллекции
- Щелкните param-collection Dataset collection перед входным параметром, для которого вы хотите передать набор.
- Выберите коллекцию, которую хотите использовать, из списка
- Переименуйте выходной файл в
HiFi_collection (trim)
.Совет: переименование набора данных
- Нажмите на значок карандаша galaxy-pencil для набора данных, чтобы изменить его атрибуты
- кнопка
Перед началом проекта сборки генома de novo полезно собрать показатели свойств рассматриваемого генома, например ожидаемый размер генома.Традиционно проточная ДНК-цитометрия считалась золотым стандартом для оценки размера генома. В настоящее время экспериментальные методы заменены вычислительными подходами (Wang et al. 2020). Один из широко используемых методов профилирования генома основан на анализе частот k-меров. Он позволяет предоставлять информацию не только о сложности генома, такой как размер генома, уровни гетерозиготности и содержания повторов, но и о качестве данных.
В этом разделе мы будем использовать два основных инструмента для вычислительной оценки особенностей генома: Meryl и GenomeScope.
Получение спектров k-mer с помощью
MerylMeryl позволит нам сгенерировать профиль из тыс. -меров путем разложения данных секвенирования на подстроки длиной тыс. , подсчета появления каждого тыс. -меров и определения их частоты. Первоначальная версия Meryl была разработана для Celera Assembler. Текущая версия Meryl состоит из трех основных модулей: один для создания баз данных k -mer, один для фильтрации и объединения баз данных и один для поиска в базах данных. K -меры хранятся в базе данных в лексикографическом порядке, подобно словам в словаре (Rhie et al. 2020).
практические занятия Практическое занятие: Генерация распределения k -mers count
- Meryl Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/meryl/meryl/1.3+galaxy2 со следующими параметрами:
- «Селектор типа операции» :
Операции подсчета
- «Подсчет операций» :
Подсчет: подсчет вхождений канонических k-меров
- коллекция параметров «Входные последовательности» :
Коллекция HiFi (обрезка)
- «селектор размера k-mer» :
Установить размер k-mer
Переименовать
Коллекция meryldb
- Мерил Инструмент: сарай.g2.bx.psu.edu/repos/iuc/meryl/meryl/1.3+galaxy1 со следующими параметрами:
- «Селектор типа операции» :
Операции над множествами k-меров
- «Операции над наборами k-меров» :
Union-sum: вернуть k-меры, которые встречаются в любом входе, установить счетчик равным сумме счетчиков
- param-file «Ввод meryldb» :
Коллекция meryldb
Переименуйте его как
Объединенный meryldb
- Мерил Инструмент: сарай.g2.bx.psu.edu/repos/iuc/meryl/meryl/1.3+galaxy0 со следующими параметрами:
- «Селектор типа операции» :
Создать набор данных гистограммы
- файл параметров «Ввод meryldb» :
Объединенный meryldb
- Наконец, переименуйте его как
Meryldb histogram
.
Профилирование генома с помощью
GenomeScope2Следующим шагом является вывод свойств генома из гистограммы k -mer, созданной Мерил, для чего мы будем использовать GenomeScope2.Genomescope2 опирается на нелинейную оптимизацию методом наименьших квадратов, чтобы соответствовать смеси отрицательных биномиальных распределений, генерируя оценочные значения размера генома, повторяемости и степени гетерозиготности (Ranallo-Benavidez et al. 2020).
практические занятия Практические занятия: оценка свойств генома
- GenomeScope Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/genomescope/genomescope/2.0 со следующими параметрами:
- param-file «Входной файл гистограммы» :
Гистограмма Meryldb
- «Длина k-меров, используемая для расчета спектров k-меров» :
21
- В « Варианты вывода »: отметка
Резюме анализа
- В « Дополнительные параметры »:
- «Создать тестирование.tsv с параметрами модели» :
Да
Genomescope будет генерировать шесть выходов:
- Земельные участки
- Линейный график : k -мерные спектры и подобранные модели: частота (ось Y) в зависимости от охвата.
- Логарифмический график : логарифмическое преобразование предыдущего графика.
- Преобразованный линейный график: k -мерных спектров и подогнанные модели: частота, умноженная на покрытие (ось Y) в зависимости от покрытия (ось X).Это преобразование увеличивает высоту пиков более высокого порядка, преодолевая эффект высокой гетерозиготности.
- Преобразованный логарифмический график: логарифмическое преобразование предыдущего графика.
- Модель: этот файл содержит подробный отчет о подгонке модели.
- Резюме: он включает свойства, выведенные из модели, такие как гаплоидная длина генома и процент гетерозиготности.
Теперь давайте проанализируем профили k -mer, подогнанные модели и оценочные параметры (рис.3).
Рисунок 3: 21-мерный профиль GenomeScope2. Первый пик, расположенный при покрытии 21х, соответствует гетерозиготному пику. Второй пик при охвате 50х соответствует гомозиготному пику. Оценка доли гетерозигот составляет 0,637%. График также включает информацию о предполагаемой общей длине генома (len), проценте уникальной длины генома (uniq), общем уровне гетерозиготности (het), среднем покрытии k-mer для гетерозиготных оснований (kcov), частоте ошибок чтения (err), среднем частота дупликаций чтения (dup) и размер k-mer (k).Это распределение является результатом процесса Пуассона, лежащего в основе генерации считываний секвенирования. Как мы видим, профиль k-mer следует бимодальному распределению, указывающему на диплоидный геном. Распределение согласуется с теоретической диплоидной моделью (подгонка модели > 93%). Низкочастотные k -меры являются результатом ошибок секвенирования. По оценкам GenomeScope2, размер гаплоидного генома составляет около 11,7 Мб, что достаточно близко к размеру генома Saccharomyces . Кроме того, было обнаружено, что вариация геномных последовательностей равна 0.69%.
Прежде чем перейти к следующему разделу, нам нужно выполнить некоторые операции с выходными данными, сгенерированными GenomeScope2. Цель состоит в том, чтобы извлечь некоторые параметры, которые на более позднем этапе будут использоваться purge_dups.
Первым важным параметром является предполагаемый размер генома
.
практические занятия Практические занятия: оценка размера генома
- Заменить Инструмент: toolsshed.g2.bx.psu.edu/repos/bgruening/text_processing/tp_find_and_replace/1.1.3 со следующими параметрами:
- param-file «Файл для обработки» :
сводка
(результат инструмента GenomeScope )- «Найти шаблон» :
п.н.
- «Заменить все вхождения шаблона» :
Да
- «Найти и заменить текст в» :
вся строка
- Заменить Инструмент: инструментальный сарай.g2.bx.psu.edu/repos/bgruening/text_processing/tp_find_and_replace/1.1.3 со следующими параметрами:
- param-file «Файл для обработки» : выходной файл Заменить инструмент
- «Найти шаблон» :
,
- «Заменить все вхождения шаблона» :
Да
- «Найти и заменить текст в» :
вся строка
- Поиск в текстовых файлах (grep) Инструмент: toolsshed.g2.bx.psu.edu/repos/bgruening/text_processing/tp_grep_tool/1.1.1 со следующими параметрами:
- param-file «Выбрать строки из» : выходной файл предыдущего шага.
- «Тип регулярного выражения» :
Базовый
- «Регулярное выражение» :
Гаплоид
- Преобразование разделителей в TAB Инструмент: преобразование символов 1 со следующими параметрами:
- файл параметров «в наборе данных» : вывод Поиск в текстовых файлах инструмент
- Advanced Cut Инструмент: сарай.g2.bx.psu.edu/repos/bgruening/text_processing/tp_cut_tool/1.1.0 со следующими параметрами:
- param-file «Файл для вырезания» : вывод Преобразовать разделители в TAB инструмент
- «Вырезать по» :
полей
- «Список полей» :
Столбец: 5
- Переименуйте вывод как
Расчетный размер генома
.вопрос ВопросыКаков предполагаемый размер генома?
раствор РастворРасчетный размер генома равен 11.748,793 п.н.
Теперь давайте проанализируем верхнюю границу для параметра оценки глубины чтения
. Этот параметр позже будет использоваться purge_dups в качестве отсечки высокой глубины чтения для идентификации ненужных контигов .
практические занятия Практические занятия: максимальная глубина чтения
- Вычислить выражение для каждой строки Инструмент: toolsshed.g2.bx.psu.edu/repos/devteam/column_maker/Add_a_column1/1.6 со следующими параметрами:
- «Добавить выражение» :
1.5*с3
- param-file «как новый столбец для» :
model_params
(вывод инструмента GenomeScope )- «Результат округления?» :
Да
- «Ввод имеет строку заголовка с именами столбцов?» :
№
- Вычисление выражения для каждой строки Инструмент: toolsshed.g2.bx.psu.edu/repos/devteam/column_maker/Add_a_column1/1.6 со следующими параметрами:
- «Добавить выражение» :
3*c7
- param-file «как новый столбец в» : вывод предыдущего шага.
- «Результат округления?» :
Да
- «Ввод имеет строку заголовка с именами столбцов?» :
№
Переименуйте его как
Анализ временного вывода
- Advanced Cut Инструмент: сарай.g2.bx.psu.edu/repos/bgruening/text_processing/tp_cut_tool/1.1.0 со следующими параметрами:
- param-file «Файл для вырезания» :
Анализ временного вывода
- «Вырезать по» :
полей
- «Список полей» :
Столбец 8
- Переименуйте вывод как
Максимальная глубина
вопрос Вопросы
- Какова предполагаемая максимальная глубина?
- Что представляет этот параметр?
раствор Раствор
- Расчетная максимальная глубина составляет 114 операций чтения.
- Максимальная глубина указывает максимальное количество прочтений секвенирования, которые соответствуют определенным позициям в геноме.
Наконец, давайте проанализируем параметр перехода между гаплоидным и диплоидным глубинами покрытия
. Это будет использоваться в качестве порога для различения гаплоидной и диплоидной глубины.
практические занятия Практические занятия: получение параметра перехода
- Advanced Cut Инструмент: инструментальный сарай.g2.bx.psu.edu/repos/bgruening/text_processing/tp_cut_tool/1.1.0 со следующими параметрами:
- param-file «Файл для вырезания» :
Анализ временного вывода
- «Вырезать по» :
полей
- «Список полей» :
Столбец 7
- Переименуйте выход как
Параметр перехода
вопрос ВопросыКаков предполагаемый параметр перехода?
раствор РастворРасчетный параметр перехода составляет 38 операций чтения.
После завершения этапа профилирования генома мы можем начать сборку генома с помощью hifiasm, быстрого ассемблера de novo с открытым исходным кодом, специально разработанного для чтения PacBio HiFi.
Сборка генома с
hifiasmОдним из ключевых преимуществ hifiasm является то, что он позволяет нам разрешать почти идентичные, но не совсем идентичные последовательности, такие как повторы и сегментарные дупликации (Cheng et al. 2021).
практические занятия Практические занятия: поэтапная сборка с помощью hifiasm
- Hifiasm Инструмент: toolsshed.g2.bx.psu.edu/repos/bgruening/hifiasm/hifiasm/0.14+galaxy0 со следующими параметрами:
- «Режим сборки» :
Стандартный
- param-file «Чтение ввода» :
HiFi_collection (обрезка)
(выход инструмента Cutadapt )- «Опции удаления дубликатов» :
Укажите
- «Верхняя граница покрытия» :
114
(ранее полученная максимальная глубина)- «Опции для перегородки Hi-C» :
Указать
- «Hi-C R1 читает» :
Hi-C_dataset_F
- «Hi-C R2 читает» :
Hi-C_dataset_R
- Переименуйте сбалансированный граф Hi-C hap1 в
Primary contig graph
и добавьте тег#primary
- Переименуйте сбалансированный граф Hi-C hap2 в
Alternate contig graph
и добавьте тег#alternate
Hifiasm генерирует четыре вывода в формате графической сборки фрагментов (GFA); этот формат предназначен для представления вариаций генома, графиков сплайсинга в генах и даже перекрытий между чтениями.
Мы получили полностью поэтапные графы контигов основного и альтернативного гаплотипов, но выходной формат hifiasm необходимо преобразовать в формат FASTA для последующих шагов.
практические занятия Практические занятия: преобразование GFA в FASTA
- GFA to FASTA Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/gfa_to_fa/gfa_to_fa/0.1.2 со следующими параметрами:
- файлы параметров «Входной файл GFA» : выберите
Первичный граф контигов
иАльтернативный граф контигов
наборы данныхtip Совет: выберите несколько наборов данных
- Нажмите на файлы параметров Несколько наборов данных
- Выберите несколько файлов, удерживая нажатой клавишу Ctrl (или COMMAND ) и щелкая нужные файлы
- Переименуйте выходы как
Первичные контиги FASTA
иАльтернативные контиги FASTA
Начальная оценка сборки
Конвейер сборки VGP содержит несколько встроенных шагов контроля качества, включая QUAST, BUSCO, Merqury и Pretext.QUAST будет генерировать сводную статистику, BUSCO будет искать универсальные однокопийные гены-ортологи, Merqury будет оценивать числа копий сборки, используя k -меров, а Pretext будет использоваться для оценки смежности сборки.
Конвейер QUAST по умолчанию использует Minimap2. Модули прогнозирования функциональных элементов включают GeneMarkS, GeneMark-ES, GlimmerHMM, Barrnap и BUSCO.
практические занятия Практические занятия: оценка сборки с помощью QUAST
- Quast Инструмент: инструментальный сарай.g2.bx.psu.edu/repos/iuc/quast/quast/5.0.2+galaxy1 со следующими параметрами:
- «Использовать собственные имена для входных файлов?» :
Да, укажите пользовательские имена
- В «1. Контиги/подмости» :
- param-file «Файл Contigs/scaffolds» :
Первичные contigs FASTA
- «Имя» :
Первичная сборка
- Нажмите «Вставить контиги/каркасы»
- В «2.Контиги/подмости» :
- param-file «Файл Contigs/Scaffolds» :
Альтернативные contigs FASTA
- «Имя» :
Альтернативный узел
- «Параметры чтения» :
Pacbio SMRT считывает
- набор параметров «файл FASTQ» :
набор HiFi (обрезка)
- «Тип сборки» :
Геном
- «Использовать эталонный геном?» :
№
- «Расчетный эталонный размер генома (в п.н.) для расчета статистики NGx» :
11748793
(ранее оценено)- «Тип организма» :
Эукариоты: использование GeneMark-ES для поиска генов, Barrnap для предсказания генов рибосомной РНК, BUSCO для поиска консервативных ортологов (--эукариоты)
- «Геном большой (>100Mpb)?» :
№
- Переименуйте HTML-отчет как
Исходный отчет QUAST
Давайте посмотрим на HTML-отчет, сгенерированный QUAST.
Рисунок 5: HTML-отчет QUAST. Статистика первичной и альтернативной сборки (а). График кумулятивной длины (б).Судя по отчету, обе сборки довольно похожи; первичная сборка включает 33 контига, совокупная длина которых составляет около 23,5 Мб. С другой стороны, вторая альтернативная сборка включает 35 контигов, общая длина которых составляет 25,5 Мбит/с. Как мы видим на рисунке 5b, сборки намного больше предполагаемых размеров генома (пунктирная линия), что означает, что обе включают дублированные последовательности.
вопрос Вопросы
- Какой самый длинный контиг в первичной сборке? А в альтернативном?
- Что такое N50 первичной сборки?
- Какой процент операций чтения сопоставлен с каждой сборкой?
раствор Раствор
- Самый длинный контиг в первичной сборке составляет 1 532 843 п.н. и 1 532 843 п.н. в альтернативной сборке.
- N50 первичной сборки – 922.430 бп.
- Согласно отчету, 100 % операций чтения сопоставлены как с основной сборкой, так и с альтернативной сборкой.
Далее мы будем использовать BUSCO, который обеспечит количественную оценку полноты сборки генома с точки зрения ожидаемого содержания генов. Он основан на анализе генов, которые должны присутствовать только один раз в полной сборке или наборе генов, допуская при этом редкие дупликации или потери генов (Simão et al. 2015).
практические занятия Практические занятия: оценка полноты сборки с помощью BUSCO
- Busco Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/busco/busco/5.0.0+galaxy0 со следующими параметрами:
- файлы параметров «Последовательности для анализа» :
Первичные контиги FASTA
иАльтернативные контиги FASTA
- «Мода» :
Сборки генома (ДНК)
- «Используйте Augustus вместо Metaeuk» :
Используйте Metaeuk
- «Автоопределение или выбор родословной?» :
Выберите родословную
- “Происхождение” :
Сахаромицеты
- «Какие выходные данные должны быть сгенерированы» :
краткий текст
- Переименуйте сводку как
Исходный отчет BUSCO первичный
иИсходный отчет BUSCO альтернативный
.
BUSCO по умолчанию генерирует два вывода: табличный файл, который содержит полные результаты (, например, , оценки, описания, длины и координаты совпадений) для каждого гена BUSCO (рис. 6) и краткую сводку.
Рисунок 6: Полная таблица BUSCO. Он содержит полные результаты в табличном формате с очками и продолжительностью матчей BUSCO, а также координатами.Как видно из отчета, результаты упрощены в четыре категории: полные и единичные , полные и дублированные , фрагментированные и отсутствующие BUSCO .
вопрос Вопросы
- Сколько полных генов BUSCO было идентифицировано в первичной сборке?
- Сколько генов BUSCO отсутствует?
раствор Раствор
- Согласно отчету, наша сборка содержит полную последовательность 2080 полных генов BUSCO (97,3%).
- 19 генов BUSCO отсутствуют.
Несмотря на то, что BUSCO устойчив к широко изученным видам, он может быть неточным, если вновь собранный геном принадлежит к таксономической группе, недостаточно представленной в OrthoDB.Merqury обеспечивает дополнительный подход к оценке показателей качества сборки генома без эталонного метода с помощью анализа числа копий k -mer.
практические занятия Практические занятия: k оценка на основе мер с помощью Merqury
- Merqury Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/merqury/merqury/1.3 со следующими параметрами:
- «Режим оценки» :
Режим по умолчанию
- param-file «база данных подсчетов k-mer» :
Объединенный meryldb
- «Количество сборок» : «Две сборки»
- param-file «Первая сборка генома» :
Первичные контиги FASTA
- param-file «Вторая сборка генома» :
Альтернативные контиги FASTA
По умолчанию Merqury создает три коллекции в качестве вывода: статистика, графики и статистика QV.Коллекция «stats» содержит статистику полноты, а коллекция «QV stats» содержит статистику значения качества. Давайте посмотрим на график спектра числа копий первичной сборки (CN), известный как график спектра-cn (рис. 7).
Рисунок 7: График Merqury CN, соответствующий первичной сборке. Этот график отслеживает множественность каждого k-мера, найденного в наборе чтения Hi-Fi, и окрашивает его в соответствии с тем, сколько раз он встречается в данной сборке. Merqury соединяет среднюю точку каждой ячейки гистограммы линией, создавая иллюзию плавной кривой.Как предполагалось ранее в отчете, созданном QUAST (рис. 5), сборки содержат большую долю дублированных операций чтения. Красная область представляет тыс. -меров с одной копией в геноме, а синяя область представляет тыс. -меров с двумя копиями, происходящих из дупликаций, специфичных для гаплотипа. Тот факт, что первичный гаплотип демонстрирует диплоидный генетический дар, можно объяснить высокой дивергенцией между искусственно созданными гаплотипами. Кроме того, из этого рисунка мы можем заявить, что охват секвенированием составляет около 50x.
Идеальное гаплоидное представление будет состоять из одной аллельной копии всех гетерозиготных областей в двух гаплоомах, а также всех гемизиготных областей из обоих гапломов (Guan et al. 2019). Однако в сильно гетерозиготных геномах алгоритмы сборки часто не в состоянии идентифицировать сильно расходящиеся аллельные последовательности как принадлежащие к одной и той же области, что приводит к сборке этих областей в виде отдельных контигов. Это может привести к проблемам в последующем анализе, таким как каркасы, аннотации генов и картирование прочтений в целом (Small et al. 2007, Гуань и др. 2019, Роуч и др. 2018). Чтобы решить эту проблему, мы будем использовать purge_dups; этот инструмент позволит нам идентифицировать и переназначить аллельные контиги.
Удаление гаплотипической дупликации с помощью
purge_dupsЭтот этап состоит из трех подэтапов: анализ глубины чтения, генерация всех против всех самовыравниваний и разрешение гаплотигов и перекрытий (рис. 8).
Рисунок 8: Конвейер Purge_dups. Адаптировано с гитхаба.com/dfguan/purge_dups. Purge_dups интегрирован в многоэтапный конвейер, состоящий из трех основных подэтапов. Красный указывает шаги, которые требуют использования Minimap2.Анализ глубины чтения
Первоначально нам нужно свернуть нашу коллекцию обрезанных чтений HiFi в один набор данных.
практические занятия Практические занятия: свернуть коллекцию
- Свернуть коллекцию Инструмент: toolsshed.g2.bx.psu.edu/repos/nml/collapse_collections/collapse_dataset/4.2 со следующими параметрами:
- param-collection «Набор файлов для объединения в единый набор данных» :
HiFi_collection (обрезка)
- Переименуйте вывод как
HiFi reads свернут
Теперь мы сопоставим чтения с первичной сборкой, используя Minimap2 (Li 2018), программу выравнивания, предназначенную для сопоставления длинных последовательностей.
практические занятия Практическое занятие: сопоставление чтений с контигами с помощью Minimap2
- Карта с миникартой2 Инструмент: сарай инструментов.g2.bx.psu.edu/repos/iuc/minimap2/minimap2/2.17+galaxy4 со следующими параметрами:
- «Выберете ли вы эталонный геном из своей истории или воспользуетесь встроенным индексом?» :
Использовать геном из истории и построить индекс
- файл параметров «Использовать следующий набор данных в качестве эталонной последовательности» :
Основные контиги FASTA
- «Чтение с одного или двух концов» :
Одиночный
- коллекция параметров «Выбрать набор данных fastq» :
Чтения HiFi свернуты
- «Выбор профиля предустановленных параметров» :
Сопоставление длинной сборки со ссылкой (-k19 -w19 -A1 -B19 -O39,81 -E3,1 -s200 -z200 --min-occ-floor=100).Как правило, выравнивание не распространяется на области с расхождением последовательности 5% или выше. Используйте этот пресет только в том случае, если среднее расхождение намного ниже 5%. (асм5)
- В «Установить дополнительные параметры вывода» :
- «Выберите формат вывода» :
paf
- Переименуйте вывод как
Чтения, сопоставленные с контигами
Наконец, мы будем использовать файл Reads, сопоставленный с файлом формата парного сопоставления contigs
(PAF), для расчета некоторых статистических данных, необходимых на более позднем этапе.На этом шаге purge_dups сначала создает гистограмму глубины считывания из покрытий базового уровня. Эта информация используется для оценки порогов охвата, принимая во внимание, что коллапсированные контиги гаплотипов приведут к считыванию обоих аллелей, сопоставленных с этими контигами, тогда как, если аллели собрались как отдельные контиги, то считывания будут разделены на два контига, что приводит к уменьшению глубины чтения вдвое (Roach et al. 2018).
практические занятия Практические занятия: анализ глубины чтения
- purge_dups Инструмент: инструментальный сарай.g2.bx.psu.edu/repos/iuc/purge_dups/purge_dups/1.2.5+galaxy3 со следующими параметрами:
- «Режим функции» :
Расчет порога покрытия, глубины считывания на базовом уровне и создание гистограммы глубины считывания для данных PacBio (calcuts+pbcstats)
- param-file «Входной файл PAF» :
Чтения сопоставлены с контигами
- В «Опции расчета» :
- «Переход между гаплоидным и диплоидным» : 38
- «Верхняя граница глубины чтения» :
114
(ранее оцененная максимальная глубина)- «Плоидность» :
Диплоид
- Переименуйте выходные данные как
Базовое покрытие PBCSTAT, первичный
,График гистограммы, первичный
иРасчеты отсечки, первичный
.
Purge_dups создает три выхода:
- Базовое покрытие PBCSTAT: содержит информацию о базовом уровне покрытия.
- Calcuts-cutoff: включает пороги, рассчитанные purge_dups.
- График гистограммы.
Генерация всех против всего самовыравнивания
Теперь мы разделим черновую сборку на контиги, разрезав блоки по N с, и воспользуемся minimap2 для создания самовыравнивания «все за всем».
практические занятия Практические занятия: конвейер purge_dups
- purge_dups Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/purge_dups/purge_dups/1.2.5+galaxy2 со следующими параметрами:
- «Режим работы» :
разделить файл сборки FASTA на «N» (split_fa)
- файл параметров «Файл сборки FASTA» :
Основные контиги FASTA
Переименуйте выход как
Split FASTA
- Карта с миникартой2 Инструмент: сарай инструментов.g2.bx.psu.edu/repos/iuc/minimap2/minimap2/2.17+galaxy4 со следующими параметрами:
- «Выберете ли вы эталонный геном из своей истории или воспользуетесь встроенным индексом?» :
Использовать геном из истории и построить индекс
- файл параметров «Использовать следующий набор данных в качестве эталонной последовательности» :
Разделить FASTA
- «Чтение с одного или двух концов» :
Одиночный
- файл параметров «Выбрать набор данных fastq» :
Разделить FASTA
- «Выберите профиль предустановленных параметров» :
Построение карты самогомологии — используйте тот же геном, что и запрос и ссылка (-DP -k19 -w 19 -m200) (самогомология)
- В «Установить дополнительные параметры вывода» :
- «Выберите формат вывода» :
PAF
- Переименуйте выходные данные как
Первичная карта самогомологии
Разрешение гаплотигов и перекрытий
На последнем этапе конвейера purge_dups он будет использовать самовыравнивание и отсечки для идентификации гаплотипических дупликаций.
практические занятия Практические занятия: разрешение гаплотигов и перекрытий
- purge_dups Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/purge_dups/purge_dups/1.2.5+galaxy5 со следующими параметрами:
- «Выберите функцию purge_dups» :
Очистить гаплотиги и перекрытия для сборки (purge_dups)
- param-file «Входной файл PAF» :
Первичная карта самогомологии
- param-file «Файл базового покрытия» :
Базовое покрытие PBCSTAT первично
- param-file «Cutoffs file» :
calcuts cutoff primary
Переименуйте вывод как
purge_dups BED
- purge_dups Инструмент: сарай.g2.bx.psu.edu/repos/iuc/purge_dups/purge_dups/1.2.5+galaxy2 со следующими параметрами:
- «Выберите функцию purge_dups» :
Получить последовательности после очистки (get_seqs)
- файл параметров «Файл сборки FASTA» :
Основные контиги FASTA
- param-file «Входной файл BED» :
purge_dups BED
(вывод предыдущего шага)- Переименуйте выходные данные
get_seq очищенных последовательностей
вПервичные контиги очищены
, а файлget_seq гаплотипа
переименуйте вАльтернативные гаплотипы
Обработка альтернативной сборки
Теперь мы должны повторить ту же процедуру с альтернативными контигами, сгенерированными hifiasm.В этом случае мы должны начать с объединения альтернативных гаплотипов
, созданных на предыдущем шаге, и файла альтернативных гаплотипов FASTA
.
практические занятия Практические занятия: объединение очищенных последовательностей и альтернативных контигов
- Объединение наборов данных Инструмент: cat1 со следующими параметрами:
- файл параметров «Объединить набор данных» :
Альтернативные контиги FASTA
- В «Набор данных» :
- параметр-повтор «Вставить набор данных»
- файл параметров «Выбрать» :
Контиги альтернативных гаплотипов
- Переименуйте вывод как
Альтернативные контиги полные
После того, как мы объединили файлы, мы должны снова запустить конвейер purge_dups, но используя в качестве входных данных файл Alternate contigs full
.
практические занятия Практические занятия: обработка альтернативной сборки с помощью purge_dups
- Карта с minimap2 Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/minimap2/minimap2/2.17+galaxy4 со следующими параметрами:
- «Выберете ли вы эталонный геном из своей истории или воспользуетесь встроенным индексом?» :
Использовать геном из истории и построить индекс
- файл параметров «Использовать следующий набор данных в качестве эталонной последовательности» :
Альтернативные контиги полные
- «Чтение с одного или двух концов» :
Одиночный
- коллекция параметров «Выбрать набор данных fastq» :
Чтения HiFi свернуты
- «Выбор профиля предустановленных параметров» :
Сопоставление длинной сборки со ссылкой (-k19 -w19 -A1 -B19 -O39,81 -E3,1 -s200 -z200 --min-occ-floor=100).Как правило, выравнивание не распространяется на области с расхождением последовательности 5% или выше. Используйте этот пресет только в том случае, если среднее расхождение намного ниже 5%. (асм5)
- В «Установить дополнительные параметры вывода» :
- «Выберите формат вывода» :
paf
Переименуйте вывод как
Чтения, сопоставленные с contigs, альтернативными
- purge_dups Инструмент: сарай.g2.bx.psu.edu/repos/iuc/purge_dups/purge_dups/1.2.5+galaxy3 со следующими параметрами:
- «Режим функции» :
Расчет порога покрытия, глубины считывания на базовом уровне и создание гистограммы глубины считывания для данных PacBio (calcuts+pbcstats)
- param-file «Входной файл PAF» :
Чтения сопоставлены с contigs alter
- В «Опции расчета» :
- «Верхняя граница глубины считывания» :
114
- «Плоидность» :
Диплоид
Переименуйте выходные данные как «альтернативный базовый охват PBCSTAT
,
альтернативный график гистограммыи
альтернативный предел отсечки расчетов».- purge_dups Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/purge_dups/purge_dups/1.2.5+galaxy2 со следующими параметрами:
- «Режим работы» :
разделить файл сборки FASTA на «N» (split_fa)
- param-file «Файл сборки FASTA» :
Альтернативные контиги полные
Переименуйте выход как
Split FASTA alter
- Карта с миникартой2 Инструмент: сарай инструментов.g2.bx.psu.edu/repos/iuc/minimap2/minimap2/2.17+galaxy4 со следующими параметрами:
- «Выберете ли вы эталонный геном из своей истории или воспользуетесь встроенным индексом?» :
Использовать геном из истории и построить индекс
- файл параметров «Использовать следующий набор данных в качестве эталонной последовательности» :
Разделить альтернативу FASTA
- «Чтение с одного или двух концов» :
Одиночный
- файл параметров «Выбрать набор данных fastq» :
Разделить альтернативу FASTA
- «Выберите профиль предустановленных параметров» :
Построение карты самогомологии — используйте тот же геном, что и запрос и ссылка (-DP -k19 -w 19 -m200) (самогомология)
- В «Установить дополнительные параметры вывода» :
- «Выберите формат вывода» :
PAF
Переименуйте вывод как
Альтернативная карта самогомологии
- purge_dups Инструмент: сарай.g2.bx.psu.edu/repos/iuc/purge_dups/purge_dups/1.2.5+galaxy5 со следующими параметрами:
- «Выберите функцию purge_dups» :
Очистить гаплотиги и перекрытия для сборки (purge_dups)
- param-file «Входной файл PAF» :
Альтернативная карта самогомологии
- param-file «Файл покрытия базового уровня» :
Альтернативное базовое покрытие PBCSTAT
- param-file «Cutoffs file» :
calcuts cutoff alter
- purge_dups Инструмент: сарай.g2.bx.psu.edu/repos/iuc/purge_dups/purge_dups/1.2.5+galaxy2 со следующими параметрами:
- «Выберите функцию purge_dups» :
Получить последовательности после очистки (get_seqs)
- param-file «Файл сборки FASTA» :
Альтернативные контиги полные
- param-file «Входной файл BED» :
purge_dups Альтернативный BED
- Переименуйте выходные данные как
Альтернативные контиги очищены
иАльтернативные контиги гаплотипа
.
Второй этап оценки сборки
После запуска purge_dups мы можем снова оценить сборку и сравнить результаты до и после очистки.
практические занятия Практические занятия: оценка сборки с помощью QUAST
- Quast Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/quast/quast/5.0.2+galaxy1 со следующими параметрами:
- «Использовать собственные имена для входных файлов?» :
Да, укажите пользовательские имена
- В «1.Контиги/подмости» :
- param-file «Файл Contigs/scaffolds» :
Основные контиги очищены
- «Имя» :
Первичная сборка
- Нажмите «Вставить контиги/каркасы»
- В «2. Контиги/подмости» :
- param-file «Файл Contigs/scaffolds» :
Альтернативные contigs очищены
- «Имя» :
Альтернативный узел
- «Параметры чтения» :
Pacbio SMRT считывает
- коллекция параметров «Файл FASTQ» :
Чтение HiFi свернуто
- «Тип сборки» :
Геном
- «Использовать эталонный геном?» :
№
- «Расчетный эталонный размер генома (в п.н.) для расчета статистики NGx» :
11748793
(ранее оценено)- «Тип организма» :
Эукариоты: использование GeneMark-ES для поиска генов, Barrnap для предсказания генов рибосомной РНК, BUSCO для поиска консервативных ортологов (--эукариоты)
- «Геном большой (>100Mpb)?» :
№
- Переименуйте отчет HTML как
Второй отчет QUAST
На рис. 9 показан график кумулятивной длины, соответствующий первичной сборке после обработки.
Рисунок 9: Кумулятивный график QUAST после запуска purge_dups.Как можно заметить, после запуска purge_dups значительно сократилось как количество контигов, так и общая длина. Это указывает на то, что purge_dups смогла улучшить сборку генома, удалив перекрытия и гаплотиги, вызванные расхождением последовательностей в гетерозиготных регионах.
вопрос Вопросы
- Сколько контигов включает первичную сборку после обработки с помощью purge_dups? А что до purge_dups?
- Сколько контигов включает альтернативную сборку после обработки с помощью purge_dups?
- Какой процент операций чтения сопоставлен с основной сборкой?
раствор Раствор
- Первичная сборка включает 17 контигов после обработки.Первоначальная сборка включала 33 контига.
- Альтернатива включает 17 контигов после обработки.
- Согласно отчету, 100% операций чтения сопоставлены с основной сборкой.
Теперь оценим сборку с BUSCO.
практические занятия Практические занятия: оценка полноты сборки с помощью BUSCO
- Busco Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/busco/busco/5.0.0+galaxy0 со следующими параметрами:
- файлы параметров «Последовательности для анализа» :
Первичные контиги очищены
иАльтернативные контиги очищены
- «Мода» :
Сборки генома (ДНК)
- «Используйте Augustus вместо Metaeuk» :
Используйте Metaeuk
- «Автоопределение или выбор родословной?» :
Выберите родословную
- “Происхождение” :
Сахаромицеты
- В «Дополнительные параметры» :
- «Какие выходные данные должны быть сгенерированы» :
краткий текст сводки
исводка изображения
- Переименуйте сводку как
Второй отчет BUSCO
вопрос ВопросыСколько полных генов BUSCO было идентифицировано?
раствор РастворСогласно отчету, первичная сборка содержит 2021 полных гена BUSCO.
На данный момент мы получили первичную и альтернативную сборки, каждая из которых состоит из набора контигов (непрерывных последовательностей, собранных из перекрывающихся прочтений). Затем контиги будут собраны в каркасы, т. е. последовательности контигов, разделенных промежутками. Для этого мы будем использовать гибридные леса, используя две дополнительные технологии: оптические карты Bionano и данные Hi-C.
Гибридные леса с использованием данных Bionano
На этом этапе информация о связях, предоставленная оптическими картами, интегрируется с последовательностями первичной сборки, а перекрытия используются для ориентации и упорядочения контигов, разрешения химерных соединений и оценки длины промежутков между соседними контигами.Одним из преимуществ оптических карт является то, что они могут легко охватывать области генома, которые трудно разделить с помощью технологий секвенирования ДНК (Savara et al. 2021, Yuan et al. 2020).
Инструмент Bionano Hybrid Scaffold автоматизирует процесс возведения лесов, который включает пять основных этапов:
- Сгенерируйте in silico карт для сборки последовательности.
- Совместите карты последовательности in silico с картами генома Bionano для выявления и разрешения потенциальных конфликтов.
- Объедините неконфликтующие карты в гибридные каркасы.
- Выравнивание карт последовательности с гибридными каркасами
- Создайте файлы AGP и FASTA для каркасов.
Практика Практика: Гибридные леса Bionano
- Гибридный каркас Bionano Инструмент: toolsshed.g2.bx.psu.edu/repos/bgruening/bionano_scaffold/bionano_scaffold/3.6.1+galaxy2 со следующими параметрами:
- файл параметров «NGS FASTA» :
Первичные контиги очищены
- файл параметров «BioNano CMAP» :
Bionano_dataset
- «Режим конфигурации» :
Режим VGP
- «Фильтр конфликтов карт генома» :
Вырезать контиг при конфликте
- «Фильтр конфликтов последовательностей» :
Вырезать контиг при конфликте
- Объединение наборов данных Инструмент: cat1 со следующими параметрами:
- param-file «Объединить набор данных» :
Scaffold NGScontigs NCBI урезан
(выход инструмента Bionano Hybrid Scaffold )- В «Набор данных» :
- параметр-повтор «Вставить набор данных»
- param-file «Select» :
NGScontigs не обрезанный каркас
(результат инструмента Bionano Hybrid Scaffold )- Переименуйте вывод как
Первичная сборка бионано
Теперь давайте оценим эффект Бионано в нашей сборке.
практические занятия Практические занятия: оценка сборки Bionano с помощью QUAST
- Quast Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/quast/quast/5.0.2+galaxy1 со следующими параметрами:
- «Использовать собственные имена для входных файлов?» :
Нет, использовать имена наборов данных
- param-file «Файл Contigs/scaffolds» :
Первичная сборка bionano
- «Тип сборки» :
Геном
- «Использовать эталонный геном?» :
№
- «Расчетный эталонный размер генома (в п.н.) для расчета статистики NGx» :
11748793
(ранее оценено)- «Тип организма» :
Эукариоты (--эукариоты): использование GeneMark-ES для поиска генов, Barrnap для предсказания генов рибосомной РНК, BUSCO для поиска консервативных ортологов
- В «Гены» :
- «Инструмент для предсказания генов» :
Не предсказывать гены
вопрос Вопросы
- Сколько лесов в первичной сборке после гибридных лесов?
- Каков размер самого большого эшафота?
раствор Раствор
- Количество контигов 17.
- Самый большой контиг имеет длину 1.532.843 п.н.
Гибридные леса на основе картографических данных Hi-C
Hi-C — это молекулярный анализ на основе секвенирования, предназначенный для выявления областей частого физического взаимодействия в геноме путем измерения частоты контактов между всеми парами локусов, что позволяет нам получить представление о трехмерной организации генома (Dixon и др. 2012, Либерман-Айден и др. 2009).На этом заключительном этапе мы будем использовать тот факт, что частота контактов между парой локусов сильно коррелирует с одномерным расстоянием между ними, с целью связать каркасы Бионано с хромосомной шкалой.
Предварительная обработка данных Hi-C
Несмотря на то, что Hi-C генерирует парные чтения, нам нужно отображать каждое чтение отдельно. Это связано с тем, что большинство выравнивателей предполагают, что расстояние между прочтениями парных концов соответствует известному распределению, но в данных Hi-C размер вставки продукта лигирования может варьироваться от одной пары оснований до сотен мегануклеотидов (Lajoie et al. 2015).
практические занятия Практические занятия: сопоставление чтений Hi-C
- Карта с BWA-MEM Инструмент: toolsshed.g2.bx.psu.edu/repos/devteam/bwa/bwa_mem/0.7.17.2 со следующими параметрами:
- «Выберете ли вы эталонный геном из своей истории или воспользуетесь встроенным индексом?» :
Использовать геном из истории и построить индекс
- файл параметров «Использовать следующий набор данных в качестве эталонной последовательности» :
Первичная сборка бионано
- «Чтение с одного или двух концов» :
Одиночный
- файл параметров «Выбрать набор данных fastq» :
Hi-C_dataset_F
- «Установить информацию о группах чтения?» :
Не устанавливать
- «Выбор режима анализа» :
1.Простой режим Illumina
- «Режим сортировки BAM» :
Сортировка по прочитанным именам (т. е. по полю QNAME)
Переименуйте вывод как
BAM forward
- Карта с BWA-MEM Инструмент: toolsshed.g2.bx.psu.edu/repos/devteam/bwa/bwa_mem/0.7.17.2 со следующими параметрами:
- «Выберете ли вы эталонный геном из своей истории или воспользуетесь встроенным индексом?» :
Использовать геном из истории и построить индекс
- файл параметров «Использовать следующий набор данных в качестве эталонной последовательности» : Первичная сборка бионано`
- «Чтение с одного или двух концов» :
Одиночный
- файл параметров «Выбрать набор данных fastq» :
Hi-C_dataset_R
- «Установить информацию о группах чтения?» :
Не устанавливать
- «Выбор режима анализа» :
1.Простой режим Illumina
- «Режим сортировки BAM» :
Сортировка по прочитанным именам (т. е. по полю QNAME)
Переименуйте выход как
BAM reverse
- Фильтрация и слияние Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/bellerophon/bellerophon/1.0+galaxy0 химерные чтения из Arima Genomics со следующими параметрами:
- файл параметров «Первый набор чтений» :
BAM вперед
- файл параметров «Второй набор чтений» :
BAM обратное
- Переименуйте его как
BAM Hi-C читает
Наконец, нам нужно преобразовать файл BAM в формат BED и отсортировать его.
Создать исходную карту контактов Hi-C
После сопоставления показаний Hi-C следующим шагом является создание исходной карты контактов Hi-C, которая позволит нам сравнить карты контактов Hi-C до и после использования Hi-C для формирования каркаса.
практические занятия Практическое занятие: создание карты контактов с помощью PretextMap и Pretext Snapshot
- PretextMap Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/pretext_map/pretext_map/0.1.6+galaxy0 со следующими параметрами:
- файл параметров «Входной набор данных в формате SAM или BAM» :
Чтение BAM Hi-C
- «Сортировать по» :
Не сортировать
Переименуйте вывод как
PretextMap output
- Pretext Snapshot Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/pretext_snapshot/pretext_snapshot/0.0.3+galaxy0 со следующими параметрами:
- файл параметров «Входной файл карты претекста» :
Вывод PretextMap
- «Формат выходного изображения» :
png
- «Показать сетку?» :
Да
Давайте посмотрим на карты контактов Hi-C, сгенерированные Pretext Snapshot.
Рисунок 13: Карта Hi-C, сгенерированная Pretext. Полная карта контактов первичной сборки, созданная в ходе этого обучения (а) Карта Hi-C, представляющая типичную неправильную сборку (б).В контакте, полученном из сборки Bionano-скаффолдов, можно идентифицировать 17 каркасов, представляющих каждую из гаплоидных хромосом нашего генома (рис. 13.а). Тот факт, что все контактные сигналы находятся по диагонали, предполагает, что контиги были построены в правильном порядке. Однако при сборке сложных геномов в контактных картах обычно обнаруживаются индикаторы ошибок в процессе формирования каркаса, как показано на рис. 13б.В этом случае контиг, принадлежащий второй хромосоме, был заменен частью четвертой хромосомы. Мы также можем отметить, что конечная часть второй хромосомы должна располагаться в начале, как предполагает недиагональный контактный сигнал.
После того, как мы оценили качество сборки каркасного генома, следующим шагом будет интеграция информации, содержащейся в прочтениях HiC, в нашу сборку, чтобы можно было устранить любые обнаруженные ошибки. Для этого мы будем использовать SALSA2 (Ghurye et al. 2019).
Леса SALSA2
SALSA2 — это программное обеспечение с открытым исходным кодом, которое использует Hi-C для линейной ориентации и упорядочения собранных контигов вдоль целых хромосом (Ghurye et al. 2019). Одним из преимуществ SALSA2 по сравнению с большинством существующих инструментов для построения каркасов Hi-C является то, что для него не требуется расчетное количество хромосом.
Перед запуском SALSA2 нам нужно внести некоторые изменения в наши наборы данных.
практические занятия Практические занятия: преобразование BAM в BED
- постельные принадлежности BAM to BED Инструмент: сарай для инструментов.g2.bx.psu.edu/repos/iuc/bedtools/bedtools_bamtobed/2.30.0+galaxy1 со следующими параметрами:
- файл параметров «Преобразовать следующий файл BAM в BED» :
BAM Hi-C читает
- «Какой тип вывода BED вам нужен» :
Создать полный «заблокированный» файл BED из 12 столбцов
Переименуйте вывод как
BED несортированный
- Sort Инструмент: sort1 со следующими параметрами:
- файл параметров «Сортировка набора данных» :
BED несортированный
- «на столбце» :
Столбец: 4
- «со вкусом» :
По алфавиту
- «все включено» :
По возрастанию
Переименуйте вывод как
BED sorted
- Заменить Инструмент: инструментальный сарай.g2.bx.psu.edu/repos/bgruening/text_processing/tp_find_and_replace/1.1.3 со следующими параметрами:
- param-file «Файл для обработки» :
Первичная сборка bionano
- «Найти шаблон» :
:
- «Заменить все вхождения шаблона» :
Да
- «Найти и заменить текст в» :
вся строка
- Переименовать вывод как
Первичная сборка bionano отредактирована
Теперь мы можем запустить SALSA2, чтобы сгенерировать гибридные леса на основе данных Hi-C.
практические занятия Практические занятия: строительные леса для сальсы
- SALSA Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/salsa/salsa/2.3+galaxy0 со следующими параметрами:
- param-file «Файл начальной сборки» :
Первичная сборка bionano отредактирована
- файл параметров «Выравнивание кровати» :
Сортировка кровати
- «Последовательности рестрикционных ферментов» :
CTTAAG
- Переименуйте вывод как
SALSA2 эшафот FASTA
иSALSA2 эшафот AGP
Оцените строительные леса SALSA2 с помощью QUAST
Чтобы проанализировать, как информация, полученная при чтении HiC, способствовала улучшению нашей сборки, мы снова запустим QUAST.
практические занятия Практические занятия: оценка с помощью QUAST
- Quast Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/quast/quast/5.0.2+galaxy1 со следующими параметрами:
- «Использовать собственные имена для входных файлов?» :
Нет, использовать имена наборов данных
- файл параметров «Файл Contigs/scaffolds» :
Леса SALSA2 FASTA
- «Тип сборки» :
Геном
- «Использовать эталонный геном?» :
№
- «Расчетный эталонный размер генома (в п.н.) для расчета статистики NGx» :
11748793
(ранее оценено)- «Тип организма» :
Эукариоты (--эукариоты): использование GeneMark-ES для поиска генов, Barrnap для предсказания генов рибосомной РНК, BUSCO для поиска консервативных ортологов
- «Геном большой (> 100 Мбп)?» :
№
- Переименуйте HTML-отчет как
Окончательный отчет QUAST
Мы проанализируем результаты, полученные QUAST, чтобы оценить, в какой степени SALSA2 улучшил сборку нашего генома.
вопрос Вопросы
- Каков размер самых больших лесов?
- Сколько лесов в финальной сборке?
- Что такое статистика N50?
раствор Раствор
- Самый большой контиг имеет 1.532.843 п.н.
- Окончательная сборка включает 16 подмостей.
- Значение N50 составляет 923,452 п.н.
Оценить окончательную сборку генома с помощью Pretext: необязательный
Наконец, мы должны повторить процедуру, описанную ранее для создания карт контактов, но в этом случае мы будем использовать каркас, созданный SALSA2.
практические занятия Практическое занятие: сопоставление показаний с шаблоном
- Карта с BWA-MEM Инструмент: toolsshed.g2.bx.psu.edu/repos/devteam/bwa/bwa_mem/0.7.17.2 со следующими параметрами:
- «Выберете ли вы эталонный геном из своей истории или воспользуетесь встроенным индексом?» :
Использовать геном из истории и построить индекс
- файл параметров «Использовать следующий набор данных в качестве эталонной последовательности» :
scaffolds_fasta
(выход инструмента SALSA )- «Чтение с одного или двух концов» :
Одиночный
- файл параметров «Выбрать набор данных fastq» :
Hi-C_dataset_F
- «Установить информацию о группах чтения?» :
Не устанавливать
- «Выбор режима анализа» :
1.Простой режим Illumina
- «Режим сортировки BAM» :
Сортировка по прочитанным именам (т. е. по полю QNAME)
Переименуйте вывод как
BAM forward SALSA2
- Карта с BWA-MEM Инструмент: toolsshed.g2.bx.psu.edu/repos/devteam/bwa/bwa_mem/0.7.17.2 со следующими параметрами:
- «Выберете ли вы эталонный геном из своей истории или воспользуетесь встроенным индексом?» :
Использовать геном из истории и построить индекс
- файл параметров «Использовать следующий набор данных в качестве эталонной последовательности» :
SALSA2 скаффолд FASTA
- «Чтение с одного или двух концов» :
Одиночный
- файл параметров «Выбрать набор данных fastq» :
Hi-C_dataset_R
- «Установить информацию о группах чтения?» :
Не устанавливать
- «Выбор режима анализа» :
1.Простой режим Illumina
- «Режим сортировки BAM» :
Сортировка по прочитанным именам (т. е. по полю QNAME)
Переименуйте выход как
BAM reverse SALSA2
- Фильтрация и слияние Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/bellerophon/bellerophon/1.0+galaxy0 химерные чтения из Arima Genomics со следующими параметрами:
- файл параметров «Первый набор чтений» :
BAM forward SALSA2
- файл параметров «Второй набор чтений» :
BAM реверс SALSA2
Переименуйте вывод как
BAM Hi-C читает SALSA2
- PretextMap Инструмент: сарай.g2.bx.psu.edu/repos/iuc/pretext_map/pretext_map/0.1.6+galaxy0 со следующими параметрами:
- файл параметров «Входной набор данных в формате SAM или BAM» :
BAM Hi-C читает SALSA2
- «Сортировать по» :
Не сортировать
Переименуйте вывод как
PretextMap output SALSA2
- Pretext Snapshot Инструмент: toolsshed.g2.bx.psu.edu/repos/iuc/pretext_snapshot/pretext_snapshot/0.0.3+galaxy0 со следующими параметрами:
- файл параметров «Входной файл карты претекста» :
Выход PretextMap SALSA2
- «Формат выходного изображения» :
png
- «Показать сетку?» :
Да
Чтобы оценить гибридные леса Hi-C, мы собираемся сравнить карты контактов до и после запуска SALSA2 (рис.15).
Рис. 15. Карта Hi-C, сгенерированная Pretext после гибридного каркаса на основе данных Hi-C. Красные кружки указывают на различия между картой контактов, созданной после (а) и до (б) гибридных лесов Hi-C.Среди наиболее заметных отличий, которые можно выявить между картами контактов, можно выделить область под кружком в левом верхнем углу, где можно выявить инверсию.
Подводя итог, стоит сравнить окончательную сборку с S.cerevisiae эталонный геном S288C.
Рисунок 16: Сравнение окончательной сборки, созданной в этом обучении, и эталонного генома. График смежности с использованием эталонного размера генома (а). Статистика сборки (б).Что касается общей длины последовательности, мы можем сделать вывод, что размер сборки нашего генома практически идентичен эталонному геному (рис.16а,б). Обращает на себя внимание, что эталонный геном состоит из 17 последовательностей, тогда как в нашей сборке всего 16 хромосом.Это связано с тем, что эталонный геном также включает последовательность митохондриальной ДНК, которая состоит из 85 779 п.н. Остальные статистические данные имеют очень близкие значения (рис. 16b).
Рисунок 17: Сравнение карт контактов, созданных с использованием окончательной сборки (а) и эталонного генома (б).Если мы сравним карту контактов собранного нами генома (рис. 17а) с эталонной сборкой (рис. 17б), то увидим, что они практически идентичны. Это означает, что мы достигли почти идеальной сборки на уровне хромосом.
Ключевые точкиЕсть вопросы по этому уроку? Посетите страницу часто задаваемых вопросов по учебнику или страницу часто задаваемых вопросов по сборке, чтобы узнать, есть ли там ваш вопрос.Если нет, задайте свой вопрос на канале GTN Gitter или на Справочный форум Galaxy
Конвейер VGP позволяет генерировать безошибочные сборки генома почти без пробелов эталонного качества
Сборку можно разделить на четыре основных этапа: анализ профиля генома, поэтапная сборка HiFi long read с hifiasm, гибридные каркасы Bionano и гибридные каркасы Hi-C
- Marcotte, E.M., M. Pellegrini, T.O. Yeates, and D. Eisenberg, 1999 Перепись белковых повторов . Журнал молекулярной биологии 293: 151–160. 10.1006/jmbi.1999.3136
- Small, K.S., M. Brudno, M.M. Hill, and A. Sidow, 2007 Выравнивание гаплома и эталонная последовательность высокополиморфного генома Ciona savignyi .Биология генома 8: R41. 10.1186/gb-2007-8-3-r41
- Либерман-Эйден, Э., Н.Л. ван Беркум, Л. Уильямс, М. Имакаев, Т. Рагоци и др. , 2009 Всестороннее картирование дальних взаимодействий раскрывает принципы складывания генома человека . Наука 326: 289–293. 10.1126/наука.1181369
- Кремер Т. и Кремер М., 2010 г. Хромосомные территории . Перспективы Колд-Спринг-Харбор в биологии 2: a003889–a003889. 10.1101/cshperspect.a003889
- Диксон, Дж.Р., С. Селварадж, Ф. Юэ, А. Ким, Ю. Ли и др. , 2012 Топологические домены в геномах млекопитающих , выявленные путем анализа взаимодействий хроматина . Природа 485: 376–380. 10.1038/природа11082
- Френкель С., Киржнер В. и Король А., 2012 Организационная гетерогенность геномов позвоночных (В. Лауде, ред.). ПЛОС ОДИН 7: e32076. 10.1371/journal.pone.0032076
- Lam, E.T., A. Hastie, C. Lin, D. Ehrlich, S.K. Das et al. , 2012 Картирование генома на массивах наноканалов для анализа структурных вариаций и сборки последовательностей .Природная биотехнология 30: 771–776. 10.1038/нбт.2303
- Чалопин Д., М. Навиль, Ф. Плард, Д. Галиана и Ж.-Н. Volff, 2015 Сравнительный анализ мобильных элементов подчеркивает разнообразие подвижности и эволюцию у позвоночных . Геномная биология и эволюция 7: 567–580. 10.1093/gbe/evv005
- Лажуа, Б. Р., Дж. Деккер и Н. Каплан, 2015 г. Автостопом по анализу Hi-C: Практические рекомендации . Методы 72: 65–75. 10.1016/j.ymeth.2014.10.031
- Симао, Ф.А., Р. М. Уотерхаус, П. Иоаннидис, Е. В. Кривенцева и Е. М. Здобнов, 2015 BUSCO: оценка сборки генома и полноты аннотации с помощью однокопийных ортологов . Биоинформатика 31: 3210–3212. 10.1093/биоинформатика/btv351
- Sotero-Caio, C.G., R.N. Platt, A. Suh, and D.A. Ray, 2017 Эволюция и разнообразие мобильных элементов в геномах позвоночных . Геномная биология и эволюция 9: 161–177. 10.1093/gbe/evw264
- Ангел, В.Д.Д., Э. Хьерде, Л.Sterck, S. Capella-Gutierrez, C. Notredame и др. , 2018 Десять шагов , чтобы начать сборку генома и аннотацию . F1000Research 7: 148. 10.12688/f1000research.13598.1
- Li, H., 2018 Minimap2: попарное выравнивание нуклеотидных последовательностей (I. Birol, Ed.). Биоинформатика 34: 3094–3100. 10.1093/биоинформатика/bty191
- Роуч, М. Дж., С. А. Шмидт и А. Р. Борнеман, 2018 г. Чистящие гаплотиги: переназначение аллельных контигов для диплоидных геномных сборок третьего поколения .BMC Биоинформатика 19: 10.1186/s12859-018-2485-7
- Ghurye, J., A. Rhie, B.P. Walenz, A. Schmitt, S. Selvaraj et al. , 2019 Интеграция связей Hi-C с графами сборки для хромосомной сборки (Иошихес И., Ред.). PLOS Вычислительная биология 15: e1007273. 10.1371/journal.pcbi.1007273
- Guan, D., S.A. McCarthy, J. Wood, K. Howe, Y. Wang et al. , 2019 Выявление и устранение гаплотипической дупликации в первичных сборках генома .10.1101/729962
- Торресен, О.К., Б. Стар, П. Миер, М.А. Андраде-Наварро, А. Бейтман и др. , 2019 Тандемные повторы приводят к ошибкам сборки последовательности и создают многоуровневые проблемы для геномных и белковых баз данных . Исследование нуклеиновых кислот 47: 10994–11006. 10.1093/нар/гкз841
- Джани, А. М., Г. Р. Галло, Л. Джанфранчески и Г. Форменти, 2020 г. Долгий путь к геномике: история и современные подходы к секвенированию и сборке генома . Журнал вычислительной и структурной биотехнологии 18: 9–19.10.1016/j.csbj.2019.11.002
- Достопочтенный Т., К. Марс, Г. Янг, Ю.-К. Цай, Дж. В. Каралиус и др. , 2020 Высокоточные долгочитаемые данные секвенирования HiFi для пяти сложных геномов . Научные данные 7: 10.1038/s41597-020-00743-4
- Ranallo-Benavidez, T.R., K.S. Jaron, and M.C. Schatz, 2020 GenomeScope 2.0 и Smudgeplot для безреференсного профилирования полиплоидных геномов . Связь с природой 11: 10.1038/s41467-020-14998-3
- Ри, А., Б. П. Валенц, С. Корен и А. М. Филлиппи, 2020 г. Merqury: безреференсная оценка качества, полноты и поэтапной оценки сборок генома . Биология генома 21: 10.1186/s13059-020-02134-9
- Wang, H., B. Liu, Y. Zhang, F. Jiang, Y. Ren et al. , 2020 Оценка размера генома с использованием частот k-меров из скорректированных длинных прочтений . Препринт arXiv arXiv: 2003.11817.
- Юань Ю., С.Ю.-Л. Чанг и Т.-Ф. Chan, 2020 Достижения в области оптического картирования для геномных исследований .Журнал вычислительной и структурной биотехнологии 18: 2051–2062. 10.1016/j.csbj.2020.07.018
- Zhang, X., R. Wu, Y. Wang, J. Yu и H. Tang, 2020 Распаковка гаплотипов в диплоидных и полиплоидных геномах . Журнал вычислительной и структурной биотехнологии 18: 66–72. 10.1016/j.csbj.2019.11.011
- Cheng, H., G.T. Concepcion, X. Feng, H. Zhang и H. Li, 2021 Сборка de novo с разрешением гаплотипов с использованием поэтапных графов сборки с hifiasm . Природные методы 18: 170–175.10.1038/с41592-020-01056-5
- Dida, F., and G. Yi, 2021 Эмпирическая оценка методов сборки генома de novo . PeerJ Информатика 7: e636. 10.7717/peerj-cs.636
- Rhie, A., S.A. McCarthy, O. Fedrigo, J. Damas, G. Formenti et al. , 2021 На пути к полной и безошибочной сборке генома всех видов позвоночных . Природа 592: 737–746. 10.1038/с41586-021-03451-0
- Savara, J., T. Novosád, P. Gajdoš, and E. Kriegová, 2021 Сравнение структурных вариантов, обнаруженных с помощью оптического картирования, с долгочитаемым секвенированием следующего поколения (C.Кендзиорский, изд.). Биоинформатика 37: 3398–3404. 10.1093/биоинформатика/btab359
Вы использовали этот материал в качестве преподавателя? Не стесняйтесь оставлять нам отзывы о том, как все прошло.
Вы использовали этот материал как ученик или студент? Нажмите на форму ниже, чтобы оставить отзыв.
- Дельфин Ларивьер, Алекс Островский, Кристобаль Галлардо, Анна Сайм, Линель Абуэг, Брэндон Пикетт, Джулио Форменти, Марселла Соццони, 2022 Конвейер сборки VGP (Galaxy Training Materials) .https://training.galaxyproject.org/training-material/topics/assembly/tutorials/vgp_genome_assembly/tutorial.html Онлайн; доступ СЕГОДНЯ
- Batut et al., 2018 г.
детали BibTeXПоздравляем с успешным завершением этого урока!@misc{сборка-vgp_genome_assembly, автор = «Дельфина Ларивьер, Алекс Островский, Кристобаль Галлардо, Анна Сайм, Линель Абуэг, Брэндон Пикетт, Джулио Форменти и Марселла Соццони», title = "Конвейер сборки VGP (учебные материалы Galaxy)", год = "2022", месяц = "03", день = "08" url = "\url{https://training.galaxyproject.org/training-material/topics/assembly/tutorials/vgp_genome_assembly/tutorial.html}", note = "[В сети; доступ СЕГОДНЯ]" } @статья{Батут_2018, дои = {10.1016/j.cels.2018.05.012}, URL = {https://doi.org/10.1016%2Fj.cels.2018.05.012}, год = 2018, месяц = {июнь}, издатель = {Elsevier {BV}}, громкость = {6}, число = {6}, страницы = {752--758.e1}, автор = {B {\ '{e}} r {\ '{e}} милая Батут, Саския Хилтеманн, Андреа Баньякани, Дэннон Бейкер, Вивек Бхардвадж и Клеменс Бланк, Энтони Бретодо и Лорейн Брилле-Гу {\ '{e} } Гуен и Мартин Эч, Джон Чилтон, Дэйв Клементс, Оливия Доппельт-Азеруаль, Аника Эркслебен, Мэллори, Энн Фриберг, Саймон Гладман, Юри Хугстрат, Ганс-Рудольф Хотц, Торстен Хуварт, Пратик Ягтап и Дельфин Лариви {\`{e}}ре и Гильдас Ле Коргий{\'{e}} и Томас Манке и Фабьен Марёй и Фидель Рам {\'{\i}}рез и Девон Райан и Флориан Кристоф Сиглох и Никола Соранцо и Иоахим Вольф и Паванкумар Видем, и Маркус Вольфиен, и Айсанцзян Вубули, и Дилмурат Юсуф, и Джеймс Тейлор, и Рольф Баккофен, и Антон Некрутенко, и Бьорн Грюнинг}, title = {Обучение сообществу по анализу данных для биологии}, журнал = {Системы клеток} }
Vertebrate Genomes Project
Эти геномы будут использоваться для решения фундаментальных вопросов биологии и болезней, для выявления видов, генетически подверженных наибольшему риску исчезновения, и для сохранения генетической информации о жизни.Мотивация для VGP частично основана на миссии G10K по созданию геномов 10 000 или более видов позвоночных, а также на уроках, извлеченных из Проекта Филогеномики Птиц.
VGP будет завершена на основе таксономической иерархии, которая представляет собой относительное ранжирование группы организмов, начиная с самой большой классификации, домена, до самой маленькой классификации, видов: отряды (этап 1), семейства (этап 2) и От родов (этап 3) до всех видов (этап 4). Эта стратегия позволит нам получать научную информацию на каждом этапе, продолжать интегрировать новые технологии и проводить геномный анализ на все более высоких уровнях филогенетического масштаба.Кроме того, мы ожидаем, что наши подходы и вопросы на каждом этапе приведут к разработке новых алгоритмов, включая алгоритмы сборки генома, выравнивания, аннотаций, сравнительной геномики и т. д., которые затем будут применяться на следующем этапе. Этот подход также поможет нам получить необходимые средства поэтапно за счет грантов и других мероприятий по сбору средств.
На каждом этапе отбор видов основывается на сочетании критериев, в том числе видов с существующими черновыми геномами, нуждающимися в улучшении, видов со специфическими чертами, которые информируют нас о биологии человека, видов, находящихся под непосредственной угрозой исчезновения, и видов с заметными использовать в биомедицинских исследованиях.Исчезающие виды имеют высокий приоритет и имеют решающее значение, потому что наша планета переживает шестое массовое вымирание, худшее со времен вымирания динозавров 66 миллионов лет назад. Этот приоритет отчасти обусловлен влиянием человека на загрязнение, разрушение среды обитания и изменение климата. Наша планета находится под угрозой исчезновения 1 из 8 видов позвоночных (всего около 8000). Целью VGP является картирование ДНК этих подверженных риску видов, чтобы не только сохранить чертежи их геномов, но и помочь идентифицировать генетические варианты, которые могут защитить эти виды от полного исчезновения.Эти знания могут направлять стратегии сохранения, чтобы предотвратить или, по крайней мере, свести к минимуму потерю видов в результате воздействия человека на окружающую среду.
VGP намеревается использовать полученные геномные данные для многочисленных исследований. Список исследований, запланированных для Фазы 1 порядкового VGP, включает:
1. Генеалогическое древо позвоночных в масштабе генома.
2. Сравнительная геномика специализированных признаков в каждой линии позвоночных.
3. Сравнительная геномика конвергентных признаков (напр.грамм. обучение вокалу, полет, потеря конечностей и водная/наземная адаптация).
4. Разработка универсальной ортологии и номенклатуры генов позвоночных.
5. Расшифровка эволюции хромосомного генома позвоночных.
6. Реконструкция геномов общих предков всех позвоночных и ключевых ветвей позвоночных (например, млекопитающих, птиц, рептилий, амфибий, костистых, костистых позвоночных, челюстных позвоночных и четвероногих).
7. Эволюция нуклеотидов в хромосомы генома человека.
8.Генетика того, почему одни линии более устойчивы к болезням, чем другие.
9. Сохранение геномики вымирающих видов секвенировано.
10. Геномы всех оставшихся на планете попугаев какапо.
11. Генетические признаки одомашнивания у позвоночных.
12. Генетика определения пола и эволюция половых хромосом у позвоночных.
13. Эволюция типов клеток головного мозга и гомология с использованием геномики и транскриптомики.
14. Трехмерная структура генома позвоночных.
15. Последствия эволюционной битвы между транспозонами и факторами хозяина.
16. Новые алгоритмы для почти полных сборок генома.
17. Новые алгоритмы для безреференсного многовариантного выравнивания генома.
Узнайте больше о нашей политике использования данных здесь.
Широкие возможности новых договоров аренды, стимулирующих разработку рекордов
14 ноября 2019 г.
VGP NV («VGP» или «Группа»), ведущий европейский поставщик высококачественной логистической и полупромышленной недвижимости, сегодня опубликовала отчет о торговых операциях за первые десять месяцев 2019 года:
- Высокие операционные показатели, обусловленные рекордными новыми договорами аренды
- Сильный рост лизинга по всему портфелю, что привело к рекордным 39 евро.Чистый прирост на 3 млн подписанных и продленных договоров аренды, в результате чего общий годовой доход от аренды составил 143,6 млн евро (+37,9% с начала года), а средний срок аренды портфеля увеличился до 8,8 лет (против 7,8 на декабрь 2018 г.)
- Рекорд по 34 строящимся проектам общей площадью 705 000 м 2 или 37,3 млн евро дополнительной годовой арендной платы после завершения строительства и сдачи в аренду. Портфель в стадии строительства, включая проекты, которые будут запущены в течение следующих шести месяцев, составляет 75% до сдачи в аренду
- В 2019 г. реализовано 16 проектов общей площадью 255 000 м 2 (100% загрузка)
- Пополнение земельного банка для обеспечения будущего роста
- Поддерживаемый трубопровод через 2.50 млн м 93 537 2 93 538 новой земли куплено и еще 2,13 млн м 93 537 2 93 538 введено в действие при наличии разрешений
- Общий земельный банк, приобретенный и закрепленный в размере 6,18 млн м 2 , который поддерживает 2,76 млн м 2 будущей сдаваемой в аренду площади
- Продолжение оборота денежных средств и укрепление базы финансирования
- Успешное первое закрытие совместного предприятия VGP European Logistics 2 31 июля позволило рециркулировать 96 миллионов евро валовой выручки
- Ожидается, что шестое закрытие совместного предприятия VGP European Logistics состоится в конце ноября 2019 года с ожидаемой валовой выручкой около 130 миллионов евро
- Расширенные цели в области устойчивого развития, установленные на 2020 год и далее: 100 % новых разработок должны получить сертификат BREEAM «Очень хорошо» или его эквивалент и упор на увеличение производства возобновляемой энергии во всей группе
Общее разрешение на судно в двух словах
19 декабря 2013 года Агентство по охране окружающей среды (EPA) Соединенных Штатов Америки выдало пересмотренное Генеральное разрешение на эксплуатацию судна (VGP).Узнайте о последствиях для судовладельцев и о наших решениях для герметизации, совместимых с VGP! VGP предписывает использование экологически приемлемых смазочных материалов (EAL) на всех поверхностях раздела нефть-вода (например, уплотнения дейдвудной трубы, уплотнения подруливающих устройств) на всех торговых судах длиной 79 футов и более, которые плавают в прибрежных и внутренних водах США, если только технически невыполнимо.
Владеете судном длиной менее 79 футов и работаете в водах США? Тогда вы должны соответствовать требованиям Генерального разрешения на маломерное судно.Прочтите наш блог о sVGP, чтобы узнать, каковы последствия.
Экологически приемлемый смазочный материал (EAL)
Согласно VGP, обычное уплотнение имеет контакт масло-море, а EPA указывает, что для каждого интерфейса масло-море необходимо использовать экологически приемлемую смазку (EAL). Эти смазочные материалы являются биоразлагаемыми, не склонными к биоаккумуляции и минимально токсичными. Они должны быть одобрены программами маркировки, такими как Blue Angel, European Ecolabel, Nordic Swan, шведскими стандартами SS 155434 и 155470, OSPAR и DfE Агентства по охране окружающей среды.Не каждое био-масло является EAL. Всегда уточняйте у поставщика масла, соответствует ли предполагаемый смазочный материал требованиям VGP.
NBR из резиновой смеси FKM?
Если вы хотите плавать с EAL, вы должны проверить совместимость EAL с резиновой смесью уплотнения. В большинстве случаев компаунд FKM будет использоваться вместе с EAL, но ни один EAL не является одинаковым, и поэтому нет гарантии, что наши уплотнения совместимы со всеми EAL. У нас есть список протестированных EAL с резиновыми смесями Lagersmit.Актуальный список EAL можно найти на сайте www.lagersmit.com/eal.
Если вы пропустите определенное масло в нашем списке EAL, поставщик масла может отправить запрос в наш отдел технологий и процессов (г-н Пепейн Сварте – [email protected]). Если масло было проверено, но не одобрено, мы советуем использовать другое одобренное масло. В этом случае лучше обратиться к поставщику масла, чтобы получить наилучшие рекомендации относительно того, какое масло использовать.
Техническая неосуществимость
VGP указывает, что указанные суда должны использовать EAL, если это не считается технически неосуществимым.Это означает, что альтернатива EAL недоступна для данного приложения или правильный EAL недоступен в следующем порту захода. Кроме того, допускается плавание на минеральном масле, если замена масла невозможна без захода в сухой док. Это правило распространяется на наши уплотнения. Однако масло все равно приходится менять при первой же возможности при переходе в сухой док. Уплотнения не могут быть заменены на плаву, потому что дейдвудная труба и уплотнение должны быть осушены и очищены, а резиновые манжетные уплотнения должны быть заменены.Если эта процедура не используется, существует возможность смешивания EAL и минеральных масел. Это может серьезно повредить манжетные уплотнения.
Если вы хотите отплыть на основании вышеизложенного, необходимо письмо о технической невозможности, и этот документ должен постоянно находиться на судне, чтобы его можно было показать властям.
Альтернативная конструкция уплотнения вместо EAL
Вместо использования EAL также можно использовать уплотнение альтернативной конструкции. Эти конструкции уплотнений часто представляют собой уплотнения типа воздух/вакуум/пустота, которые собирают любую утечку в/в сливной бак.Агентство по охране окружающей среды США не выдает предварительных разрешений на эти альтернативные конструкции уплотнений, но рекомендует классификационному обществу провести стороннюю проверку того, что конструкция уплотнения вряд ли будет протекать при нормальной эксплуатации и, следовательно, больше не будет функционировать как масло в масло. морской интерфейс. Примерами альтернативных конструкций уплотнений являются уплотнения воздушного типа Supreme Ventus® и Supreme Athmos®.
Заявление Агентства по охране окружающей среды
«Типичное воздушное уплотнение или уплотнение пустотного пространства функционирует при наличии как минимум двух независимых систем уплотнения: одна со стороны уплотнения, обращенной к маслу, и одна со стороны уплотнения, обращенной к воде.Воздушная камера или пустое пространство между этими двумя уплотнениями собирает воду перед ее перекачкой для дальнейшего повторного использования или обработки. Эти конструкции уплотнений, при надлежащем обслуживании и достаточном опорожнении, могут полностью исключить подтекание масла или утечку в окружающую воду, поскольку утечка улавливается в пустом пространстве, а затем осушается внутри и захватывается судном».
Чем мы можем вам помочь
Независимо от того, хотите ли вы получить письмо о технической невозможности или получить дополнительную информацию о нашем утверждении DNV GL, которое соответствует решениям по герметизации VGP Supreme Ventus и Supreme Athmos, мы можем вам помочь.
Как решить 11 распространенных проблем с изгибом с помощью VGP3D
Гибка труб — сложный процесс. VGP3D решает наиболее распространенные проблемы в удобной для пользователя форме и помогает пользователю производить правильные и воспроизводимые детали.
Вот некоторые из наиболее распространенных проблем, возникающих при гибке труб, и способы их решения с помощью VGP3D:
Гибка труб — сложный процесс. VGP3D решает наиболее распространенные проблемы в удобной для пользователя форме и помогает пользователю производить правильные и воспроизводимые детали.
1. Инструменты для гибки труб: можно ли сократить время смены инструмента?
Инструменты для гибки труб так же важны, как и гибочный станок, для получения качественных результатов.
Меньшие партии продукции требуют более частого переоснащения трубогибочного станка , иногда даже несколько раз в день.
На обычных станках оператор должен выполнять операции по наладке при установке нового набора инструментов на станок, включая геометрическое выравнивание компонентов и регулировку сил усилителя и усилия зажима , цангового патрона и прижимной матрицы .
Эти операции имеют решающее значение для качественной гибки трубы, т. е. без складок и других дефектов, таких как следы зажима или деформации.
Ручная регулировка этих параметров может занять много времени даже у опытных операторов, особенно на гидравлических трубогибочных станках, а также на старых моделях с ЧПУ.
VGP3D сохраняет все параметры настройки инструмента в программе обработки деталей, включая положение оси и момент зажима, чтобы сократить время, необходимое для ручной настройки.
Если набор инструментов никогда ранее не использовался, VGP3D может автоматически определить рабочее положение зажима, пресс-формы и цанги, выполнив цикл автоматической калибровки инструмента .
Дизайн интерфейса инструментов также важен для сокращения времени переоснащения. В трубогибочных станках BLM GROUP система быстрой смены инструмента значительно сокращает время, необходимое оператору для снятия набора инструментов и установки нового.
2.Прототипирование: можно ли быстрее делать новые образцы?
На современном рынке производители все чаще сталкиваются с необходимостью быстрого изготовления прототипов или небольших партий по индивидуальному заказу.
При гибке труб другая геометрия изготавливаемой детали может привести к другому поведению материала с точки зрения процентного удлинения и пружинения.
На гидравлических трубогибочных станках или старых трубогибочных станках с ЧПУ процесс гибки доводили методом проб и ошибок.Желаемый результат был достигнут только после затрат драгоценного времени и материала на тропы.
Используя информацию, содержащуюся в шаблоне , VGP3D знает поведение материала даже для другой геометрии детали.
Шаблон VGP3D содержит всю информацию о станке, наборе инструментов и, что наиболее важно, о поведении трубы, независимо от того, следует ли использовать фиксированный радиус или переменный радиус изгиба.
Эта возможность позволяет изготовить новую деталь всего за несколько минут.По сути, время, необходимое для импорта чертежа заказчика или ввода новых координат гибки, и правильная деталь с самого начала.
Дизайнер/конечный пользователь может даже присутствовать при создании прототипа, вносить необходимые изменения и принимать активное участие в окончательной доработке нового дизайна.
3. Пружинящий возврат: можно ли быстро определить точный угол изгиба даже без опыта?
Как и в любом процессе пластической деформации , часть энергии, передаваемой заготовке для изменения ее формы, неизбежно запасается в виде упругой энергии.После устранения силы деформации эта энергия высвобождается, и заготовка имеет тенденцию частично возвращаться к своей первоначальной форме.
При изгибе трубы вызывает пружинение изогнутой трубы . Другими словами, изгиб немного открывается после того, как усилие изгиба снимается после достижения желаемого угла изгиба .
Упругость не является фиксированной величиной и зависит от многих факторов, включая материал, угол изгиба, диаметр трубы, толщину и т. д.
Упругость корректируется путем изгиба трубки чуть больше теоретического значения.Традиционно оператору приходится методом проб и ошибок находить коррекцию для каждого из изгибов.
Опыт в этом случае необходим для сокращения количества попыток, а также потерь времени и материалов.
Путем измерения пружинения для трех разных углов изгиба утилита VGP3D B_Tools может рассчитать величину коррекции пружинения для любого угла изгиба.
Когда известно поведение трубы, данные сохраняются вместе с программой обработки детали.Эти данные можно использовать в будущем для гибки другой детали другой формы, изготовленной из того же материала. В результате получается деталь с самого начала без необходимости проб и ошибок .
VGP3D может рассчитать правильные координаты изгиба для компенсации пружинения и удлинения материала.
4. Удлинение: можно ли сделать прямые между изгибами нужной длины?
Трубка никогда не сохраняет исходную длину после изгиба.
При изгибе материал растягивается в области изгиба . Это означает, что общая длина будет больше теоретической модели, включая прямые участки между изгибами.
Эффект пружинения, который вызывает увеличение среднего радиуса изгиба , также должен быть принят во внимание.
Таким образом, растяжение трубы делает прямые участки длиннее, а пружинение уменьшает их. Два противоположных эффекта изменяют размеры конечной детали.
Традиционно единственным решением был опыт оператора, который методом проб и ошибок изготавливал деталь с нужными размерами.
Используя B_Tools, VGP3D вычисляет удлинение каждой прямой части и корректирует координаты, чтобы деталь была правильной с самого начала, без необходимости проб и ошибок.
VGP3D также вычисляет общее удлинение и сообщает оператору точную длину прямой трубы, которую нужно отрезать, чтобы получить последнюю прямую часть с точной длиной после изгиба .
Эта информация очень полезна для экономии материала и дополнительного процесса резки, особенно когда производственные партии быстро меняются.
5. Координаты изгиба и декартовы координаты: могу ли я легко пересчитать их, если я изменю радиус центральной линии?
Иногда гибочные инструменты, необходимые для гибки детали с радиусом центральной линии , указанным на чертеже, присланном заказчиком, отсутствуют.
В большинстве случаев заказчик соглашается изменить радиус в определенных пределах в зависимости от наличия гибочного инструмента.
Однако при изменении радиуса центральной линии необходимо изменить координаты изгиба , чтобы они соответствовали окончательным размерам детали.
VGP3D может эффективно обрабатывать декартовых координат (положение в пространстве точек пересечения прямых участков трубы) или координат изгиба (длина прямолинейного участка, поворот плоскости изгиба, угол изгиба). Если радиус центральной линии изменяется, как и любое другое значение в одной системе координат, изменение автоматически выполняется мгновенно также и в другой системе.
Таким образом, радиус центральной линии может быть изменен в кратчайшие сроки.
Изогнутая труба и относительные координаты на VGP3D.
6. Сварной шов должен располагаться в определенном положении: не забудет ли мой оператор это сделать?
Положение сварного шва во время гибки является еще одним аспектом, влияющим на реакцию трубы на деформацию.
Процесс сварки локально изменяет механические характеристики металла.Следовательно, различное положение сварного шва приведет к различным значениям упругости .
Для получения воспроизводимых результатов необходимо, чтобы сварной шов всегда находился в одном и том же положении.
Если доверить оператору правильное выравнивание сварного шва, возникают две проблемы, обе связанные с человеческим фактором, который может привести к отбраковке изогнутой детали:
- Оператор забывает сориентировать сварной шов во время загрузки трубы.
- Оператор устает и больше не ориентирует сварной шов с той же точностью во время загрузки .
Используя поиск отверстия и/или обнаружение сварного шва , VGP3D может автоматически ориентировать трубу в начале каждого цикла, поддерживая постоянную точность выравнивания .
С помощью одного и того же датчика VGP3D может обнаружить и сориентировать любые отверстия или даже маркировку на трубе , чтобы они всегда располагались правильно на готовой детали.
Датчик обнаружения отверстия и обнаружения сварного шва на левом и правом трубогибочном станке с ЧПУ в процессе E-TURN.
Узнайте больше о том, как сварной шов влияет на процессы гибки и резки труб
7. Анализ осуществимости: есть ли у меня на складе нужные инструменты для этой новой детали?
После отправки чертежа заказчик хочет быстро узнать стоимость и сроки изготовления детали.
Наличие гибочных инструментов является ключевым фактором, определяющим время выполнения заказа.Чтобы иметь возможность быстро ответить клиенту с предложением, вам необходимо знать, есть ли необходимый набор инструментов на складе, полный ли он, используется ли он уже на других машинах и в каком он состоянии.
Если у вас много инструментов, быстро получить всю эту информацию может быть сложно. Если часть набора инструментов отсутствует, вы можете уточнить у заказчика, согласится ли он согнуть деталь с немного другим диаметром трубы или радиусом осевой линии. Если он соглашается, количество проверяемых инструментов увеличивается.
.
BLM GROUP разработала Tool Room , пакет программного обеспечения для управления гибочным инструментом, чтобы решить эту проблему.
Пользователь может получить доступ к Tool Room напрямую из VGP3D.
Инструментальная комната ищет на складе инструменты для набора инструментов для гибки, необходимого для гибки запрограммированной детали, если нужные инструменты недоступны, предлагает альтернативы , способные изготовить деталь с незначительными геометрическими отличиями.
В Инструментальной комнате пользователь также может проверить, не используются ли инструменты на других станках, и, если это не так, подготавливает лист заявки на их получение со склада.
Если инструменты не существуют и другие подобные инструменты не могут быть использованы, Конструктор инструментов позволяет пользователю загрузить полные механические чертежи необходимых инструментов для гибки .
Получение чертежей с помощью Tool Designer занимает всего несколько минут. После получения вы можете оценить время, необходимое для изготовления инструментов, и сообщить клиенту стоимость и время выполнения запрошенной детали.
8.Риск столкновения: могу ли я без опасений начать производство на машине?
Работая со старыми станками с ЧПУ или гидравлическими трубогибочными станками, вам необходимо сгибать первую деталь на малой скорости, постоянно проверяя отсутствие столкновений и удерживая руку на кнопке E-STOP, чтобы при необходимости быстро отключить станок.
VGP3D проверяет отсутствие столкновений во время операции гибки труб, запуская реалистичную симуляцию всего рабочего цикла, включая загрузку и разгрузку.
При моделировании используются 3D-модели с правильными размерами каждого компонента станка, инструмента, погрузчика и любых дополнительных элементов, таких как принадлежности, конвейерные ленты и т.д.
Это дает вам уверенность в том, что при моделировании цикла гибки в VGP вы фактически наблюдаете, что будет происходить на станке во время реального цикла гибки.
Моделирование цикла изгиба на VGP3D с выделенным столкновением.
9.Могу ли я безопасно согнуть трубу с формованным концом или трубу с фланцами?
Это часто происходит, особенно в таких секторах, как автомобилестроение, ОВКВ, промышленные транспортные средства и аэрокосмическая промышленность, где трубы используются в качестве проводников жидкости, а фланцы и/или концевые профили требуются для окончательной сборки системы.
Эти элементы представляют опасность столкновения (со станком или частью набора инструментов для гибки) во время цикла гибки.
Если у оператора нет реальной симуляции рабочего цикла , проверка на столкновение должна выполняться на станке вручную, как и в предыдущем случае.
Используя функцию B_3D_Part , VGP3D может импортировать 3D-модели дополнительных элементов трубы (фланцы, концевая опалубка или любые другие детали, прикрепленные к трубе), размещать их соответствующим образом на трубе, выполнять моделирование машинного цикла, и предупреждать оператора о любых потенциальных столкновениях.
Моделирование цикла гибки гнутых труб на VGP3D.
Откройте для себя специализированные системы для производства гнутых, обрезанных и гнутых труб из рулонов
10.У меня есть чертеж сборки нескольких труб в STEP или IGES: могу ли я быстро перейти от 3D-модели к программе обработки деталей?
На гидравлических трубогибочных станках или старых трубогибочных станках с ЧПУ оператору требуется много времени для подготовки программы обработки детали.
Одним из наиболее трудоемких действий является преобразование размеров на чертеже в координаты гибки.
Используя B_Import , VGP3D может импортировать файл STEP или IGES детали и автоматически получить координаты изгиба .
После выбора модели гибочного станка оператор готов смоделировать рабочий цикл и начать производство в полной безопасности.
11. Я спроектировал свою трубу в VGP3D: могу ли я экспортировать окончательную программу обработки детали в файл САПР?
Во время технико-экономического обоснования могут потребоваться некоторые модификации для гибки детали на станке.
Изменения, внесенные на этапе программирования, также должны быть приняты заказчиком, поскольку могут быть различия в окончательной геометрии детали .
В прошлом производители были вынуждены объяснять покупателю изменения, необходимые для того, чтобы деталь стала возможной, по телефону или просить технический отдел включить эти изменения в механический чертеж детали.
Это больше не требуется для VGP3D.
С помощью B_Export изменения, внесенные в координаты изгиба детали во время программирования, могут быть экспортированы в новую 3D-модель (IGES или STEP) для отправки заказчику для принятия.Это значительно экономит время и исключает вероятность неприятных недоразумений.
Выводы
Гибка труб — сложный процесс. VGP3D решает наиболее распространенные проблемы с изгибом для получения правильных деталей и воспроизводимых результатов.
BLM GROUP предлагает специальные учебные курсы, чтобы помочь клиентам полностью реализовать потенциал программного обеспечения и его многочисленных функций.
Ein Fehler ist aufgetreten (404)
такойбегриф
Документы Все
Документация
Группа AlleHome ЭЛЬСТЕР-Instromet Produkte Archiv Brennwertmesstechnik Электроник Data Logger DL210 Модем EM260 Programmsystem ГАЗ-РАБОТЫ ПО WinPADS Gasdruckregelgeräte Gasmessgeräte Turbinenradgaszähler SM-RI-2 Brennwertmesstechnik Energiemessgerät EnSonic (Produktion eingestellt) Gasbeschaffenheits-измерительные приборы газовой лаборатории Q1 унд GasLab Q2 Gasqualitätsmessgerät EnCal 3000 proChain Gasqualitätsmessgerät EnCal 3000 унд EnCal 3000 Quad Datenspeicher Datenspeicher Регистратор данных DL230 потока Компьютер Brennwertmengenumwerter газа-сеть F1 Encore ВМ1 Encore РС1 Encore МС1 Encore ZM1 FC2000 Mengenumwerter газа-сеть Z0 Mengenumwerter газа-сеть Z1 Gasdruckregelgeräte Hochdruckregler Осевые клапан Mitteldruckregler Gasdruckregelgerät J – Mitteldruck Gasdruckregelgerät M2R Gasdruckregelgerät МАФ Gasdruckregelgerät MR Niederdruckregler Gasdruckregelgerät HR Gasdruckregelgerät J – Niederdruck Gasdruckregelgerät NDAF Gasdruckregelgerät ZR, ZRE, ZRH Sicherheitsgeräte Zubehör Anschlussstücke Gasmessgeräte Balgengaszähler Balgengaszähler BK-G1,6 Balgengaszähler BK-G10 / G16 Balgengaszähler BK-G2,5 Balgengaszähler BK-G25 Balgengaszähler BK-G4 Balgengaszähler BK-G40 / 65/100 Balgengaszähler BK- О6 Hochdruck-Balgengaszähler HDBGZ Impulsnehmer В-Z6x Drehkolbengaszähler Drehkolbengaszähler ИРМ-1 Drehkolbengaszähler ИРМ-3 ДУО Drehkolbengaszähler РАБО G16 – G250 Drehkolbengaszähler РВГ G16 – G400 Drehkolbengaszähler РВГ ST G10 – G25 Impulsgeber Е1-Sxxx N NJ унд SJ S1 S2 Si35-K10- Y1 Litergaszähler Experientiergaszähler, Nasse Bauart Experationiergaszähler, Trockene Bauart Turbinenradgaszähler un un un un qa / qee qaemungsgleichrichter BLN und k turbinenradgaszähler sm-ri-x turbinenradgaszähler trz2 Turbinenradialgaszähler TRRZ Ultraschallgaszähler Checksonic-vx: Ultraschallgaszähler Ultraschallgaszähler Ultraschallgaszähler Q.Звуковой Ultraschallmeter USM Zählwerksvarianten АБСОЛЮТ-ДАТЧИК S1 / S11D / MI-2 / AE LIS-200, Datenübertragung, Программное обеспечение Datenauswertung Software WinLOOK Datenfernübertragung Meldegeräte, Шлюзы Encore DC1 Encore МС1 Mengenumwerter / Kommunikationstechnik Kommunikationstechnik Funktionseinheit FE260 Mengenumwerter EK205: Elektronischer Mengenumwerter EK220: Elektronischer Mengenumwerter EK280 : Elektronischer Mengenumwerter Parametrierungs-, Datenerfassungs-Software Lokale Datenerfassung Read Mobile Smart Metering ACM: Kommunikationsmodule AE: АБСОЛЮТ-ДАТЧИК AE: Protokollvarianten ECM: Kommunikationsmodule Elektronisches Zählwerk Смарт клапан Systeme унд Lösungen наблюдательным Люкс Wasserstoff им Erdgasnetz Allgemeine Kundeninformationen Herstellererklärungen Thermal Solutions Dienstleistungen Kundenschulungen Planungshandbuch Gastechnik Grundlagen Technischer Service Produkte 01 Kuge lhähne und Filter AKT – Kugelhähne AKT..TAS – Kugelhähne MIT Thermischer Armaturen-SiCherung GFK – Galfilter Manuelle Gaz-Apperrventile TAS – Thermische Armaturen-SiCherungen 02 Drauckler Gaz-Drauckler Maxon GDJ – Gas-Druckler Gik – Galeichdrucklerucler Gikh – Verhältnisdruckrecler J78R, 60DJ – Gas-Druckler JSAV – Sicherheitsabsperrventile вар – Umlauf- унд Abblaseregler VGBF – Газ-Druckregler VSBV – Abblaseventil 03 Ventile унд Stellantriebe 8000 Serie – Pneumatische Sicherheitsabsperrventile 8000 Serie – Pneumatische Sicherheitsabsperrventile für Flüssigkeitsbetrieb BV – Drosselklappen BV-Пак – Drosselklappen мит Stellantrieb BVG, BVA, BVH – Drosselklappen ДКР – Drosselklappen Elektromechanisches Hochdruck-Gas-Sicherheitsabsperrventil Elektromechanisches Hochdruck-Öl-Sicherheitsabsperrventil IC – Stellantriebe IFC, VFC – Linearstellglieder MB 7/BVHM – Luft-Magnetklappen SM-Style ART LPOATIO® Motor ART LPOATIO® K® CV – Elektronisches Regelventil SMARTLINK® DS – Stellantriebe SMARTLINK® MRV – Elektronische Verbundregelungen ТК – Dichtheitskontrollen V4046, V8046 V4062 Zündgasventile Stellantriebe V47 / В87 / VR / ВМУ Baureihe V48, V88 Membranventile für Gas V4943, V8943 Einstufige Druckregelventile V4944B, L, N / 8944B, C, L, N ZWEISTUFIGE DRUCCEGELVELLVENTILE FÜR GAS GAS V5055 Industrielle Gazentile, V4055 Stellantriebe V5097 KompaktgaSstrecke VAA – Luft-Magnetventile VAD, VAG, VAH, VAV – Druckerler MIT Magnetventil Valvario-Zubehör VAS – ABBLASE-MAGNETVENTILIL VAS, VCS – Газ MagnetVentile ve, V4295 – Газомагнитное вентиляционное вентиляционное др Сери Н.И. Фюр Ден Einsatz в ExplosionsgefährdeTen Bereichen Вентиляционная трасса В.Г. – Газомагнитный VGP – Газомагнитный ВК – Газомотоснетный WBV-H – Drosselklappen в Zwischenflanschbauise Für Heißluft 04 Druckwächter C6097 – Газ -Druckwächter CPS – Luft-Druckwächter DG – Gas-Druckwächter D ГРАММ..C – Gas-Druckwächter DGM, DWR – Gas-Druckwächter DL..A – Luft-Druckwächter DL..E – Luft-Druckwächter DL..K – Luft-Druckwächter L404F, T, V – Stufige Druckwächter PressureTrol® , B407 , W – grenzwertregler PressuRetrol® L408J – Regler VAPORSTAT® L91A, B – Modulierende Druckwächter PressuRetrol® 05 KOMPAKTEINHEITILEN RVS – REGELVENTILE RV, REGELVENTILE MIT MAGNETVENTIL SERIE VQ400 / 800 SERIE VR400 / VR800 Smartfire® – интеллигенты VerbrennungsManagementsyStem 06 Elektr.Flammenüberwachung und Steuerung (IFM) – Industryle Flammenüberwachung 600U сигнал Prozessoren 700SP сигнал Prozessoren und-und-und-unskopf u2-s lwl-verlängerung fasa p522 сигнал prozessoren p53x сигнал prozessoren s5xx flammendetektoren watchdog iii flare-monitor zündvorrichtung der Serie GHE Abgekündigte Brennermanagementsysteme BCU 370 – Brennersteuerung BCU 4, поколение 2019 – Brennersteuerungen BCU 400 – Brennersteuerungen BCU 560, BCU 565, BCU 580 – Brennersteuerungen BCU 570 – Brennersteuerung БГТ – Baugruppenträger FCU – Ofenschutzsystem-Steuerung FDU 510, FDU 520 – Flammenwächter МФС 110IM, 111IM – GASFEUERUNGSAUTOMATEN IFS / IFD 244 – GASFEUERUNGSAUTOMATEMATEN IFS / IFD 258 – GASFEUERUNGSAUTOMATEN IFW 15 – FLAMMENWÄCHTER IFW 50 – Flammenwächter Für Dauerbetrieb MPT 700 – Taktsteuerung PFA 700 – Feldbusshaltung Pff – Flammenwächter PFP 700 – Stromversorgu нг РПП 704 – Relais-Baugruppe ОРП – Gasfeuerungsautomaten R4343 Flammenwächter Серия 7800 – Brennersteuerung ШИФЕРНОЙ ™ – Verbrennungsmanagementsystem СОЛА – Kesselsteuerung Термическое IQ ™ – Fernüberwachungslösung 07 Industriebrenner 07a Бреннер für директ beheizte Ofen СУВ / Би – Бета-газ унд -Ölbrenner BIC, BICA , ZIC – Бреннер Фюр Гас Бреннергет 050 Brennergröße 065 Brennergröße 080 Brennergröße 100 Brennergröße 125 Brennergröße 140 Brennergröße 165 Brennergröße 200 TSC – KeramikrohRsets Bic..L – Luftüberschussbrenner Bic..m – Low-Nox-Brenner Bio, Bioa, Zio – Brenner Für Gas Brennergröße 050 Brennergröße 065 Brennergröße 080 Brennergröße 100 Brennergröße 165 Brennergröße 200 Extensoheat – Lanzenbrenner Furnnox – Ultra-Low-Nox- Brenner Kinemax® – Gasbrenner NMC – Mündungsmischende Gaz- und Ölbrenner Ringspaltbrenner RKG – Kegelgasbrenner Thermjet TJ – HochzeschwindigkeitsBrenner Triox – Driafach Luftgestufter Ultra-Low-Nox-Brenner THG (P) – Flachflammen-Gasbrenner-Systeme WHG, WHG-H – Flachflammen-Gasbrenner Whi – Low-Nox-Invisiflame® – Flachflammen-Gasbrenner Широкий Range® – Mehrstoffbrenner 07b Rekuperator- und rathlrohrrenner BiCR – Brenner Mit Integioertem Rekuperator BU – Rekuperator Bayonet Ultra Ecomax Le – Low-Nox-Rekuperatorbrenner ecoMax – Rekuperatorbrenner Ser – Mantelstrhlrohrrenner C – Strahlrohr SIC Aflex – SegmentFlammrohr TFB – Strahl- und Tauchrohrennernner uni-rad® – Strahlrohrenner 07C Saustoffbrenner und Brenner Für Die Glasindustrie 04V – Luft-Gas-Brenner Brightfire 200 – Luft-Gas-Brenner Горелка нагрева – Zubeizungssysteme Montagehalterungen und Zubehör Für Glasbrenner Oxytherm® 300 – Saustoffbrenner oxytherm® FHR – Saustoffbrenner oxytherm® Le – Saustoffbrenner oxytherm® Titan – Saustoffbrenner Premafire 100 – Saustoffbrenner Premfire 300 – Saustoffbrenner Premfire 400 – Saustoffbrenner Privetfire FH (следующий Gen) – Saustoffbrenner WGD – LUFT-GAS-AROPPORT-BRENNER WTPU – LUFT -Öl-rosport-Brenner WTPUG – LUFT-GAS-AROPPORT-BRENNER 07D LINEIEN- und Kanalbrenner Für Die Lufterwärmung AH-MA Dualblock – Kanalbrenner AH-MA – KANALBRENNER AIRHEAT V1 – Linienbrenner Airheats V2 – Linienbrenner APX – Linienbrenner Boystifume® – Kanalbrenner Crossfire ® – Низкий азот OX-Brenner Fluefire – Kanalbrenner HC Airflo® – Kanalbrenner Linnox – Line-Nox-Brenner Linoflame® – Pass-Linienbrenner LV Airflo® – Kanalbrenner Minnox – LiLEx-Brenner NP-Le Airflo® – Linienbrenner NP-RG Airflo® – Linienbrenner Radmax® – Strahlungsbrenner Ratiostar – Kanalbrenner 07e Brenner Für Die Lufterwärmung Heatpak – Kompaktes Brennersystem incini-Cone – Brenner Für Gas und Öl Kinedizer® Le – Low-Nox-Einzelbrenner M-Pakt® – Ultra-Now-Nox-Brenner Megafire® HD – Mehrstoffbrenner optima ™ SLS – Brenner Ovenpak® 400 – Niedertemperatur-Einzelbrenner ovenpak® 500 – Niedertemperrenner-Einzelbrenner ovenpak® LE – NOX-EINZELBRENNER Ratioair – Brenner Für Die Lufterwärmung Ratiomatomate – Brenner Für Die Lufterwärmung Smart Burner BCU MIT Brennereinheit Heatpak Smart Burner mit Brennersystem OVENPAK® LE ThermAir – Brenner für die Lufterwärmung VALUPAK-II – Einzelbrenner zur direkten Oreizung Vortometicric – Бреннер Фюр ГАЗ Ун и Эл Winnox – Brenner Fürrenner Lufterwärmung 07F TAUCHRORRENNERNERNERMET – TAUCHROHRRENNER TUBE-O-FLAME® – TAUCHROHRBRENNERNNER TUBE-O-THEMP® – TAUCHROHRRENNERNERNNER TUBE-O-THERM® – TAUCHROHRBRENNERNNER XPO® – TAUCHROHRBRENNER 07G Asphaltbrenner Hauck Megastar MS – Mehrstoffbrenner Für Trommeltrocknung Novastar NS – Ultra-Low-Nox-Gasbrenner Für Trommeltrocknung Starjet SJC – Mehrstoffbrenner Für Trommeltrocknung 08 УФ-Сондн und Zündkomponenten C7012 – УФ-Flammenfühler C7027, C7035 – УФ-Flammenfühler C7061 – УФ-Flammenfühler C7076 – UV-Flammenfühler C7915 – IR-Flammenfühler C7961 – УФ-Flammenfühler ET40x – Zündtransformatoren FE, FZE – Zünd- унд Fühlerelektroden Q624 – Zündtransformatoren ТЗИ, TGI – Zündtransformatoren УФ-Flammenwächter УФ-Sonden-Wärmeschutz УФС, UVD – УФ-зонд für Dauerbetrieb УВС – УФ-Sonden Zünd- унд Fühlereinrichtungen Eclipse, Zünd – und Überwachungskomponenten Maxon Zünd Transformatoren Eclipse 09 Zündbrennernnernnner und und luft-muss-musscher atj, lp, tee, vari-set – luft-gas musher ferrofix – brennerdüsen Sticktite und und hg – mischrohre IPG – Gas-Zündbrenner LG – MISCHROHRE MAXON-ZÜNDBRENNER FÜR GAS MG – MISCHROHRE MULTI -RATIO® – Muscher Oxy-Pilot – Zündbrenner Maxon Q179A – Zündbrenner Sticktite ™ / Pilotpak ™ – Brennerdüsen Ventite® – Mischdüsen Zai – Zündbrenner Zio 40 – Zündbrenner ZKIH – Zündbrenner ZMI – Zündbrenner ZT – Schaltventile S11T, Zündbrenner Zündbrenner LVDT / HC 10 Zubehör диск Тип – Gasrücktrittsicherungen DM, DE – Durchflussmengenzähler DMG – Elektronisches Druckmessgerät DPS – Digitales Druckregelsystem DU – Durchflussmengenzähler Ultraschall EKO – Edelstahlkompensatoren ES – Edelstahlschläuche ФПН – Гибкая Rohrnippel ГЭВ, GEH, LEH – Mengeneinstellhähne GRS, GRSF – Gasrücktrittsicherungen ИРК, RFM – Манометр MBO – Messblendensets FLS и Mengeneinste llhähne регулируемый дроссель клапаны OMG – Messblenden PI – Манометр Schaugläser SMARTLINK® Meter – Massenstrommessgeräte Thermoelemente Универсальный цифровой контроллер ETC – Temperaturregler Жива – Absperrklappen 11 Gebläse унд Druckerhöhungseinrichtungen герметической Booster – Gasdruckerhöhungseinrichtungen SMJ – Industriegebläse TBA – Luftgebläse TBA50 – Luftgebläse ВПБ – Фильтр & Schalldämpfer 12 Wärmetauscher Exothermics унд indirekte Lufterhitzer ямочка нержавеющей стали – Wärmetauscher ER – Indirekte Lufterhitzer RHT – Indirekte Lufterhitzer Синусоидальная Тарелка – Wärmetauscher Трубчатые – Wärmetauscher 13 Ventilstrecken, standardisierte Systeme AH – Lufterhitzer BCS – Schalttafel CP – Bedieneinheiten HeatPak – Kompaktes Brennersystem PGM / агр – Gasleitungen PlPm – Vormontierte LP (Flüssigpropan)-Systeme POM/POM-H – Vormontierte Öl/Schweröl-Systeme RGM – Gasregeleinrichtung Schalttafeln Maxon Ventilstrecken C Onfigured Упакованный клапан Trains Ventilsrecken Стандартный клапан Сегменты поезда 14 ÖL-Armaturen und Zubehör FMO – ÖL-Durchflussmesser FOOH – Гибкие Ölschlauche Aus Metall Leichtöl-versorgung ölleitungsheizung lho – ölleitungsheizung mcov – b, f, g & k micro cam Ölventile mov – Micro-Öl-Ventile MRO – ÖL-LUFT-VERHÄLTNISEGLER OF – ÖLFILTER OPRV – ÖL-ÜLSTRÖMVENTIL OS – Abscheider für Öl und Gas Gys, OVC – ÖL-Viskositätsregelung Pro – Öl-Druckregler RP – Ölpumpen- und Motor-sets она – Электрический Ol-Beheizungseinrichtungen им Einlass СП – Ölversorgungs-Pumpen-Einheit ТИ – Temperaturanzeigen 15 Ausgelaufene Produkte 03FA – Люфт-ол-Бреннер ББМ – ПВС-УСС Einstellbare Durchflussventile АИГ – Hochdruck-Vormischbrenner AirJector – Luftzufuhrkomponenten Anov – Abblaseventil APV – ПВС Einstellbares Вентиль, Automaticisch AS – Abblasesichtgerät ASC – Anti-Pulsationsseinheit Autotite – Газ-Absperrventile БКС – Bedienfeld Bereitstellung фон sauerstoffangereicherter Luft Bi-Flame Multi-Flame – Бреннер-Überwachungsdisplay Bi-Flame – Gasfeuerungsautomat БИТ – Trocknungsbrenner BL – Gebläse взрыв задвижки – Mengeneinstellventile взрыв советы – Brennerdüsen BoostPak Испытание на герметичность Комплекты BoostPak – Gasdruckerhöhungseinrichtungen BR – Байонетный рекуператор BrightFire – Люфт-Газ-Бреннер BV / CV – Drosselklappen BVA – Drosselklappen C7927 – УФ-Flammenfühler CBL & SC – Hochdruckgebläse видеонаблюдение – Überwachungssysteme CG 35-45 – Kompakteinheiten Cross Flow – внутриклеточно СТй – Keramische Flachflammenbrenner CYCLOMAX – Gasbrenner ДКП – Datenerfassungssystem Дельта TE III – Flächenbrenner mit stabilem Brennstoff-Luft-Verhältnis DSF – Flachflammenbrenner Deep Spiral Flame Канальные горелки LO-NOX E-Jector – Abgasrezirkulationseinrichtung Eclipse ES Ratio Regulator EJC – Enerjet Hochgeschwindigkeits-Brenner Öl- Esii – Ecostar II EMMINSARMER MEHRSTOFFBRENNER FÜR TROMMELTROCKNUNG Extensojet – Brenner Für Gas Extern-A-Therm – Wärmetauscher FG – Hochdruckgebläse Волоконная лента – Filter FOM – Messblende Gas-Zündbrenner Eclipse GBF – GAS-DRUCKERELER GI – GAS-GLEICHDRUCKERRUCKER GT – Verhältnisdruckrecler GT – Stellantriebe GTCPA – Luft-Öl-Brenner GTNG-DI – Luft-Gas-Brenner GV..Ml – Druckregler мит Magnetventil IFD 450, 454 – Gasfeuerungsautomaten für Dauerbetrieb КСФ 132В, 135B, 137B – Gasfeuerungsautomaten ImmersoPak – Tauchrohrbrenner InciniFume – Kanalbrenner Incinopak – Бреннер für Газ унд Öl Industriebrenner Запечатанный Nozzle Infrawave – Strahlungsbrenner ISER – рекуператор-Brenner für Tauchrohre ОКГ – Luftdüsen-Gasbrenner KINEDIZER® – Lufterhitzer-Brenner L604N – Pressuretrol® Grenzwertregler Лазерный уровнемер – Überwachungssysteme LFC – Linearstellglieder Линейная горелка – Brenner für Gas Locktite – Gas-Absperrventile LP, Teft Sicherheitsventil LVG – Einstellventil Mark IV – Бреннер für Газ унд Ol Max-Saver – Rekuperatoren MODULINE-Anwendungsbeispiele Multi-Flame – Gasfeuerungsautomat MULTIFIRE – Industriebrenner MV500 – Sicherheitsabsperrventile MVB – Magnetventilblöcke НМГ – Mündungsmischende Gasbrenner NMP – Газ-Zündbrenner OPR – ол- DRUCKERELER OVENPAK® II – EINZELBRENNER OXYTHERM® FH – SAUERSTOFFBRENNER OXYTHERM® LEFF – Saustoffbrenner oxytherm® – Saustoffbrenner P7810C – Saustoffbrenner P7810C – твердотельный прессурнет®-регенератор P7911C – твердотельный пресс-пресс-регенератор PBG PBG Europa – Gebläsebrenner PBG – Kompakt-Gasbrenner PCR – ZÜNDFLAMMENRENNER PEEK-A -Flame – Flammenwächter PFD 778 – Gasfeuerungsautomaten für Dauerbetrieb PFS 778, 748 – Gasfeuerungsautomaten PRA6 – Stellantriebe Pre-Mix Gebläsemischer PrimeFire 150 – Sauerstoffbrenner PrimeFire питателя – Sauerstoffbrenner PS Radiant – Strahlungsbrenner РТВ – P-Рор-Бреннер Q652 – Zündtransformatoren RAD – Radimax рекуператор für Strahlroère RAF – РФС-RFE Flammenhaltende Gasdüsen Ramfire – Industriebrenner RFG – Gasbrenner für Strahlroèr rrg – Gas-Luft-verhältniseRegler SBC – Bedieneinheit Einzelbrenner Schürlochbrenner Selbstmischende Gas-Öl-Brenner 780 Simaflame – Flammensimulator SV2-Serie – Газомагнитный SVC – Universal Gas-Öl-Brenner SVG – Универсальный Газбреннер T600 – Brennersteuerung T600 – UV-Sonden TBAB – Luftgebläse Mit Riemenantrieb TBG – Gebläse Für Biogas TJSR – Rekuperatorbrennerrenner Thermjet Tric – Gas-Lanzenbrenner Trilogy T500 – Stellantriebe V-line – Kanalbrenner Valupak – Einzel-, Luftheizungsbrenner VCL, LCU – Labor-Sicherheitssystem Veri-Flame – Gasfeuerungsautomat Veri-Flame – UV-Sonden VG..Z – 2-ступенчатая газовая магнитная вентиляция VIS – Öl-Viskosimeter Set VMS – Vibrations-Überwachungssytem Vortiflare – Flachflammenbrenner VP..ML – 2-ступенчатая Prozessventile VR – Luft-Magnetventile VS..ML – Gas-Magnetventile. – Z 2-ступенчатая газовая магнитная вентиляция WPS – Warmluft-Pilot-System WRASP-DI – Luft-Gas-Brenner WRC – Gas-Öl-Brenner mit großem Regelbereich WRO – Brenner mit großem Regelbereich ZIO 240-320 – Brenner ZU MODhLINE fün enbener ZSI Systeme und Branchen Keramikindustrie Kompetenz in Systemtechnik Metalindustrie Richtlinien und Normen Umwelt Über Thermal Solutions Bildschirmschoner und -hintergründe Logos Zugeordnete Zertifikate Zertifikate
Sprache ВсеDEENFRNLITESDASVNOPTELTRCSPLRUHUSKHRFIROZHSRSLUAETLVLT
Volltextsuche ДжаНейн
Значительное улучшение качества сборок генома за счет курирования | ГигаНаука
Аннотация
Сборки последовательностей генома обеспечивают основу для нашего понимания биологии.Таким образом, создание безошибочных сборок является конечной, но, к сожалению, все еще недостигнутой целью множества исследовательских проектов. Несмотря на постоянно развивающиеся улучшения в области генерации данных, алгоритмов сборки и конвейеров, ни один автоматизированный подход до сих пор не позволяет надежно генерировать почти безошибочные сборки генома для эукариот. Работая над улучшением наборов данных и полностью автоматизированных конвейеров, оценка и курирование сборки активно используются для устранения этого недостатка и значительного сокращения количества ошибок сборки.В дополнение к этому увеличению ценности продукта, информация, полученная в результате курирования сборки, возвращается в стратегию автоматизированной сборки и способствует заметному улучшению качества сборки генома. Мы описываем наш проверенный подход к курированию сборок с помощью gEVAL, браузера для оценки генома. Мы описываем процедуры, применяемые для курирования генома с использованием gEVAL, а также наши рекомендации по курированию сборки в независимом от gEVAL контексте, чтобы облегчить внедрение курирования генома в более широком сообществе.
Курирование сборки добавляет значительную ценность
Несмотря на успехи в технологиях секвенирования и картирования, а также постоянно растущее число доступных сложных алгоритмов и конвейеров, создание безошибочных сборок генома эукариот чисто автоматизированным способом в настоящее время невозможно [1, 2]. Программное обеспечение для сборки, предназначенное для создания непрерывной последовательности из необработанных прочтений, путается из-за гетерозиготных или богатых повторами областей, что приводит к ошибочным дублированиям, коллапсам и несоответствиям.Те же самые проблемы возникают в последующих процессах создания каркасов, которые направлены на превращение первичных контигов в репрезентации хромосомных единиц. Тот факт, что эти инструменты обычно применяются последовательно, а не параллельно, приводит к передаче ошибок, допущенных от одного процесса к другому. В результате даже так называемые высококачественные или «платиновые» сборки могут страдать от сотен и тысяч дублирований, схлопываний, несоответствий и пропусков соединений. Поскольку о собраниях часто судят просто по их непрерывности, а не по их полноте и (структурной) правильности, эти ошибки остаются незамеченными.Это влияет на исследования во многих отношениях, делая невозможным доступ к целым областям генома или вводя в заблуждение исследователей, которые ошибочно интерпретируют артефакты сборки как биологические находки (C. Lee, неопубликованные данные).
Одним из способов устранения этих недостатков является углубленный анализ несоответствий между созданной сборкой и различными типами данных, доступными для секвенированных особей или видов, и последующее устранение этих несоответствий. Это может быть выполнено на уровне последовательности и структурном уровне.Доступно множество автоматизированных инструментов, которые оценивают качество последовательности посредством выравнивания прочтений, подсчета k -меров, поиска генов и других методов [3–6]. Для оценки структурного качества можно использовать несколько отдельных инструментов, но они, как правило, анализируют один тип данных за раз, а не объединяют результаты анализа нескольких параллельно [7, 8].
Мы создали gEVAL, браузер для оценки генома, чтобы пользователь мог одновременно визуализировать и оценивать несоответствия между сборкой и несколькими наборами сопутствующих данных [9].gEVAL позволяет идентифицировать ошибки и одновременно предлагает способы их устранения. В сочетании с ручной оценкой сгенерированных данных опытными кураторами и конвейером, который позволяет кураторам записывать изменения и соответствующим образом воссоздавать улучшенную сборку, gEVAL обеспечивает важное дополнение к стратегиям, направленным на создание сборок максимально возможного качества.
Здесь мы описываем стратегический план, достижения и ограничения подхода gEVAL к курированию сборки.gEVAL привязан к нашей локальной инфраструктуре и поэтому, к сожалению, не переносим, но полностью общедоступен на geval.org.uk. Поэтому мы также предоставляем подробные рекомендации о том, как создавать аналогичные анализы, не использующие gEVAL, для продвижения основных проверенных концепций проектирования в gEVAL. Это особенно своевременно в контексте новых проектов, направленных на сборку геномов очень большого количества видов до максимально возможного качества, включая проект «Геномы позвоночных» (VGP), проект «Древо жизни Дарвина» (DToL, darwintreeoflife.org) и всеобъемлющий проект «Биогеном Земли» [1, 10].
Проверка целостности сборки, покрытия и загрязнения
Мы рекомендуем проверять целостность каждой сборки генома. Это включает в себя обеспечение того, чтобы для сборки в первую очередь использовались только данные, принадлежащие соответствующим видам. Это лучше всего проверить перед началом процесса сборки, выровняв все необработанные наборы данных, например, с mash [11] и проверив, что данные действительно можно комбинировать (т.е., что они, вероятно, происходят из одного и того же базового распределения последовательности). Основным источником остающихся технических ошибок в сборках является сохранение дуплицированных областей, возникающих в результате неспособности распознать, что две последовательности на самом деле являются аллельными. Эти ложные дупликации имеют широкомасштабные негативные последствия для последующих исследований, например, вызывают предсказание ошибочных дупликаций генов [1]. Ложные дупликации вызваны либо неправильным разрешением графов сборки, либо ошибками в обнаружении гаплотипической изменчивости.Они могут быть обнаружены с помощью простых графиков покрытия чтения или более сложных анализов k- мер (например, с использованием набора инструментов для анализа K-меров [KAT] [4], счетчика K-меров [KMC] [12] или Merqury [ 6]). Подходы K -mer также поддерживают оценку полноты сборки (т. е. содержит ли сборка все релевантные k--меры, присутствующие в ридах) и плоидности генома [13]. Ложные дупликации могут быть удалены, в идеале, после создания контигов, с помощью инструментов, которые распознают частичное и полное перекрывание аллелей, таких как purge_dups [14].Помимо дублирования, на качество сборки также негативно влияют ошибочные схлопывания последовательностей, в основном расположенные в повторяющихся областях. Коллапсы относительно легко обнаружить на основе увеличенного охвата прочтений, но их сложнее устранить, поскольку они требуют создания новой последовательности. Это может быть выполнено путем извлечения сопоставленных прочтений и локальной повторной сборки в более строгих условиях или с помощью более сложных методов, таких как Segmental Duplication Assembler (SDA) [15].
Сборки часто полируются после генерации контигов с использованием большого количества данных или конкретных данных с высокой базовой точностью, таких как короткие чтения Illumina, для исправления оставшихся ошибок в полученной консенсусной последовательности.Однако возможна чрезмерная полировка, например, когда редкие повторяющиеся варианты заменяются наиболее распространенной версией, или когда ядерные вставки фрагментов генома органелл (ядерные митохондриальные переносы [NUMTs] и ядерные пластидные переносы [NUPTs]) полируются, чтобы соответствовать последовательность органелл. Следовательно, для полировки сборка целевого генома должна включать геномы органелл. Органеллярные геномы часто отсутствуют в сборках, потому что инструменты сборки распознают и исключают их как повторяющиеся последовательности или потому что они дают сложные графы, которые конфликтуют с ядерными вставками.Их можно собирать независимо от необработанных ридов, например, с помощью конвейера mitoVGP [16]. Контиги/каркасы, представляющие геномы органелл, должны быть идентифицированы и представлены как таковые в архивы Международного сотрудничества базы данных нуклеотидных последовательностей (INSDC).
Предварительный сбор данных по целевому виду может непреднамеренно включать синтетическую последовательность из систем клонирования или секвенирования, контаминацию видами, обработанными в той же лаборатории или центре секвенирования, или контаминацию естественными кобионтами мишени (например,г., микробиомы кишечника и кожи, неожиданные паразиты). Деконтаминация служит для обнаружения и маскировки или удаления последовательности, не происходящей от целевого вида, а также для отделения геномов органелл от первичной сборки, если она не проводилась ранее. Это включает в себя идентификацию оставшегося загрязнения вектором и адаптером на основе известной последовательности. Загрязняющая последовательность может быть обнаружена с помощью специальных наборов инструментов, таких как BlobToolKit [17] или Anvi’o [18], или путем поиска сходства отдельных последовательностей с использованием BLAST или Diamond в подходящих базах данных (таблица 1).Наши внутренние конвейеры используют автоматическое обнаружение синтетических, лабораторных и естественных загрязнителей, но включают ручной контроль для сохранения последовательностей, которые могут быть продуктом горизонтального переноса генов (описано ниже).
Таблица 1:Обнаружение загрязнения в сборках, вдохновленное процессами, выполненными архивом генома GenBank [19]
Загрязнитель . | Программные средства . | Требования к обнаружению . | База данных . | ||
---|---|---|---|---|---|
Вектор / Adapter Sequence | Vecscreen [20] | Univec [21] | |||
Общие загрязнения | |||||
Megablast [22] | E-значение ≤1e-4, Сообщения совпадения ≥98 % идентичности последовательности при длине совпадения 50–99 п.н., ≥94% при длине совпадения 100–199 п.н. или ≥90% при длине совпадения >200 п.н. | Значение e ≤1e−4, идентичность последовательности ≥90%, длина совпадения ≥500 , показатель совпадения ≥100, идентичность последовательности ≥98%; игнорировать области, также совпадающие с высококонсервативными рДНК . | Программные средства . | Требования к обнаружению . | База данных . |
Вектор / Adapter Sequence | Vecscreen [20] | Univec [21] | |||
Общие загрязнения | |||||
Megablast [22] | E-значение ≤1e-4, Сообщения совпадения ≥98 % идентичности последовательности при длине совпадения 50–99 п.н., ≥94% при длине совпадения 100–199 п.н. или ≥90% при длине совпадения >200 п.н. | Значение e ≤1e−4, идентичность последовательности ≥90%, длина совпадения ≥500 , показатель совпадения ≥100, идентичность последовательности ≥98%; игнорировать регионы, также совпадающие с высококонсервативными рДНК . | Программные средства . | Требования к обнаружению . | База данных . |
Вектор / Adapter Sequence | Vecscreen [20] | Univec [21] | |||
Общие загрязнения | |||||
Megablast [22] | E-значение ≤1e-4, Сообщения совпадения ≥98 % идентичности последовательности при длине совпадения 50–99 п.н., ≥94% при длине совпадения 100–199 п.н. или ≥90% при длине совпадения >200 п.н. | Значение e ≤1e−4, идентичность последовательности ≥90%, длина совпадения ≥500 , показатель совпадения ≥100, идентичность последовательности ≥98%; игнорировать области, также совпадающие с высококонсервативными рДНК . | Программные средства . | Требования к обнаружению . | База данных . |
Вектор / Adapter Sequence | Vecscreen [20] | Univec [21] | |||
Общие загрязнения | |||||
Megablast [22] | E-значение ≤1e-4, Сообщения совпадения ≥98 % идентичности последовательности при длине совпадения 50–99 п.н., ≥94% при длине совпадения 100–199 п.н. или ≥90% при длине совпадения >200 п.н. | Значение e ≤1e−4, идентичность последовательности ≥90%, длина совпадения ≥500 , показатель совпадения ≥100, идентичность последовательности ≥98%; игнорировать регионы, также соответствующие высококонсервативным рДНК | Windowmasked [26] Геномы RefSeq [27] |
Наконец, концевые N должны быть удалены из всех контигов и каркасов.
Повышение структурной целостности
Поскольку в настоящее время в большинстве конвейеров сборки последовательно применяются различные этапы создания каркаса, ошибки на ранних этапах могут распространяться по всему процессу. Чтобы избежать усугубления этих ошибок, можно было бы проводить тщательный процесс курирования после каждого шага построения лесов, но если задействовано много шагов построения лесов, это потребует очень много времени и ресурсов. Наш опыт показал, что структурная целостность может быть успешно улучшена после завершения полного автоматизированного процесса сборки [1, 9].
Принцип выявления ошибок сборки прост: сопоставьте все имеющиеся (исходные и другие) данные с полученной сборкой, проверьте на несоответствия, а затем исправьте. Доступно несколько инструментов, которые обнаруживают проблемы со скаффолдингом с отдельными типами данных, в том числе scaff10x для 10-кратного чтения, связанного с Chromium [28], Access для карт Bionano [7] и HiGlass [29], pretext [30] и Juicebox [8] для Hi. -C данные. ASSET оценивает несколько типов данных параллельно и поэтому является отличным инструментом для оценки и визуализации потенциальных ошибок сборки [31].Диаграммы покрытия считывания идентифицируют ошибки или проблемные области посредством отклонения от ожидаемых средних значений (указывая на возможно проблемные области с низким покрытием, гаплоидные области или области свернутого повтора) и участки, где все выровненные считывания вырезаны в одном и том же месте (предполагая, что сборка содержит ошибочное соединение). Выравнивание сборки относительно самой себя можно использовать для обнаружения дубликатов.
Дополнительные данные, не используемые при создании сборки, также содержат важную информацию. Сравнение собрания с предыдущими собраниями того же вида или с собраниями близкородственных видов может выявить области разногласий и, таким образом, области, которые заслуживают более пристального внимания во время курирования.Доказательства транскрипта в виде собранных кДНК или длинных прочтений одной молекулы могут быть выровнены для подтверждения соединений через пробелы в последовательностях, выявления локальных неправильных сборок и обнаружения ложных дупликаций. Белковые последовательности одного и того же или родственных видов могут служить той же цели. Центромеры и теломеры могут быть идентифицированы в сборке по признакам последовательности [32, 33]. Структурные данные дальнего действия (такие как кариотипы и картирование флуоресценции in situ гибридизации) и данные генетического картирования (такие как генетическая карта или данные радиационного гибридного картирования) могут предоставить подтверждение крупномасштабной правильности сборки и, в частности, направлять правильную ассоциацию и ориентацию хромосомных плеч по отношению к теломерам и центромерам.Полнохромосомные паттерны пропорций повторов и содержания GC также можно использовать для подтверждения полноты хромосомных единиц.
После обнаружения ошибки должны быть исправлены. Мы обнаружили, что инструменты редактирования последовательности всего генома, такие как gap5 [34], полезны для этого процесса. Крайне важно записывать сделанные исправления, чтобы путь от первичной сборки до окончательной сборки генома был ясным и оправданным.
Идентификация и наименование хромосомных каркасов
Конечной целью сборки генома является создание полностью непрерывных нуклеотидных последовательностей, представляющих каждую хромосомную единицу вида, с оценкой как общего, так и локального качества, а также с известными участками, которые могут быть отмечены как проблемы.Данные дальнего действия, такие как карты контактов Hi-C, могут надежно указать, какие каркасы соответствуют хромосомным единицам, и эти предполагаемые хромосомные сборки могут быть согласованы с кариотипической информацией, где она доступна. Полностью разрешенные хромосомные единицы (где все контиги и каркасы упорядочены и ориентированы) могут быть отправлены в архивы последовательностей INSDC (партнеры INSDC: GenBank, Европейский нуклеотидный архив [ENA] и банк данных ДНК Японии [DDBJ]) в качестве «хромосома». Каркасы и контиги, которые очевидно связаны с хромосомной единицей, но которые не могут быть соединены из-за неоднозначного порядка или ориентации, должны быть представлены как «нелокализованные» для этой хромосомы.Каркасы и контиги, которые не могут быть связаны с хромосомой, а также не могут быть установлены как отдельные хромосомы, считаются «неразмещенными».
Если доступна эталонная сборка для того же вида или кариотип с якорями на основе последовательности, именование хромосом должно следовать прецеденту, чтобы обеспечить совместимость с ранее опубликованными результатами. Идентификация половых хромосом может быть основана на сравнении с родственными видами или на расположении маркерных генов. У гетерогаметных индивидуумов половые хромосомы также будут легко узнаваемы по уменьшенному вдвое охвату их последовательностей по сравнению с аутосомами.Если ссылка для именования хромосом не установлена, они должны быть названы по размеру.
И последнее, но не менее важное: каждая сборка вместе со всеми соответствующими необработанными данными и метаданными должна быть отправлена в один из архивов INSDC (Genbank, ENA или DDBJ [35]), чтобы обеспечить возможность обнаружения, обеспечить доступ сообщества и обеспечить стабильность для будущие анализы.
На рис. 1 приведены приведенные выше рекомендации в виде предлагаемого рабочего процесса для действий по курированию сборки.
Рисунок 1:
Рекомендуемый рабочий процесс для действий по курированию во время создания сборки.
Рис. 1:
Рекомендуемый рабочий процесс для курирования во время создания сборки.
Курирование сборки для высокопроизводительных проектов
Вышеупомянутые процессы курирования страдают тем же недостатком, что и сам процесс сборки: они обычно применяются последовательно, а не параллельно. Преимущества множества типов данных и подходов также трудно реализовать. Хотя идентификацию многих проблем сборки можно автоматизировать, фактическое решение о применении изменения по-прежнему лучше всего принимать опытным куратором, что, по-видимому, замедляет процесс до такой степени, что исключает его из любого высокопроизводительного проекта.
Конвейер курирования сборки справочной группы по информатике генома (GRIT) был создан для обеспечения высококачественной курации сборки для Консорциума справочной информации по геному (GRC [36]), VGP и DToL. Конвейер автоматизирует процессы сбора данных и вычислительного анализа для дезактивации, проверки и исправления сборок, получая все доступные данные из внутренних и общедоступных ресурсов. Затем анализы представляются для ручной оценки опытными кураторами генома, которые проводят оценку и регистрируют необходимые изменения.Исправленная сборка, готовая к отправке, генерируется автоматически. Центральное место в этом пайплайне занимает gEVAL, браузер для оценки генома [9]. gEVAL позволяет визуализировать и оценивать несоответствия между сборкой и несколькими наборами сопутствующих данных параллельно, обеспечивая одновременную идентификацию ошибок и способов их устранения [37]. Конвейер, который развертывает GRIT, претерпел значительные изменения с момента его первой реализации [9] и теперь настолько тесно связан с внутренней структурой данных Wellcome Sanger Institute, что его нельзя перенести, но он описан здесь как пример успешной реализации, сочетающей в себе автоматизацию и вручную обрабатывает и значительно улучшает сборки генома с учетом времени и ресурсов, что позволяет использовать его в высокопроизводительных проектах.Все проекты сборки, загруженные в gEVAL, общедоступны на geval.org.uk.
Процесс курирования GRIT обычно начинается со сборок, очищенных от дубликатов и большинства гаплотипических сегментов, заполненных данными дальнего действия и отполированных. Перед загрузкой в gEVAL все сборки проходят через конвейер nextflow [38], который выполняет обнаружение и разделение или удаление загрязнений, как описано в таблице 1, в сочетании с удалением конечных N [38]. Краткая ручная проверка результатов предотвращает ошибочное удаление областей, вероятно, полученных в результате горизонтального переноса генов.Этот конвейер был вдохновлен процессом проверки загрязнения, проведенным Genbank [39].
Анализы gEVAL сопоставляются в базе данных, построенной на платформе Ensembl [40], которая была модифицирована для визуализации качества сборки, а не аннотаций генов и признаков. Загрузка анализов в gEVAL и последующий анализ сборки конвейеризированы с использованием змейки и vr-runner [41, 42]. Какие анализы выполняются и визуализируются, зависит от наличия данных, но обычно включает типы, перечисленные в таблице 2.Выравнивания и размещения визуализируются в браузере генома в виде дорожек функций и кодируются цветом, чтобы указать согласие или несогласие со сборкой (рис. 2). Процесс gEVAL также генерирует списки, в которых подробно описываются несоответствия между сборкой и различными типами данных. Процесс анализа и загрузки в gEVAL занимает до 3-х дней для 1-гигабитной сборки.
Рисунок 2:
Примеры сигнатур ошибок сборки в различных типах данных. (A) Проблема сборки, выявленная в gEVAL в геноме птицы ( Taeniopygia guttata , VGP).Треки элементов (названные справа) показаны в контексте сборки. Несоответствие видно в середине примера, на что указывает падение охвата прочитанного Pacific Biosciences (PacBio), несоответствие с выровненными (желтый цвет указывает на выровненные, а бежевый – не выровненные) карты Bionano и разрыв в синтении. Сопоставление с промежуточными этапами сборки показывает, что эта ошибка была вызвана этапом формирования каркаса с участием scaff10x. (B–E) Проблемы сборки, выявленные в HiGlass Hi-C 2D-картах человеческой сборки (HG002, различные подходы к сборке).Границы скаффолда обозначены серым цветом. (B) Первый из двух каркасов, изображенных здесь, показывает неправильное соединение (черная стрелка), которое необходимо сломать. Второй каркас не имеет структурных проблем. (C) Первую и третью из трех лесов, показанных здесь, необходимо соединить, как показано зелеными стрелками. (D) Одиночные леса, изображенные здесь, имеют неправильное соединение (черная стрелка), которое необходимо разорвать и снова соединить, как показано зелеными стрелками. (E) Этот единственный каркас содержит дупликацию, половину которой необходимо удалить (например,г., черные стрелки) и эшафот соединился (зеленые стрелки). Выбор иссеченной половины может основываться на поэтапности.
Рисунок 2:
Примеры сигнатур ошибок сборки в различных типах данных. (A) Проблема сборки, выявленная в gEVAL в геноме птицы ( Taeniopygia guttata , VGP). Треки элементов (названные справа) показаны в контексте сборки. Несоответствие видно в середине примера, на что указывает падение охвата прочитанного Pacific Biosciences (PacBio), несоответствие с выровненными (желтый цвет указывает на выровненные, а бежевый – не выровненные) карты Bionano и разрыв в синтении.Сопоставление с промежуточными этапами сборки показывает, что эта ошибка была вызвана этапом формирования каркаса с участием scaff10x. (B–E) Проблемы сборки, выявленные в HiGlass Hi-C 2D-картах человеческой сборки (HG002, различные подходы к сборке). Границы скаффолда обозначены серым цветом. (B) Первый из двух каркасов, изображенных здесь, показывает неправильное соединение (черная стрелка), которое необходимо сломать. Второй каркас не имеет структурных проблем. (C) Первую и третью из трех лесов, показанных здесь, необходимо соединить, как показано зелеными стрелками. (D) Одиночные леса, изображенные здесь, имеют неправильное соединение (черная стрелка), которое необходимо разорвать и снова соединить, как показано зелеными стрелками. (E) Этот единственный каркас содержит дупликацию, половину которой необходимо удалить (например, черные стрелки) и воссоединить каркас (зеленые стрелки). Выбор иссеченной половины может основываться на поэтапности.
Таблица 2:Примеры типов данных и анализов, включенных в gEVAL, и их способность обнаруживать проблемы и ошибки
Тип данных . | Программное обеспечение . | Поддерживаемый тип анализа . | |||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Несоответствия . | Пропущенные соединения . | Дублирование . | Обрушение . | ||||||||||||||||||||||||||||||||||||||||||
Minimap2 [43], Winnowmap [44] | 59 Bionanox | x | x | x | x | x | x | x | x | x | x | 999x | 9 | 9406 | 9406 | 9406 | 9406 | ||||||||||||||||||||||||||||
BLAT [45], PBLAT [46] | x | x | 99 | 9 | |||||||||||||||||||||||||||||||||||||||||
Другие сборки | 699999 x60 | ||||||||||||||||||||||||||||||||||||||||||||
Центромеры | Repeatmasker [40, 48], центромера db [32] | x | x | 9405 5 | |||||||||||||||||||||||||||||||||||||||||
Telomeres | Telomeres | Find_telomere [33] адаптировано для работы с любой последовательностью | 990 | ||||||||||||||||||||||||||||||||||||||||||
Genetic и другие карты | EPCR [49], Blast [50] | x | x | x |
Тип данных . | Программное обеспечение . | Поддерживаемый тип анализа . | |||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Несоответствия . | Пропущенные соединения . | Дублирование . | Обрушение . | ||||||||||||||||||||||||||||||||||||||||||
Minimap2 [43], Winnowmap [44] | 59 Bionanox | x | x | x | x | x | x | x | x | x | x | 999x | 9 | 9406 | 9406 | 9406 | 9406 | ||||||||||||||||||||||||||||
BLAT [45], PBLAT [46] | x | x | 99 | 9 | |||||||||||||||||||||||||||||||||||||||||
Другие сборки | 699999 x60 | ||||||||||||||||||||||||||||||||||||||||||||
Центромеры | Repeatmasker [40, 48], центромера db [32] | x | x | 9405 5 | |||||||||||||||||||||||||||||||||||||||||
Telomeres | Telomeres | Find_telomere [33] адаптировано для работы с любой последовательностью | 990 | ||||||||||||||||||||||||||||||||||||||||||
Genetic и другие карты | EPCR [49], Blast [50] | x | x | x |
Тип данных . | Программное обеспечение . | Поддерживаемый тип анализа . | |||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Несоответствия . | Пропущенные соединения . | Дублирование . | Обрушение . | ||||||||||||||||||||||||||||||||||||||||||
Minimap2 [43], Winnowmap [44] | 59 Bionanox | x | x | x | x | x | x | x | x | x | x | 999x | 9 | 9406 | 9406 | 9406 | 9406 | ||||||||||||||||||||||||||||
BLAT [45], PBLAT [46] | x | x | 99 | 9 | |||||||||||||||||||||||||||||||||||||||||
Другие сборки | 699999 x60 | ||||||||||||||||||||||||||||||||||||||||||||
Центромеры | Repeatmasker [40, 48], центромера db [32] | x | x | 9405 5 | |||||||||||||||||||||||||||||||||||||||||
Telomeres | Telomeres | Find_telomere [33] адаптировано для работы с любой последовательностью | 990 | ||||||||||||||||||||||||||||||||||||||||||
Genetic и другие карты | EPCR [49], Blast [50] | x | x | x |
gEVAL автоматически помечает области, в которых необработанные и другие доступные сравнительные данные не соответствуют представленной сборке.Опытные кураторы используют базу данных и визуализацию gEVAL, а также (где они доступны) карты Hi-C (созданные вне конвейера gEVAL и просматриваемые в HiGlass [29] или в претексте [30]), чтобы проверить каждое перечисленное несоответствие и решить, следует ли и как его скорректировать. последовательность на основе имеющихся данных (рис. 2). В редких случаях информации, содержащейся в gEVAL и картах Hi-C, недостаточно, чтобы решить, оправдано ли изменение. Затем кураторы используют дополнительные инструменты, такие как gap5 [34] для углубленного анализа выровненных прочтений или Genomicus для получения информации о синтении с другими видами [51].Кураторы предлагают различные вмешательства, такие как разрыв или соединение областей последовательности, изменение порядка и ориентации каркасов и контигов, а также удаление ложных дубликатов. Распутывание коллапсов последовательности в настоящее время возможно только в том случае, если для локальной повторной сборки можно использовать дополнительные данные. В проектах с высокой пропускной способностью, таких как DToL или VGP, курирование обычно ограничивается разрешением ~100 КБ. Это позволяет опытному куратору завершить курирование 1 Гб последовательности примерно за 3 дня. Для проектов без немедленных временных ограничений и нацеленных на единичные ссылки, таких как геномы, курируемые в рамках GRC, ограничений по разрешению нет.
Во время сборки gEVAL каркасы сборки разбиваются на компоненты одинакового размера, а их порядок и ориентация записываются в файл пути под контролем версий, в котором указывается имя компонента, имя каркаса и ориентация. Если потребуется какая-либо перестановка, кураторы просто переупорядочивают/переориентируют компоненты в файле пути. При необходимости компоненты можно разделить с помощью специальных сценариев, которые создают новые компоненты и сохраняют их в базе данных gEVAL. После ручного курирования скорректированный порядок и ориентация компонентов, а также список ассоциаций каркаса и хромосомы обрабатываются автоматически для создания окончательной сборки для отправки.Все этапы и показатели всего процесса курирования записываются в базу данных отслеживания.
Использование gEVAL для оценки опубликованных сборок
Выше мы описали использование gEVAL для создания качественных сборок. gEVAL также можно использовать для поддержки исследовательских сообществ в проверке результатов исследований, гарантируя, что они не основаны на артефактах сборки. Для этого создается база данных gEVAL для общедоступных сборок, как, например, для всех сборок GRC [37].Здесь gEVAL предлагает те же анализы, что подробно описаны выше, а также дополнительные базы данных с другими сборками того же вида, например, с предыдущими версиями текущего справочника, включая выравнивание всего генома между ними (рис. 3). В сочетании с учебными пособиями и документацией это предоставляет ценный ресурс для пользователей рекомендуемых эталонных сборок.
Рисунок 3:
Сравнение области fbn2b в эталонных сборках Danio rerio (зебрафиш) Zv9 (вверху), GRCz10 (в центре) и GRCz11 (внизу) в gEVAL.Фрагментированный локус fbn2b (цвет, кодированный оранжевым и красным) был скорректирован для GRCz10 (цвет, кодирован оранжевым) и дополнительно улучшен путем удаления контигов дробовика всего генома в пользу готовой последовательности клона для GRCz11. Окончательный правильный локус гена показан зеленым цветом.
Рисунок 3:
Сравнение области fbn2b в эталонных сборках Danio rerio (зебрафиш) Zv9 (вверху), GRCz10 (в центре) и GRCz11 (внизу) в gEVAL. Фрагментированный локус fbn2b (цвет, кодированный оранжевым и красным) был скорректирован для GRCz10 (цвет, кодирован оранжевым) и дополнительно улучшен путем удаления контигов дробовика всего генома в пользу готовой последовательности клона для GRCz11.Окончательный правильный локус гена показан зеленым цветом.
Влияние курирования сборки на проекты с высокой производительностью
Во время курирования 111 сборок (последовательность 174 Гб) для VGP и DToL в среднем применялось 221 вмешательство на Гб последовательности (67 разрывов, 105 соединений и 49 удалений ложных дубликатов, рис. 4). Эти изменения привели к среднему сокращению длины сборки на 2%, потому что усилия по курированию не привели к созданию новой последовательности. Однако средний каркас N50 увеличился на 40%, а количество каркасов уменьшилось на 29%.Важно отметить, что изменения каркаса N50 различались для каждой сборки, и хотя процесс улучшил N50 в несколько сотен раз в исходно фрагментированных сборках, он вдвое уменьшил N50 в сборках с перенастилом. В среднем 96 % последовательности сборки были закреплены на уровне хромосом (рис. 5). Количество и масштаб изменений в сборках, необходимых для разнообразия проанализированных видов, показывают постоянную потребность в ручном вмешательстве на пути к высококачественным сборкам генома.Наш опыт курирования сборок генома с частичным и полным разрешением гаплотипов для GRC, VGP и DToL привел к усовершенствованию программного обеспечения для сборки (например, purge_dups [14], salsa2 [52]), конвейеров сборки (VGP, DToL) и оценки сборки. инструменты (например, Asset [31, 37]). Генерация сборок генома — это быстро развивающаяся область, и мы постоянно адаптируем программное обеспечение и процессы курирования, чтобы включать новые типы данных и новые способы создания сборок, осознавая при этом необходимость максимизировать пропускную способность.Это обеспечивает постоянное участие кураторов сборок в проектах с высокой пропускной способностью для получения наилучших возможных данных для сообщества, на которых они могут основывать свои исследования.
Рисунок 4:
Изменения в 111 сборках из разных кладов посредством ручного курирования сборок группой справочной информатики генома в Wellcome Sanger Institute. ( A ) Ручные вмешательства (разрывы, соединения, удаление ложных дубликатов) как события на гигабазу последовательности сборки.( B ) Изменения в каркасе N50 после курирования. ( C ) Изменения в количестве строительных лесов после курирования. Изображенные сборки были созданы с использованием данных PacBio CLR, Chromium 10X, Bionano и Hi-C.
Рисунок 4:
Изменения в 111 сборках из разных кладов посредством ручного курирования сборок группой справочной информатики генома в Институте Велкома Сэнгера. ( A ) Ручные вмешательства (разрывы, соединения, удаление ложных дубликатов) как события на гигабазу последовательности сборки.( B ) Изменения в каркасе N50 после курирования. ( C ) Изменения в количестве строительных лесов после курирования. Изображенные сборки были созданы с использованием данных PacBio CLR, Chromium 10X, Bionano и Hi-C.
Рисунок 5:
Hi-C карты (предлог), показывающие сборку генома Asterias rubens (морской звезды) (секвенированную в рамках проекта Института Сэнгера «25 геномов за 25 лет») до ( A ) и после ( B ) кураторство. Куратор исправил первоначальную сборку, сделав 75 разрывов и 216 соединений, а также удалил 1 участок ошибочно продублированной последовательности.В общей сложности 97% последовательности сборки может быть отнесено к 22 хромосомам. Кураторская сборка ( B ) содержит 1 каркас, который, как известно, связан со вторым (недиагональный сигнал внизу справа), но его порядок и ориентация неоднозначны. Этот каркас был представлен как «нелокализованный» для соответствующей хромосомы.
Рисунок 5:
Карты Hi-C (предлог), показывающие сборку генома Asterias rubens (морской звезды) (секвенированную в рамках проекта Института Сэнгера «25 геномов за 25 лет») до ( A ) и после ( B ) кураторство.Куратор исправил первоначальную сборку, сделав 75 разрывов и 216 соединений, а также удалил 1 участок ошибочно продублированной последовательности. В общей сложности 97% последовательности сборки может быть отнесено к 22 хромосомам. Кураторская сборка ( B ) содержит 1 каркас, который, как известно, связан со вторым (недиагональный сигнал внизу справа), но его порядок и ориентация неоднозначны. Этот каркас был представлен как «нелокализованный» для соответствующей хромосомы.
Сокращения
BLAST: базовый инструмент локального поиска выравнивания; п.н.: пары оснований; DDBJ: Банк данных ДНК Японии; DToL: проект «Древо жизни Дарвина»; ENA: Европейский архив нуклеотидов; Gb: пары гига оснований; GC: гуанин-цитозин; GRC: Консорциум справочников по геномам; GRIT: Группа справочной информатики генома; Hi-C: высокопроизводительный захват конформации хромосом; INSDC: сотрудничество с Международной базой данных нуклеотидных последовательностей; NUMT: ядерно-митохондриальный перенос; NUPT: перенос ядерных пластид; VGP: Проект геномов позвоночных.
Конкурирующие интересы
Авторы заявляют, что у них нет конкурирующих интересов.
Финансирование
Этот проект поддерживается Wellcome Trust, WT206194.
Вклады авторов
KH инициировал и написал рукопись, а также провел краткий анализ усилий по курированию. Компания JT внедрила конвейеры дезактивации и постобработки и выполняет постобработку дезактивации и курирования.WC и YS внедрили gEVAL и его конвейер анализа, а также создали базы данных gEVAL вместе с JW и DLP. Сборки курируют JC, SP, AT и JW.
БЛАГОДАРНОСТИ
Мы благодарим Марка Блакстера, Ричарда Дурбина и Шейна Маккарти за их вклад в этот проект и многочисленные полезные обсуждения. Дополнительная благодарность Марку Блакстеру за многочисленные конструктивные обсуждения этой рукописи. Проект курирования генома находится под сильным влиянием Консорциума справочных материалов по геномам, Проекта геномов позвоночных и Проекта Дарвиновского дерева жизни, и мы в долгу перед всеми участниками за их участие в процессе курирования.
Каталожные номера
1.Rhie
A
,McCarthy
SA
,Fedrigo
O
и др.На пути к полной и безошибочной сборке генома всех видов позвоночных
.2020
, doi:.2.Miga
KH
,Koren
S
,Rhie
A
, и др.Сборка теломер-теломер полной Х-хромосомы человека
.Природа
.2020
;585
:79
–84
.3.Ян
L-A
,Чанг
Y-J
,Чен
S-H
, и др.SQUAT: инструмент оценки качества секвенирования для оценки качества данных сборок генома
.BMC Genomics
.2019
;19
:238
.4.Mapleson
D
,Garcia Accinelli
G
,Kettleborough
G
, и др.KAT: набор инструментов для анализа K-mer для контроля качества наборов данных NGS и сборок генома
.Биоинформатика
.2017
;33
:574
–6
.5.Сеппи
М
,Манни
М
,Здобнов
ЭМ
.BUSCO: Оценка сборки генома и полноты аннотации
.Методы Мол Биол
.2019
;1962
:227
–45
.6.Rhie
A
,Walenz
BP
,Koren
S
и др.Merqury: безреференсная оценка качества, полноты и поэтапной оценки сборок генома
.Геном Биол
.2020
;21
:245
.7.Чан
S
,Лам
E
,Сагбини
M
, и др.Обнаружение и анализ структурных вариаций с использованием оптического картирования Bionano
.Методы Мол Биол
.2018
;1833
:193
–203
.8.Дюран
NC
,Робинсон
JT
,Шамим
MS
и др.Juicebox предоставляет систему визуализации для карт контактов Hi-C с неограниченным увеличением
.Сотовая система
.2016
;3
:99
–101
.9.Чоу
W
,Brugger
K
,Каккамо
M
, и др.gEVAL — веб-браузер для оценки сборок генома
.Биоинформатика
.2016
;32
:2508
–10
.10.Lewin
HA
,Robinson
GE
,Kress
WJ
, и др.Проект Earth BioGenome: секвенирование жизни для будущего жизни
.Proc Natl Acad Sci U S A
.2018
;115
:4325
–33
.13.Райкер Раналло-Бенавидес
T
,Джарон
KS
,Шац
MC
.GenomeScope 2.0 и Smudgeplot для безреференсного профилирования полиплоидных геномов
.Нац Коммуна
.2020
;11
(1
):1432
.14.Гуань
D
,McCarthy
SA
,Вуд
J
, и др.Выявление и устранение гаплотипической дупликации в первичных сборках генома
.Биоинформатика
.2020
;36
:2896
–8
.15.Vollger
MR
,Dishuck
PC
,Sorensen
M
и др.Длинная последовательность и сборка сегментных дубликатов
.Естественные методы
.2019
;16
:88
–94
.16.Formenti
G
,Rhie
A
,Balacco
J
, и др.Полные митогеномы позвоночных обнаруживают широко распространенные дупликации генов и повторы
.2020
, дои:.17.Чаллис
R
,Ричардс
E
,Раджан
J
, и др.BlobToolKit — интерактивная оценка качества сборки генома
.G3 (Бетесда)
.2020
;10
:1361
–74
.18.Эрен
AM
,Мурат Эрен
А
,Эсен
ÖC
, и др.Anvi’o: передовая платформа для анализа и визуализации данных omics
.PeerJ
.2015
;3
:e1319
.20.Хэнкок
JM
,Бишоп
MJ
.ВекСкрин
. В:Словарь по биоинформатике и вычислительной биологии
.2004
, doi:.22.Моргулис
А
,Кулурис
Г
,Райцелис
Y
и др.Индексация базы данных для производственных поисков MegaBLAST
.Биоинформатика
.2008
;24
:1757
–64
.26.Моргулис
A
,Герц
EM
,Schäffer
AA
и др.WindowMasker: оконный маскировщик для секвенированных геномов
.Биоинформатика
.2006
;22
:134
–41
.27.O’Leary
NA
,Wright
MW
,Brister
JR
, et al.База данных эталонных последовательностей (RefSeq) в NCBI: текущий статус, таксономическое расширение и функциональная аннотация
.Рез. нуклеиновых кислот
.2016
;44
:D733
–45
.29.Керпеджиев
P
,Абденнур
N
,Лекщас
F
и др.HiGlass: веб-визуальное исследование и анализ карт взаимодействия генома
.Геном Биол
.2018
;19
:125
.32.Плавильщики
DP
,Bradnam
KR
,Young
HA
и др.Сравнительный анализ тандемных повторов у сотен видов раскрывает уникальную информацию об эволюции центромер
.Геном Биол
.2013
;14
:R10
.34.Бонфилд
JK
,Уитвэм
А
.Gap5 – редактирование сборки последовательности миллиардов фрагментов
.Биоинформатика
.2010
;26
:1699
–703
.35.Karsch-Mizrachi
I
,Takagi
T
,Cochrane
G
,Международная база данных нуклеотидных последовательностей 90 Сотрудничество 011 .
Сотрудничество с Международной базой данных нуклеотидных последовательностей
.Рез. нуклеиновых кислот
.2018
;46
:D48
–51
.36.Церковь
DM
,Schneider
VA
,Могилы
T
, и др.Модернизация эталонных геномных сборок
.ПЛОС Биол
.2011
;9
:e1001091
.38.Ди Томмазо
P
,Чатцу
M
,Флоден
EW
и др.Nextflow обеспечивает воспроизводимые вычислительные рабочие процессы
.Нат Биотехнолог
.2017
;35
:316
–9
.40.Aken
BL
,Achuthan
P
,Akanni
W
и др.Ансамбль 2017
.Рез. нуклеиновых кислот
.2017
;45
:D635
–42
.41.Кёстер
J
,Рахманн
S
.Snakemake — масштабируемая система биоинформатики
.Биоинформатика
.2018
;34
:3600
.43.Ли
Н
.Миникарта и миниазм: быстрое отображение и сборка de novo для зашумленных длинных последовательностей
.Биоинформатика
.2016
;32
:2103
–10
.44.Джайн
C
,Ри
A
,Чжан
H
, и др.Взвешенная выборка минимизатора улучшает отображение длинного чтения
.Биоинформатика
.2020
;36
(Supplement_1
), doi:.45.Кент
WJ
.BLAT — инструмент для выравнивания, аналогичный BLAST
.Геном Res
.2002
;12
:656
–64
.46.Ван
М
,Конг
Л
.Pblat: многопоточный алгоритм Блата, ускоряющий выравнивание последовательностей с геномами
.BMC Биоинформатика
.2019
;20
(1
):28
.47.Kurtz
S
,Phillippy
A
,Delcher
AL
, и др.Универсальное и открытое программное обеспечение для сравнения больших геномов
.Геном Биол
.2004
;5
:R12
.48.Бао
W
,Кодзима
KK
,Кохани
O
.Repbase Update, база данных повторяющихся элементов в геномах эукариот
.Моб ДНК
.2015
;6
:11
.49.Shyu
C
,Foster
JA
,Forney
LJ
.Алгоритм поиска электронной полимеразной цепной реакции (EPCR)
. В:Материалы. Конференция по биоинформатике IEEE Computer Society, Стэнфорд, Калифорния,
.2002
, дои:50.Altschul
SF
,Gish
W
,Miller
W
и др.Инструмент поиска базового локального выравнивания
.Дж Мол Биол
.1990
;215
:403
–10
.51.Nguyen
NTT
,Vincens
P
,Roest Crollius
H
, и др.Genomicus 2018: эволюционные деревья кариотипов и вычисления синтении «на лету»
.Рез. нуклеиновых кислот
.2018
;46
:D816
–22
.52.Гурье
J
,Поп
M
,Корен
S
, и др.Формирование сборок длительного считывания с использованием контактной информации дальнего действия
.BMC Genomics
.2017
;18
:527
.© Автор(ы), 2021. Опубликовано Oxford University Press GigaScience.
Это статья в открытом доступе, распространяемая в соответствии с лицензией Creative Commons Attribution License (http://creativecommons.org/licenses/by/4.0/), которая разрешает неограниченное повторное использование, распространение и воспроизведение на любом носителе при условии, что оригинал работа цитируется правильно.