Специфични за състоянието модели на генно съ-експресия при рак

Специфични за състоянието модели на генно съ-експресия при рак

Are GMOs Good or Bad? Genetic Engineering & Our Food (Април 2019).

Anonim

Професор от университета Климсън, възпитаник, бивш член на ИТ персонала и двама ученици, представиха компютърен софтуер, който може да сортира гени, за да разбере по-добре как те взаимодействат, за да причинят заболяване. Публикувано в списанието Scientific Reports през август, софтуерът ще помогне на изследователите да изследват сложните черти, контролирани от множество гени.

Известно като изграждането на независима мрежа от знания (KINC), софтуерът е кулминацията на многогодишни изследвания, проведени от професор Алекс Фелтус в катедрата по генетика и биохимия. Бившият студент на Feltus, Стивън Фиклин, сега асистент в Университета в Уошингтън, разработва софтуера. Изследователите от бакалавърската степен и дипломиралите се Leland Dunwoodie и Will Poehlman работиха с член на персонала на CCIT, Ким Рош - понастоящем докторант в Дюк - за да съберат и анализират данните.

Чрез издърпването на повече от 2000 набора от данни за експресиране на туморни гени от Atlas на раковите геноми - публично хранилище за геномна информация, свързано с 33 различни вида рак - екипът е могъл статистически и визуално да организира гените въз основа на споделените им функции.

"Идеята е, че ако два гена са на едно и също време, може да работят заедно", каза Фелтус. "Така че ние обличахме мрежа от гени, които взаимодействат помежду си и с това всъщност можем да намерим пет, 20, понякога хиляди гени, които трябва да се издигнат и да паднат заедно в техните нива на изразяване.Тогава това, което можем да направим, е да кажем: Е, какви са тези генни пакети? "

С помощта на софтуера KINC не е необходимо изследователите да имат предварително познания за това, как трябва да изглежда генната мрежа, тъй като софтуерът ще използва данните, за да определи как да се категоризират гените. Този метод, независим от знанието, намалява количеството "шум" - от лабораторните протоколи или от естествените вариации между клетките - което може да предотврати откриването на генетични взаимодействия.

"Понякога софтуерът сортира образци в групи от същите видове тумори, които за нас са били щитовидната жлеза, пикочния мехур, яйчниците и два вида мозъчни тумори: глиома и глиобластома", каза Фелтус. "Понякога обаче, за всяка двойка гени, софтуерът разглежда как те са свързани помежду си в различни групи проби. Може би ще откриете, че тези два гени взаимодействат едни с други в рака на щитовидната жлеза, така че те са по- но софтуерът може да получи специфични за степента на тумора, като идентифицира взаимодействията, които се случват в ранните стадии на тумори, напреднали тумори, мъжки тумори, женски тумори или дори етническа принадлежност. "

След като KINC е сортирал гените в групи, изследователите могат да провеждат по-задълбочени статистически тестове, за да открият корелациите между гените и клетъчните пътища в тялото. В получената генна мрежа за съвместно експресиране (GCN) два гена, които имат голяма вероятност да взаимодействат помежду си, ще бъдат свързани с линия, наречена край.

Необичайно при изграждането на генни мрежи, които имат склонност да имат големи масиви от данни, проучването на случая на екипа доведе до GCN с толкова много генни взаимодействия - толкова много краища - че приличаше на косми.

"В науката винаги се опитваме да намалим системата до една или две променливи, но използвайки биоинформатиката, намаляваме стотици хиляди променливи до стотици", каза Фелтус. "Ние прегръщаме сложността на системата, но искаме тя да има смисъл, като разсейва шума".

За да се обработват и анализират тези сложни геномни данни, областта на биоинформатиката изисква високоскоростни, широкомащабни изчислителни способности. Като се има предвид, че само един експеримент генерира 700 терабайта данни - достатъчно, за да запълни повече от 700 лаптопа с файлове с данни - лесно е да разберете защо биоинформатиката и суперкомпютрите вървят ръка за ръка.

За щастие университетът Климсън разполага с клъстера "Палмето", един от първите 100 суперкомпютъра в света, разположен в Пендълтън. Тъй като работи в демократизирана система за моделиране на етажната собственост, всеки факултет, персонал или студент от Clemson може да се регистрира за сметка и да използва суперкомпютъра безплатно. Но като се има предвид, че тя е споделена между толкова много хора, наличното количество за съхранение на изследването за рака на екипа е ограничено.

"В сравнение с традиционните кое експресионни анализи, управлението на софтуера KINC беше голямо компютърно предизвикателство", каза Поелман. "Ние бързо осъзнахме, че не можем да генерираме резултати в разумен срок, използвайки само суперкомпютъра тук в Clemson, така че прекарах много време в работата си с Open Science Grid, за да разработя работни потоци, които ни позволиха да използваме компютърните ресурси страната да завърши този експеримент. "

Развитието на KINC дойде като част от по-широко разследване от Feltus и колегата Melissa Smith от отдела по електротехника и компютърно инженерство, наречен "Научен анализ на мащаба" или SciDAS. Финансирана от безвъзмездна помощ от 2, 95 милиона долара, екипът възнамерява да изгради национална компютърна система, която да направи обработката на данните по-ефективна.

"С SciDAS, ние сега създаваме суперкомпютри динамично, като вземем един суперкомпютър и картографиране на нов суперкомпютър към него чрез усъвършенствани мрежи и ние използваме KINC като начин за обработка на данни от много, много видове. на тези разпределителни компютърни системи, което открива способността да обработва тези големи набори от данни за хората ", каза Фелтус.

Дънуди, който откри 22 гена, специфични за глиобластома, докато провежда изследването на екипа, каза, че е удостоен с това, че е свързвал алгоритъма "КИНЦ" с биологията на раковите заболявания. Понастоящем той има подготвен доклад, който анализира как тези гени засягат развитието на глиобластомен тумор.

Софтуерът на екипа е безплатен и достъпен за обществеността. Тези, които изтеглят KINC, могат дори да го променят за изследователските си нужди, като променят кода си, стига да запазят публично достъпната модифицирана версия.

Популярни Публикации

Препоръчано