An Official Journal of the European Federation of Medical Informatics

About EJBI Editorial Board Instructions for Authors Browse EJBI Special Issues Sponsorship & Ads Contact
ISSN 1801-5603
English
Czech English

Medicína založená na omics vědách a systémová patologie – Nová perspektiva personalizované a prediktivní medicíny

1. Graduate School of Biomedical Science, Tokyo Medical and Dental University, Tokyo, Japan

Souhrn

Cíle: Poslední významné pokroky v lidské genomice a postgenomických „omics“ nyní přinášejí nové možnosti zdravotní péče, kterou nazýváme „medicína založená na omics vědách“. V tomto článku jsme zkoumali vývoj a budoucí možnosti medicíny založené na omics vědách.

Metody: Rozdělili jsme vývoj medicíny založené na omics vědách do tří generací za účelem ujasnění hlavních klinických cílů a charakterizace informačních metod každé generace spolu s jejich budoucími možnostmi.

Výsledky: První generace medicíny založené na omics vědách, začala s „genomickou medicínou“, založenou na vrozených individuálních rozdílech v genomu. Toto otevřelo studování genetických polymorfismů nemocí a napomohlo vývoji personalizovaných léků založených na farmakogenetických/ farmakogenomických rozdílech v reakci na lék. Ve druhé generaci omicsové medicíny, díky pokroku v technologii vysokorychlostního sekvencování, byl otevřen přístup k obrovskému množství různých omicsových dat postgenomických nemocí, obsahujících vyčerpávající molekulární informace o nemocech somatických buněk. Zobrazení průběžného stavu nemoci je tak mnohem věrnější a umožňuje tak prediktivní medicíně předpovězení prognózy nemoci uplatněním datové analýzy. A také, díky rychle se rozvíjejícím znalostem o buňkové molekulární síti, je nyní umožněno porozumět nemoci na systémové úrovni pomocí nového oboru, zvaného systémová patologie. Může plně využít významné znalosti omicsu nemoci a povede ke komplexnímu porozumění postupu nemoci použitím datové analýzy.

Závěr: Omicsová medicína a systémová patologie umožní nový druh personalizované a prediktivní medicíny.

Klíčová slova: Medicína založená na omics vědách, systémová patologie, genomika, omics vědy, farmakogenomika

1. Úvod

Poslední rychlý pokrok v lidské genomice a následné studie postgenomické komprehensivní molekulární informace, souhrně nazývané „omics" [1], [2], jako například transkriptomika, proteomika a metabolomika, dávají vzniknout novým možnostem v medicíně. Na základě těchto možností hraje rychle se vyvíjející informatika, nazývaná „klinická bioinformatika" [3] nebo podle novějšího termínu „translační informatika" [4], nezastupitelnou roli při odvozování klinicky významné informace z obrovského množství omicsových dat.

Až do současné doby bylo použití komplexní molekulární informace v medicíně označováno jako „genomická medicína" [5], [6], která si dává za úkol poskytovat „personalizovanou lékařskou péči", založenou na vrozených (germline) individuálních rozdílech neboli „polymorfismech" pacientovy genomické informace. Některé druhy personalizované lékařské péče už byly zavedeny do klinické praxe. Například „personalizovaná medicína" se nyní klinicky používá u některých léků, u kterých je nutné před-předpisové genotypování nebo proteinová analýza. Tento před-diagnostický test zabraňuje nežádoucím vedlejším účinkům a zabezpečuje účinnost těchto léků u individuálních pacientů. Mezitím, díky posledním pokrokům ve vysokosekvenční technologii, jako například DNA mikroarrays [7], [11] nebo hmotnostní spektrometrie (MS) [12], [13], se postgenomické omicsové informace nebo prostě „omicsová" data stala dostupná v klinickém kontextu. Mnoho různých studií prokázalo, že omicsová informace poskytuje komplexnější a významnější informace vztahující se k postupu nemoci, než jen pouhou „genetickou dispozici" k těmto nemocem, takže by mohla být použita ve vlastní klinické praxi na účely jako jsou například raná diagnóza, klasifikace poddruhů nebo předpověď onemocnění [14], [16]. Na tomto základě lze očekávat, že omicsové informace pozorované ve stavu nemoci („omics nemoci") mohou přinést nový druh lékařské péče, který bude více prediktivní a preventivní než běžná genomická medicína. Tato nová etapa molekulární medicíny potřebuje nový název, aby se odlišila od genomické medicíny. Můžeme jí jednoduše nazývat „medicína založená na omics vědách" nebo „omicsová medicína". (omics based medicine) [17].

Při používání omicsu nemoci pro preventivní a prediktivní medicínu byla omicsová data nejprve analyzována přímo na své úrovni aplikací vytěžování dat nebo exploratorní statistiky („datová analýza omicsových dat"). Jako typický příklad můžeme uvést vhodně zvolené sady genů zvané „signatury", které byly určeny pomocí aplikací získaných dat nebo pomocí exploratorní statistiky na profily genové exprese nemocných buněk za účelem stanovení předpovědi nemoci, jako například rekurence rakoviny během několika let po operaci [14], [16]. Jako jiný příklad můžeme uvést analýzu statistického vzorku proteomických dat. Extrakce charakteristických vzorků z hmotnostního proteinového spektra za použití statistické analýzy se provádí pro ranou detekci rakoviny [18], [19]. Tyto pokusy dosáhly v některých případech překvapivých úspěchů, ale ve většině případů nebyly výsledky pro další klinické aplikace dostatečné. Brzy se přišlo na to, že obrovské množství omicsových dat s jejich extrémně vysokou vzájemnou závislostí, často zabraňuje postupům založených na datech dosažení směrodatných výsledků.

Na základě rychle se rozvíjejících znalostí o celulární molekulární síti a jejích změnách při nemocech je zřejmé, že s výjimkou vzácných genetických nemocí není většina nemocí způsobena mutací jednoho nebo dvou genů, ale je spíše způsobena kooperativním účinkem aberací několika genů a proteinů. Tyto společné účinky způsobují změny v signálních kanálech nebo regulačních sítích genů, čímž produkují fenotypy nemocí. Takže bychom lépe porozuměli nemocem jako fenotypům, způsobených „systémovým narušením molekulární sítě", díky vzájemně propojenému selhání genů a proteinů. Tento pohled na nemoci je obzvláště pravdivý pro běžné komplexní nemoci, jako například běžné typy rakoviny, které jsou nyní považovány za onemocnění dráhy („pathway disease") [20]. Takže systémové porozumění nemocem založené na znalosti změn molekulární dráhy se nyní považuje za klíčové pro plné využití podstaty obsahu omicsu nemoci a ke komplexnímu porozumění toho, co tyto nemoci způsobuje („modelová analýza omicsových dat").

My navrhujeme tento druh systémového přístupu k nemocem jako „systémovou patologii" již několik let [21], [22] v tom smyslu, že se jedná o správnou aplikaci systémové biologie na nemoci [23], [24], [25]. Toto stádium omicsové medicíny, především té, která je založena na porozumění systémové patologii řetězce nemoci, by se mohlo nazývat „omicsová systémová medicína" nebo ji můžeme jednoduše nazývat „systémovou medicínou" jako to dělají její ostatní zastánci [26], pokud je zamýšlený význam tohoto konceptu správně chápán.V každém případě bychom rádi zdůraznili, že tento nový druh medicíny, založený na obrovském množství omicsových dat a porozumění celému procesu nemoci na systémové úrovni, by nebyl možný a nebude se moci vyvíjet v budoucnosti bez spolupráce tak zvané „(postgenomické) omics informatiky" neboli „systémové patologie".V tomto článku popisujeme stěžejní rysy a vývoj omicsové medicíny a informatiky používané tak, jak jsme stručně naznačili výše. Není třeba zdůrazňovat, že genomika je v omics běžně zahrnována. Takže když popisujeme vývoj omicsové medicíny, začneme stručným přehledem genomické medicíny, jakožto její první generace a potom přejdeme k postgenomické omicsové medicíně jako ke druhé a současné generaci, a nakonec popíšeme omicsovou systémovou medicínu jako třetí generaci s jejími možnostmi do budoucnosti. Domníváme se, že tento „třígenerační model" je velmi vhodný pro debatu o podstatě a hlavních klinických cílech každé generace, spolu s informatikou specifickou pro každou generaci používanou pro dosažení těchto cílů.

2. Genomická medicína jako první generace omicsové medicíny – stručný přehled

2.1. Genomická medicína pro personalizovanou péči

Jak je všeobecně známo, molekulární medicína začala „genomickou medicínou", která představuje novou medicínu, jejichž snahou je uskutečnění personalizované péče založené na individuálních rozdílech v genomické informaci. Díky pokroku v projektu lidského genomu [27] se přišlo na to, že lidský genom má individuální vrozené rozdíly. V lidském genomu existují různé typy polymorfismů, jako například různý počet tandemových repeticí (VNTR), mikrosatelitů (opakovaná jednotka je jedna až několik bps) nebo minisatelitů (9 až desítky bps), inzerčně-delečních polymorfismů (indel), variace počtu kopií (CNV) a tak dále [28]. Ale v současné době je nejběžněji používaným polymorfismem jednonukleotidový polymorfismus (SNP), který se vyskytuje v průměru u každých 300-1000 nukleotidů v lidském genomu (přibližně 0,1 - 0,3 %), takže v každém individuálním lidském genomu se vyskytuje celkem 3 až 10 milionů SNP polymorfismů.

Z klinického pohledu jsou nejdůležitější dva druhy klinických fenotypů, způsobené výše zmíněnými genomickými polymorfismy:

  1. náchylnost k nemoci (kauzalita) a
  2. reakce na léky.

Bod číslo jedna vyjadřuje genetický risk výskytu nemoci, zatímco bod číslo dvě se zabývá rozdíly v individuální reakci na léky. V poslední době jsme viděli mnoho vynikajících článků, jako například [5], [6] vysvětlující „genomickou medicínu". Nebudeme ji zde popisovat v detailu, ale pouze si ji krátce představíme s důrazem na rozdíly od dalších (druhé a třetí) generací omicsové medicíny, které budou centrálním námětem tohoto článku.

2.2. Genomická medicína a studie genů nemoci

Genomické studie lidských nemocí v podstatě začaly v osmdesátých letech minulého století, kdy byly poprvé k dispozici genetické mapy celého genomu (i když pouze hrubé) a dostatečný počet DNA markerů (náhodně rozmístěných v genomu); nejdříve využitím RFLP (polymorfismus délky restrikčních fragmentů) [28] a později mikrosatelitů. Genetické mapy a DNA markery poskytují rámec pro určení lokace genů způsobujících nemoc v lidském genomu („poziční klonování") [29]. Společně s pokrokem ve statistické genetice [30], jako je například Mendeliánská vazbová analýza založená na rodokmenech, uspělo několik genetických studií v pozičním klonování genů zodpovědných za nemoci, jako například za Huntingtonovu nemoc [29], [30], [31], Duchennovu svalovou dystrofii [32] (DND/BMD-Duchenne/Beckerova muskulární dystrofie) nebo cystickou fibrózu [33]. Skutečnost je taková, že tyto úspěchy v identifikaci genů způsobující nemoci přinesly motivaci začít s projektem lidského genu.
 
Ačkoliv rané genetické studie byly úspěšné v identifikaci různých kausativních genů monogenových nemocí, jejich prevalence je relativně nízká. Je klinicky mnohem důležitější objasnit genetický původ polygenových nebo multifaktoriálních nemocí, jako jsou běžné komplexní nemoci jako například astma, rakovina, cukrovka, srdeční choroby nebo duševní poruchy. Ale na rozdíl od monogenních nemocí v těchto případech pozorujeme několik set „genů podezřelých z nemoci" s nízkým relativním genotypickým riskem (GRR) [34], což znamená, že riziko spojené s určitým genotypem je u polygenních nemocí relativní k jinému genotypu (non-carrier , tj. ne-nositel).
 
Určitý SNP se může vztahovat ke genu náchylnosti k nemoci mechanismem zvaným „vazbová nerovnováha" [35], což přináší vysoký společný výskyt SNP a genů náchylnosti k nemoci. V takovém případě může být tento SNP použit jako marker, který, pokud je nalezen, poskytuje zvýšený relativní genotypový risk pro tuto nemoc. Ale je obecně vzácné najít markery pro geny náchylnosti s relativně vysokým GRR, zvláště pro běžné komplexní nemoci.

Abychom překonali tyto překážky, byly podniknuty rozsáhlé studie zvané GWAS neboli celogenomové asociační studie [36-37]. Studie GWA (GWAS) se provádí rychlým skenováním statisíců markerů v celých genomech mnoha lidí za účelem nalezení genetických variací spojených s určitou chorobou. Bylo provedeno mnoho rozsáhlých GWA studií. Velmi známé jsou například studie cukrovky, protože různé studie GWA objevily nový společný gen náchylnosti TCF7L2 [37-39]. Studie GWA začaly být možné díky DNA arrays (vzorky sekvence, mikročipy), které obsahují více než 500 tisíc SNP v jenom čipu. Velký rozměr populace a srozumitelnost sond SNP v čipu [40] umožňují GWA studiím vysoké možnosti detekce genů náchylnosti k nemoci.

Jiný přístup ke získání vyšších hodnot náchylnosti u polygenních nemocí je použití kombinovaného vzorku mnoha SNP, zvaných „SNP haplotyp". Termín „haplotyp", což je zkratka pro haploidní genotyp, je definován jako sada alel blízce svázaných loci na stejném chromozomu, které mají tendenci být zděděny společně. Podobně je SNP haplotyp definován jako určitý typ sekvenčních SNP na jednom chromozomu, které jsou statisticky příbuzné. Pro získání produktivního odhadu rizika nemoci pro polygenní nemoci je však jednotlivý SNP nedostačující. Použitím SNP haplotypu u studie asociace haplotypu a nemoci je možné získat přesnější relativní riziko nemoci. Hromadné sbírání tohoto druhu informace je náplní současně probíhajícího mezinárodního projektu Hapmap [41].
 
Studie genu nemoci za účelem určení mutací nebo polymorfismů genů spojeného s nemocí (kausativní nebo susceptibilní gen) ukazují detailní individuální rozdíly v patogenezi nemoci. To znamená, že toto by přispělo k personalizované medicíně a k možnosti budoucího předpovídání výskytu nemoci u specifických jednotlivců. Avšak zdá se, že tento obor genomické medicíny není schopen okamžitého účinného příspěvku ke klinické praxi, protože dokonce „vysoká GRR" susceptibility genu pro běžné nemoci je většinou zhruba 1,5, ale přesto se různé pokusy jako GWAS nebo SNP Haplotypová analýza stále zkoumají. Bylo by lepší se smířit s tím, že současné studie nemocných genů přispívají vědeckému ujasnění genetického původu nemocí, spíše než v nich vidět okamžité aplikace pro vlastní klinické využití.

Zde můžeme vidět výrazný rozdíl proti jinému oboru genomické medicíny - „ personalizované medicíně", kde genomický polymorfismus s léky spojených genů někdy způsobí výrazné rozdíly v reakci na lék. Důvod by mohl být v tom, že lék se objevil relativně nově v lidském evolučním vývoji, takže genetické mutace nebo polymorfismy s léky spojených genů působících fatální reakce na léky stále přetrvávají, protože ještě neuplynul dostatečně dlouhý čas na jejich eliminaci lidskou evolucí. Naproti tomu genetické mutace a polymorfismy genů nemocí, které mají fatální účinky, byly z větší části eliminovány dlouhým vývojem lidské evoluce [42].

2.3. Personalizované užívání léků založené na genetickém polymorfismu

Na rozdíl od pomalého pokroku v personalizované péči založené na studii genů nemocí, personalizované užívání léků je okamžitě účinná a rychle se rozvíjející oblast genomické medicíny. Individuálně upravené léky se nyní zavádí do klinické praxe.

Některé genetické polymorfismy se mohou zúčastnit funkcí vztahujících se k účinku léku, čímž způsobují individuální rozdíly v reakci na lék a dávají tak podnět ke klasifikaci „respondér" a „ne-respondér" (citlivý/necitlivý na lék). Odvětví farmakologie, které studuje vlivy genomické variace na reakci na léky u pacientů, se nyní nazývá farmakogenomika nebo farmakogenetika (PGx je zkratka pro obě odvětví). Koncept farmakogenetiky je používán již více než 40 let pro označení studií jednotlivých genů a jejich vlivu na inter-individuální rozdíly v enzymech, které metabolizují léky. Na rozdíl od toho je farmakogenomika relativně nový pojem, který vznikl po projektu lidského genomu a který označuje studii nejen jednotlivých genů, ale i funkce a interakce všech genů v genomu v celkové variabilitě reakcí na lék [43]. Nicméně rozdíl mezi těmito dvěma termíny je spíše arbitrární a tyto dva termíny mohou být nyní vzájemně zaměňovány.
 
Jak jsme se již zmínili výše, PGx je jedna z nejúspěšnějších oblastí genomické medicíny. „Journal of the American Medical Association (JAMA-časopis Americké lékařské společnosti) v roce 1998 napsal, že asi dva miliony pacientů ročně utrpí následky spojené s užíváním léků a asi 100 000 z nich zemře, což představuje čtvrtou nebo pátou příčinu smrti ve Spojených Státech [44]. Správa pro jídlo a léky (FDA) v USA [45] podporuje používání před-diagnostických testů DNA pro testování reakcí na léky. Tyto testy jsou u některých léků povinné, kvůli tomu, aby se zamezilo nežádoucím vedlejším účinkům.
 
Individuální rozdíly v reakci na léky se přisuzují především dvěma třídám genetických polymorfismů. První je nazýván farmakodynamický (PD) polymorfismus a je způsoben polymorfismy genů s proteiny, které se vztahují k účinkům léků a spojených s receptory nebo proteinovou kinázou. Druhý z nich se nazývá farmakokinetický (PK) polymorfismus a vyskytuje se díky genům obsahujícím proteiny zodpovědné za absorpci, distribuci, metabolismus a vylučování (ADME) léku, například enzymy metabolizující nebo přepravující léky.
 
PD polymorfismus reakce léků je často nalezen v molekulárně cílených lécích různých moderních protirakovinných prostředků. Za zmínku stojí Gefitinib (Iressa), což je lék proti rakovině plic (epidermální růstový faktor receptoru - tyrosine kinase inhibitor, EGFR-TKI), který je zvláště účinný proti pokročilému nemalobuněčnému karcinomu plic (NSCLC) [46]. Tento lék má naprosto vynikající účinky u „super-respondéra", jehož stav se dramaticky zlepší po aplikaci Gefitinibu, dokonce i když se plícní karcinom rozšířil po celé plíci [47]. Tento lék je účinný zvláště proti adenokarcinomům u asijských žen v rozsahu 25-30 %, ale jeho účinnost jsou pouhá 3 % u mužů v USA a 17 % u žen v USA. Avšak tento lék může způsobit vážné vedlejší účinky u 2 % Japonců, u kterých způsobí intersticiální plícní chorobu, následkem které jedna třetina pacientů zemře. Takže abychom zabránili nebezpečnému riziku tohoto léku u ne-respondéra, genetické testování je nezbytné. Rozdíl v reakci na tento lék se nyní připisuje specifické mutaci receptoru EGF a bylo oznámeno, že účinek tohoto léku se u pacientů s touto mutací zvyšuje desetkrát [48].
 
Jiný dobře známý příklad je Trastuzumab (Herceptin), což je lék proti rakovině prsu, založený na monoklonální protilátce. Tento lék je účinný pro pacienty s rakovinou prsu, kteří mají zvýrazněný receptor HER2 (lidský epidermální růstový faktor typu 2) [49], [50]. Úřad pro potraviny a léky USA, FDA, rozhodl, že před-diagnostické testování DNA za použití imunohistochemie (IHC) a fluorescenční in situ hybridizace (FISH) je před aplikací tohoto léku povinný.
 
Polymorfismus PK řadí pacientovu individuální reakci na určité léky od „extenzivního metabolizéra", jehož trávicí enzymy eliminují lék příliš rychle, čímž potlačují jeho účinek, až do „slabého metabolizéra", který stravuje lék špatně, takže lék zůstává v jeho organismu příliš dlouho a produkuje a způsobuje excesivní účinek. Nejznámější polymorfismus trávícího enzymu, všeobecně spojovaným s účinky léků, je skupina cytochromů P450 (CYP). K dnešnímu datu je u lidí známo více než 50 izoenzymů CYP. Klasifikace tohoto enzymu je založena na stupni homologie genetických sekvencí. Účinky mnoha důležitých léků, jako jsou například protirakovinný prostředek 5-fluorouracil (5-FU), Irinocetan nebo prostředky proti tuberkulóze jako Isoniazid atd., závisí na polymorfismu CYP. Je k dispozici mnoho vynikajících pojednání o polymorfismu CYP a jeho účincích na metabolismus léků. Nebudeme se zde pouštět do obecného popisu, pouze krátce představíme některé aspekty personalizované medikace. Za tímto účelem si zvolíme jako příklad Warfarin.
 
Warfarin je nejrozšířenější antikoagulační lék, předepisovaný pro potlačování syntézy srážlivých faktorů, čímž zabraňuje infarktům, mrtvicím a srážení krve. Je také známý svým úzkým terapeutickým rozsahem; nadměrná dávka způsobuje krvácení, zatímco nedostatečná dávka způsobuje trombózu. Další problém je v tom, že se úzký terapeutický rozsah mezi jednotlivci podstatně liší a variace dosahuje až desetinásobku, takže udržovací dávka tohoto léku musí být pečlivě monitorována častými krevními testy, aby byla zajištěna adekvátní, ale současně bezpečná, dávka. Warfarin potlačuje schopnost podsložky 1 komplexu epoxidu reduktázy vitamínu K (VKORC1) syntetizovat vitamín K nutný pro koagulaci krve, čímž zabraňuje srážení krve. Polymorfismy týkající se účinku Warfarinu jsou CYP2CD (*1, divoký typ a *3 nízkoaktivní typ) u PK polymorfismu a VKORC1 (-1639G >A, alela G, s vysokou transkripční aktivitou) u PD polymorfismu. Nejnovější studie ukazují, že pacientova první reakce je určena zvláště genotypem VKORC1 [51]. Jak jsme se již zmínili, pokyny FDA doporučily před-diagnostické testy DNA; některé jsou povinné a jiné jsou buď doporučené nebo referenční, zaměřené na citlivost na tento lék. Co se týká Warfarinu, je před-diagnostický test DNA doporučen.

Používání na míru ušitých léků se zvyšuje spolu s pokrokem ve farmakogenomice a farmakogenetice [52].

3. Výhody a možnosti medicíny založené na postgenomické omicsové vědě – druhá generace omicsové medicíny

Ještě na počátku devadesátých let minulého století, když ještě projekt lidského genomu (HGP) teprve probíhal, staly se postgenomické omicsové vědy, jako například transkriptomika nebo proteomika, skutečností a to díky rychlému pokroku v technologiích vysokorychlostního sekvencování. Ačkoliv je každá z postgenomických omicsových věd původně odvozená ze stejné genomové sekvence, má svou vlastní původní informaci získanou různými postgenomickými (post-transkripčními nebo post-translačními) postupy, jako je například alternativní řezání, post-translační modifikace nebo epigenetická modifikace. Nyní se postgenomické omicsové vědy vyvíjejí samostatně a některé aplikace byly již schváleny FDA pro klinické použití.
 
Mezi genomikou a postgenomickými omicsovými vědami je velký rozdíl ve vztahu ke klinické medicíně. Genomická medicína používá kongenitální polymorfismus genomové sekvence „germ-line", který je identický ve všech tkáních a zůstává stejný po celý život. Naopak většina postgenomických omicsových věd je závislá na komprehensivní molekulární informaci „nemocných somatických buněk", která se může měnit během časového průběhu nemoci a také je různá u různých tkání, takže se má za to, že omics vědy mnohem lépe reflektují současný stav nemoci a tím poskytují mnohem přesnější informaci než je informace genomická.

Takže se očekává, že kdybychom byli schopni co nejlépe použít omicsová data v klinické medicíně, mohli bychom inovovat konvenční medicínu a otevřít novou fázi lékařské péče, kterou bychom mohli nazývat (postgenomická) omicsová medicína. V této sekci popíšeme, jaké nové druhy klinických možností omicsové informace přinesou do lékařské péče a tím vylepší současnou konvenční genomickou medicínu.

3.1. Omicsové vědy poskytují informace o detailním mechanismu nemoci

3.1.1. Určování poddruhů a prognostika nemoci

Postgenomická omicsová informace poskytuje detailní údaje týkající se struktury molekulárního vývoje nemocných buněk. Omicsová data nemocných buněk poskytují klinicky a patologicky nepozorovatelné informace, které mohou být použity pro detailní klasifikaci nemoci. Nejlepší příklad klasifikace nemocí založené na genovém profilování (transkriptomika) jsou DNA mikroarrays. Studie Goluba a kolektivu [14] je prvním pokusem toto uskutečnit; na příkladu lidské akutní leukémie předvedli možnost podklasifikace rakoviny, založené čistě na vzorku genového projevu bez reference k žádným předešlým zdravotnickým znalostem. Alizadeh a kol. [15] zkoumali uspořádání genové exprese rozptýleného lymfomu velkých buněk B (DLBCL) a našli dva poddruhy, které nebyly nalezeny konvenčním klinicko-patologickým zkoumáním a ukázali, že každý z nich vykazuje zcela jinou prognózu.

Struktura genové exprese neposkytuje pouze mikroskopickou informaci o molekulární aktivitě nemocných buněk, ale také ukazuje úzký vztah k makroskopickým projevům nemocí, zvláště k prognóze nemoci, což nemůže být správně předpovězeno čistě na bázi „mezoskopického pozorování", jako jsou například klinické a patologické nálezy. Rosenwald a kol. [16] použili profilování genetické exprese DLBCL k identifikaci tří podskupin, které přidali ke dvěma již známým podskupinám [15] a na základě tohoto seskupení vytvořili molekulární prediktor přežití pacientů po chemoterapii. Tento prediktor byl nezávislý na dřívějším indexu klinicko-patologické prognózy. Také se objevilo mnoho studií zabývajících se předpověditelností nemoci na základě transkriptomiky [53]. Sorlie a kol. [54] zkombinovali několik nezávisle provedených populačních studií zabývajících se profilováním genové exprese rakoviny prsu za účelem vytvoření klasifikace podskupin pacientů podle jejich specifické prognózy. Konvenční patologické testy nemocných tkání a klinická pozorování nebyly schopny poskytnout přesnou prognózu. V posledních letech schválila FDA dva prognostické testy založené na genové expresi („MammaPrint" [55] a „OncotypeDX" [56]), které jsou schopny předpovědět výhled pacienta po operaci rakoviny prsu a jsou nyní komerčně dostupné.

3.1.2. Reakce na protirakovinný lék

Profily genové exprese mohou být také použity pro predikci reakce léku proti rakovině. Cheng a kol. [57] použili bioptické vzorky z primárních prsních nádorů odebraných před zásahem za účelem předpovědi reakce na léčení docetaxelem, založené na profilu genetické exprese vzorků. Z jejich práce vyplynulo, že molekulární profily mohou být použity k vývoji klinických testů na citlivost na docetaxel. Ayers a kol. [58] zkoumali vhodnost vývoje multigenového prediktoru patologické kompletní odezvy (pCR) na neoadjunvantní chemoterapii kombinující fluorouracil, doxorubicin, cyklofosfamit a paclitaxel při léčení rakoviny prsu. Na základě profilování genové exprese nádoru byla dosažena prediktivní přesnost 78 %. Rozdíly v reakcích na protirakovinný lék se přisuzují nikoli kongenitálnímu polymorfismu enzymu metabolizujícího lék, jak je to popsáno v minulé sekci o genomické medicíně, ale charakteristice vzorku nemoci, nebo přesněji výchozí napadené molekulární dráhy, která se projevuje v profilu genové exprese.

3.2. Diagnostická schopnost proteomiky

Jelikož omicsová informace se více vztahuje ke stavu nemocných buněk, může být také použita pro ranou detekci nemoci. Co se týká rakoviny, máme mnoho dobře známých nádorových markerů, ale ty jsou použitelné v relativně pozdním stádiu, kde pouze slouží k potvrzení již zjištěné rakoviny. Na rozdíl od běžného nádorového markeru, proteomika nemoci měřená pomocí hmotností spektrometrie, může být použita na ranou detekci rakoviny. Mnoho studií ukázalo, že nejenom specifický hmotnostní spektrální vrchol, ale i celý hmotnostní spektrální útvar obsahuje informaci umožňující detekci rakoviny ve velmi časném stadiu. Tato informace může být získána pomocí statistiky nebo zpracování dat. Bylo například zjištěno, že rakovina vaječníku může být objevena ve velmi raném stadiu s přesností na 99 % pomocí proteomického testu pacientova séra při použití SELDI-TOF-MS [18].

Provedli jsme studii na porovnání rozlišovací schopnosti mezi proteomickou informací a konvenčními nádorovými markery s ohledem na detekci hepatocelulárního karcinomu (HCC) [59]. Je dobře známo, že u pacientů trpících cirhózou jater dojde k vývoji HCC. Sebrali jsme vzorky séra od pacientů trpících cirhózou jater (LC:20 subjektů), ranou HCC (E-HCC: 20 subjektů) a pokročilou HCC (A-HCC:20 subjektů). K proteomickému měření bylo použito SELDI-TOF-MS na analýzu pacientova séra a u nádorových markerů bylo měřeno AFP a PIVKA-II. Z grafu hmotnostní spektrální analýzy byly získány 3 statistické komponenty použitím metody nejmenšího čtverce.

Klasifikační výsledky (Tabulka 1) ukázaly, že pokročilá HCC mohla být diagnostikována u všech tří modelů. Na druhé straně konvenční nádorové markery dopadly špatně v rané detekci HCC v porovnání s vrcholnými intenzitami získanými metodou SELDI-TOF-MS. Navíc nejvyšší senzitivita (0,875) na detekci HCC z LC byla dosažena kombinací proteomických dat a nádorových markerů. To znamená, že proteomický test doplňuje dobře známé nádorové markery a mohou být použity společně pro vývoj přesnější metody rané detekce pro pacienty s cirhózou jater.

3.3. Omicsová medicína přináší personalizovanou a prediktivní medicínu

Na základě různých klinických schopností omics nemocí zmíněných výše můžeme popsat důležité prvky postgenomické omicsové medicíny výrazněji. Jak jsme se zmínili na začátku této sekce, postgenomické omics nemocí mohou poskytnout komplexní molekulární informaci o nemocných somatických buňkách. To znamená, že tato informace bude lépe vyjadřovat současný stav nemoci a také se bude měnit s jejím průběhem. Na rozdíl od toho, genomové sekvence „germ-line" v genomické medicíně zůstávají stejné po celý život.
 
Předpokládá se, že se omicsová informace nachází na středním stupni hierarchie mezi genotypem genomu a klinického fenotypu, takže vztah ke klinickému fenotypu je mnohem bližší než genomická informace (Obr.1). Tato „střednost" omicsových dat (blízko ke klinickému fenotypu a také k probíhajícímu postupu nemoci), poskytuje důležité klinické možnosti. Na rozdíl od genomické medicíny, která „pouze" počítá s možností objevení se nemoci v budoucnosti, postgenomická omicsová medicína obsahuje přesnější informace týkající se nemoci přímo z nemocných buněk a je tak schopná předpovídat mnohem přesněji, „kdy se nemoc objeví" a „jak se nemoc bude vyvíjet".

Další prvek omicsových dat, kromě jejich „střednosti", je jejich srozumitelnost či jejich komplexnost, protože omicsová data původně pocházejí z genové sekvence, takže v podstatě zahrnují celý genom. Většina současných měřících technologií, jako je mikroarray genové exprese nebo SNP čip, pokrývají celý genom, ačkoliv nějaký druh omicsů, jako například proteomika, v současné době poněkud zaostávají v nějakém aspektu (molekulová informace o velmi velkých proteinech), mohou být prakticky použity na získání celkové struktury nemoci. Srozumitelnost omicsových dat zaručuje platnost predikcí nemoci, které jsou provedeny na základě omicsových věd. Všeobecně se soudí, že genomická medicína přinese personalizovanou lékařkou péči, zatímco druhá generace omicsové medicíny přinese prediktivní medicínu. Omicsy nemoci poskytují detailní informace pro identifikaci podtypu nebo jemné molekulární charakteristiky nemoci, což umožňuje přesnější předpovídání nemocí nebo jejich ranou detekci. Samozřejmě, že když používáme termín „omics", zahrnuje to také genomickou informaci, takže omicsová medicína není omezena na postgenomické omics a obsahuje výhody první generace. Bylo by lepší říci, že očekáváme, že omicsová medicína v širším slova smyslu (včetně genomické medicíny) přinese personalizovanou a prediktivní medicínu. Naše charakterizace omicsové medicíny má několik společných prvků s medicínou 4P (personalizace, prevence, prediktivní a participatorní medicína), což L. Hood definoval jako koncept systémové medicíny [26].

 Tab. 1: Klasifikace přesnosti odhadnuté za použití příčné validace metodou „jeden vynechat", a) pouze špičky, b) pouze markery a c) modely „špičky a markery" pro diagnózu hepatocelulárního karcinomu.


 
Současný biotechnologický pokrok také výrazně změnil situaci v oborech příbuzných omicsové medicíně, kde příští generace sekvencorů umožňuje, že genom může být sekvencován během hodin až dní [60]. Sekvenční rychlost, která byla dva miliony bázových párů za den na konci projektu lidského genomu v roce 2003, nyní dosahuje přes bilion bps za den. Příští generace sekvencorů nebude fungovat jenom pro sekvencování DNA genomů, ale také může být použita pro jiný druh sekvencování, například mRNA nebo CHIP sekvencování [61]. Sekvencování mRNA - seq může být použito pro přímou digitální kvantifikaci sekvencí místo použiti konvenční hybridizační techniky, takže je možné se vyvarovat hybridizačních chyb a bude možné získat kvantifikační data vyšší kvality. Mohli bychom nazvat tuto digitální sekvenční molekulární informaci „digitální omics".

Společně s biotechnologickým pokrokem jsou náklady na sekvencování rapidně redukovány, takže můžeme očekávat příchod genomu za 1 000 dolarů, což bude znamenat nástup doby „osobního genomu".

3.4. Omicsová informatika druhé generace

Typická výpočetní metoda používaná v této generaci může být nazvána datovým přístupem. Velké množství omicsových dat je analyzováno, s nebo bez odkazu na externí kritéria (většinou klinicko-patologické charakteristiky a pacientovy výsledky). Toto je provedeno statisticky nebo zpracováním dat (strojové učení), metodami jako například modelem Coxovy regrese nebo podpůrným vektorovým strojem (SVM - support vector machine). Takto je extrahována sada genů nebo proteomický vzorek, které mohou poskytnout klinicky použitelnou předpověď, ranou detekci nebo podklasifikaci nemoci.

Ale většinou jsou omicsová data nepříliš vhodná, protože množství proměnných (například počet genů v mikroarray DNA) daleko převyšuje počet vzorků (například počet případů). Takže například zcela odlišné sady genů byly navrženy pro předpověď stejného druhu rakoviny různými výzkumnými skupinami. V této generaci je několik typických studií, které provedly úspěšnou analýzu omicsových dat, ale ve většině případů obrovské množství omicsových dat se svojí extrémně vysokou inter-korelací, zabraňuje získání jednoznačných výsledků, pokud je použit pouze přímý analytický postup. Tato nevýhoda datového přístupu k omicsovým datům musí být zvážena, aby bylo všeobecně zřejmé, že jakákoliv znalost o postupech nemoci musí být zahrnuta k doplnění nerozhodnosti datové analýzy omicsových dat. Tento trend vedl v jistém smyslu ke konceptu systémové patologie třetí generace omicsové medicíny a snažil se použít modelový přístup pro analýzu omicsových dat.

Co se týká informatiky druhé generace, rádi bychom navrhli slibný přístup k datové analýze. Abychom co nejlépe využili omicsové informace, měla by být vyvinuta nová bioinformatika nebo translační informatika orientovaná na nemoc, aby zvládla multi-omicsová data, a která by mohla analyzovat nejen omicsová data, ale také vzájemné vztahy mezi různými modalitami omicsových dat. Jelikož různé omicsové modality mají své vlastní informace, použití multimodálních omicsových dat nám dá nové informace, které vykompenzují nejednoznačnost výsledků získaných jednoduchými modálními omics. [62].

4. Systémová patologie a systémová omicsová medicína – třetí generace omicsové medicíny

4.1. Systémová patologie zahrnuje celý postup nemocí

Tak jak vznikala systémová biologie jako součást vědy o životě, stejná situace vznikla v medicíně založené na omicsových vědách, kde systémový přistup je absolutně nutný, abychom plně porozuměli celému procesu nemoci. Toto je situace, která potřebuje systémový přístup k nemocem. Přístup, který se soustředí na molekuly, kde se hledají příčiny nemoci pro specifické molekuly, jako například kauzativní geny nebo mutantní proteiny, a který byl úspěšný v monogenních studiích nemocí, nebude úspěšný u polygenních multifaktoriálních nemocí, jako jsou obecné komplexní nemoci. Jak jsme se již zmínili, rychlý pokrok ve znalostech celulární a molekulární sítě a jejich změn při nemocech, jasně ukázal, že s výjimkou vzácných genetických nemocí, je většina nemocí v podstatě zaviněna a podporována stabilně porušenými molekulárními sítěmi signálních drah nebo genových regulačních sítí.
Ačkoliv tato distorze je vyvolána kooperativním účinkem aberací genů a proteinů, porušená dráha určuje stav nemoci více. Takže pochopení nemocí na systémové úrovni, založené na znalosti drah nemocných molekul, se nyní považuje za nezbytné, pakliže chceme plně porozumět informačnímu obsahu omicsů nemoci a následně celému procesu jako takovému (modelová analýza omicsových dat).

Navrhujeme nový koncept „systémové patologie" k označení omicsové medicíny, jakožto obdoby systémové biologie v přírodních vědách. Prvek „celistvosti" v omicsových datech umožňuje rozumět nemoci jako integrovanému celku, podtrhující omicsová data o nemoci. Při vývoji systémové patologie by bylo správné popsat, jak by se mělo nakládat s nemocemi jakožto s jednotnými systémy. Popíšeme několik systémových prvků nemoci, které tomuto systémovému přístupu dávají váhu. Následující prvky jsou většinou k vidění v obecných komplexních nemocech. Vzácné genetické nemoci v popisu těchto prvků vynecháme.

 

  Obr. 1.: Koncept omicsové medicíny: Postgenomické omics nemoci poskytují komplexní molekulární informace o nemocných somatických buňkách. To znamená, že tato informace se mění během průběhu nemoci a liší se podle lokace nemoci, na rozdíl od genomových „germ-line" (mikrobiálních) sekvencí v přizpůsobivé medicíně (na míru), kde zůstává stejná po celý život. Omicsová informace leží na středním stupni hierarchie, takže vztah ke klinickému fenotypu je mnohem bližší, což umožní nástup prediktivní medicíny.

Přeložené termíny k Obr. 1.:
Distant relation – vzdálený vztah
Clinical Phenotype – klinický fenotyp
Genomic Polymorhpism – genomický polymorfismus
Disease Susceptibility – náchylnost k nemoci
Drug responsibility – odpovědnost za nemoc
Individualized Medicine – individualizovaná (osobní) medicína (na míru)
Tailor-made Medicine – lékařství na míru
extends – pokračuje jako
Clinical Phenoype – klinický fenotyp
Diseased Somatic Cell – nemocná somatická buňka
Actual Comprehensive Molecular Network State of Diseased Somatic Cell – vlastní vyčerpávající stav molekulární sítě nemocné somatické buňky
Predictive Personalized Medicine – prediktivní personalizovaná medicína
Integrated Understanding of Disease – integrované porozumění nemoci
Omics-based Medicine – medicína založená na omicsových vědách

4.2. Systémové prvky nemoci

4.2.1. Porušené molekulární dráhy jako primární příčiny nemoci

Díky pokroku ve studiích molekulárních sítí je všeobecně známo, že geny a proteiny spolupracují při formování molekulárních drah, které umožňují koherentní a komplexní biologické funkce. Takže bychom předpokládali, že s výjimkou vzácných genetických nemocí nejsou primární příčiny většiny nemocí dysfunkce genů, ale integrovaný důsledek pozměněných či porušených molekulárních drah, které vznikají vzájemným účinkem aberací několika genů a proteinů. Jinými slovy, nikoliv gen, ale dráha, je primární entita nemoci.
 
Když se příkladně podíváme na rakovinu, obecná rakovina vzniká změnami signálních drah nebo regulačních sítí genů, způsobená aberací několika (nikoli jednoho nebo dvou) onkogenů nebo genů potlačujících nádory, což následně vede k nekontrolovatelné proliferaci buněk. Všimněme si, že vznik nádoru je mnohakrokový proces, na kterém se podílí několik podstatných změn v genové dráze.
 
Experimentální studie ukazují [63], že zavedení opičího viru „40 early region" (SV40 ER), reverzní transkriptázy lidského telomeru (hTERT) a H-RAS do normální nakultivované buňky, definovalo sadu genetických změn, které jsou dostatečné k naprogramování tumorigenního fenotypu ve většině lidských kultivovaných buněk. SV40 ER zakóduje velký T antigen (LT) SV 40 a malý t antigen (ST), kde LT aktivuje retinoblastoma-protein (pRB) a dráhy supresoru nádoru p53 a ST potlačuje aktivitu proteinu fosfatázy 2A (PP2A), což vede k aktivaci MYC, což je transkripční faktor, který vyvolává proliferaci buněk.
 
Takže by se dalo říci, že existuje minimální soubor změn v molekulárních procesech, jako je imortalizace (hTERT), buněčný cyklus (pRB), apoptóza (p53), buněčný růst (MYC), angiogeneze, migrace a adheze (H-RAS), který je nutný pro vznik karcinomu. Také existuje mnoho variací ekvivalentní minimální genové sady, která způsobí nádor, ale změny v několika kritických dráhách, jako například těch, týkajících se růstu, mitózy a invaze, společně s potlačením apoptózy, se zdají býti nutné pro aktivaci tumorigeneze. Takže běžnou rakovinu bychom si mohli představit jako současný vznik aberace v těchto dráhách.

Toto se netýká pouze rakoviny, ale vztahuje se to i na jiné nemoci, zvláště běžné nemoci, kde se na vzniku nemoci podílejí stovky genů, jako je tomu například u hypertenze nebo u cukrovky. Je nepravděpodobné, že by každý z těchto genů sám byl schopen přímo ovlivnit spuštění nemoci, ale několik genů může spolupracovat na vzniku změn v jistých dráhách a společně způsobit aberaci těchto drah, což způsobí a podpoří nemoc.

4.2.2. Hierarchická organizace a schopnost nemoci přetrávat

Aberace v molekulární síti nejsou omezeny na subcelulární síť, jako jsou například intracelulární signální dráhy nebo genová regulační síť. Komunikace mezi buňkami, neboli intercelulární síť, která je nezastupitelná pro koordinaci skupinového chování buněk nebo regulaci funkcí na tkáňové úrovni, je také „sídlo" nemoci. Například intercelulární síť cytokinů, jako jsou interleukiny (IL) a TNF-α společně pracují v imunitním systému pro obranu hostitele, ale přehnaná exprese těchto genů způsobuje například chronická zánětlivá proliferační onemocnění (CIPD) [64], jako je revmatická artritida nebo psoriáza. Fyziologické řídící systémy větších rozměrů jako jsou oběhový, nervový nebo endokrynní systém, jsou také přirozeně spojené s nemocí pro formování klinického fenotypu na systemické úrovni.

Takže bychom mohli předpokládat, že nemoci jsou integrovaným multihierarchickým síťovým systémem, který se skládá ze subcelulární molekulární sítě, z mezibuněčné komunikace, vazeb tkáň/orgán a systemické koordinace (obr.2). Také jsou zde přítomny inter-hierarchické interakce. Kauzality shora dolů a zdola nahoru působí společně, takže nemoc představuje integrovaný celek. Kauzalita zdola nahoru by mohla být parafrázována jako „kumulativní a integrovaná kauzalita nasměrovaná do vyšších stupňů tkání a bio-objektů". Naproti tomu kauzalita shora dolů by mohla být parafrázována jako nekumulativní a distributivní kauzalita pro tkáně, které jsou odvozeny od systémů nebo orgánů vyššího stupně. Také environmentální (na životním stylu závisející) faktory ovlivňují průběh nemoci, zvláště u běžných nemocí. Takže nemoci tvoří multihierarchickou poškozenou síť a dříve či později se projeví na úrovni systemických klinických fenotypů.

 

Obr. 2.: Hiearchická organizace nemocí a schopnost přetrvat díky dvousměrné kauzalitě: nemoci jsou integrovaným multihierarchickým síťovým systémem, skládajícím se z podbuněčných molekulárních sítí, mezibuněčných komunikací, vazeb tkáň/orgán a celkových tělesných koordinací. Nemoci jako běžná komplexní onemocnění mají soběstačný udržovací mechanismus díky smyčce dvousměrné kauzality.

Přeložené termíny k Obr. 2.:
Clinical Level – klinická úroveň
whole body level – úroveň celého těla
tissue-Pathology – patologie tkání
Cellular level – buněčná úroveň
Bottom-up Causality – kauzalita zdola nahoru
Top-down Causality – kauzalita shora dolů
Information Shield – informační bariéra
Morphological Constraint – morfologická omezení
Whole Body Coordination – koordinace celého těla
Tissue-Morphological abnormality – abnormalita morfologie tkáně
Pathological cell population – patologická populace buněk
Cell-cell communication – mezibuněčná komunikace
Pathological cell – patologická buňka
signaling network – signální síť
gene regulatory network – síť genové regulace
metabilic network – metabolická síť

Běžné komplexní nemoci, jako jsou například hypertenze nebo cukrovka, jsou celoživotní nemoci, které trvají 20 až 30 let nebo i více. Aby stav nemoci mohl pokračovat po tak dlouhou dobu, musí existovat samoudržovací mechanismus, který má nějaký druh zpětné vazby.

Jako příklad samoudržovacího mechanismu v hierarchicky organizovaném systému nemoci si zvolíme hypertenzi, kde kromě kauzality zdola nahoru, která působí z molekulární úrovně na systemickou, podporuje celkový stav nemocného těla genovou expresi pro zachování systemického stavu hypertenze. Při hypertenzi, pokud krevní tlak stoupá díky jistým příčinám jako je životní styl nebo neurohumorální faktory, a když hypertenze pokračuje po několik měsíců, genetická aktivita endoteliálních buněk kapilár začne proces přestavby kapilár, začne je zpevňovat, aby vydržely vysoký krevní tlak [65]. Toto by mohl být samoudržovací mechanismus hypertenze. Tento jev také ukazuje, že interhierarchická dvousměrná aktivita způsobuje schopnost udržovat celkový stav nemoci. Toto je jistý druh „převzetí kontroly" vrozenou homeostatickou morfogenetickou funkcí, využitou pro udržování stavu nemoci.


Obr. 3.: Vícebodová topologie proteinové interakce sítě (PPI): PPI sestává ze tří vrstev: kmen (uzliny vysokého stupně), střední vrstva (vnitřní prstenec) a větve (uzliny nízké úrovně). Uzliny kmene a větví jsou znázorněny jako vnější prstenec a uzliny středního stupně jsou znázorněny jako vnitřní prstenec. Cílové proteiny léků jsou znázorněny žlutými skvrnami, které jsou koncentrovány ve vrstvách středních a nízkých uzlin (přetištěno z PLoS Počítačové biologie) [85].

4.2.3. Nemoc jako dynamický systém

Zatím jsme diskutovali o „organizačních aspektech" systému nemoci jako hierarchické organizaci a její schopnosti samostatně pokračovat. Ale stejně důležitý aspekt systému nemoci je, že se vyvíjí a sám sebe mění v průběhu času na bázi přirozené „dynamiky". To znamená, že nemoci jsou dynamické systémy. Jako příklad můžeme uvést infekční nemoci způsobené retrovirem jako například AIDS, kdy temporální průběh nemoci po jejím spuštění je považován za koevoluční proces mezi hostitelovým imunitním systémem a lidským imunodeficitním virem (HIV). HIV se vyvíjí uvnitř hostitele (pacienta) milionkrát rychleji než je tomu u evoluce normálních organismů a vyvíjí se pod selektivním tlakem neutralizace hostitelova imunitního systému a protivirových prostředků. Bylo vyvinuto mnoho metod k popsání virálního evolučního procesu uvnitř hostitele, jako například longitudinální filogenní strom [66,67], včetně naší metody založené na seskupování virových druhů HIV [68]. Tyto studie by mohly vést k charakterizaci intrinzické dynamiky společné retrovirálním infekčním chorobám.
 
Dynamika vývoje rakoviny by také mohla být modelována z pohledu Darwinické evoluce rakovinných buněk. Podle současné teorie o rakovinných kmenových buňkách vznikly mutace již ve stadiu kmenových buněk a rozmnožily se vývojovým procesem z kmenových buněk do buněk dospělých. Rakovinné kmenové buňky, které postupně získají mutace výhodné pro proliferaci, expandují své klony (klonální expanze). Bylo navrženo mnoho dynamických modelů, které popisují vývoj rakoviny na základě tohoto konceptu [69].
 
Není mnoho nemocí, jejichž dynamika je nám známa. Ale pokud bychom dosáhli lepšího porozumění dynamickým strukturám nemoci na systémové úrovni, mohli bychom specifikovat společné charakteristiky dynamiky pro určité třídy nemocí, což by mohlo být použito pro kvalitativní předpovědi průběhů nemocí.
Na závěr se podíváme na slibnou oblast, kde bude přístup dynamických systému efektivní, což je „epiteliálně-mezenchymální transformace" (EMT), která hraje důležitou roli při invazi nebo metastáze rakoviny [70]. Jak jsme se již zmínili, celulární molekulární síť pro regulaci genové exprese (transkripční regulační síť), je z velké většiny stejná pro všechny tkáně. Ale, v závislosti na typu buňky, exprese skupiny genů, jejichž funkce jsou nutné pro ten který typ buněk, jsou posílené; zatímco exprese jiných skupin genů, které nejsou nutné, jsou potlačeny za účelem dosažení správné funkce tohoto typu buněk. Tyto kombinace genů regulovaných buď směrem nahoru nebo dolů se liší podle typů buněk, ale tyto kombinace genové exprese jsou vcelku normální a stabilní pro ten který buněčný typ.
 
Jelikož máme 210 různých buněčných typů, a když budeme považovat transkripční regulační síť za dynamický systém, mohli bychom říci, že tato síť má 210 „stabilních řešení", navzájem si odpovídajících. Každý profil exprese korespondující s typem buňky tvoří jedno stabilní řešení transkripční regulační sítě.
 
EMT je buněčný proces, kde si buňky v epiteliu osvojují schopnost napadat bazální extracelulární matrix nebo sousední mezenchymální buňky. Během EMT si epiteliální buňky přisvojují mezenchymální vzhled včetně zvýšené hybnosti a útočnosti. Toto je normální vývojový proces a je používán při formaci třírozměrných struktur v embryu. Avšak u rakoviny se jedná o klíčový krok k invazi a metastáze. EMT je charakterizován kombinací ztráty pojivových proteinů epiteliálních buněk, jako například E-cadherin a integrin, a zvýšením počtu mezenchymálních markerů jako je například vimentin a fibronectin, které souvisejí s hybností buněk.
 
Z našeho pohledu systémové patologie může být EMT považován za „fázový posun" (koherentní strukturální změnu) transkripční regulační sítě, což je přechod mezi různými stabilními síťovými řešeními korespondující s epiteliálním a mezenchymálním druhem buněk. Společně s touto fázovou tranzicí transkripční regulační sítě nastává změna v genetické aktivitě několika reprezentativních genů, jako jsou například E-cadherin (který těsně spojuje sousední buňky), integrin (který zajišťuje spojení k bazální membráně) nebo vimentin (vztahuje se k buněčným filamentům) a fibronectin (složka extracelulární matrix). EMT umožňuje rakovinným buňkám epiteliálního původu invazi mezenchymálních tkání pod bazální membránou, jako jsou například spojovací tkáně, svalové tkáně a krevní cévy tak, že předstírá vzhled mezenchymální buňky. Na základě konceptu, že EMT je „fázová tranzice" molekulární sítě, můžeme získat představu, do jaké míry je aberace drah nutná a kritická, aby vyvolala tranziční fázi EMT pro invaze a metastáze.

Když vezmeme úvahu výše zmíněné systémové prvky, můžeme pochopit nemoc v jejím celém spektru. Nemoc narušuje biosystémy a normální dráhy jsou modifikovány tak, že vytvoří „udržitelné dráhy pro nemoc".

4.3. Informatika systémové patologie plně využívá omics nemoci

Systémová patologie, konkrétně porozumění nemocem na úrovni systému, je efektivní rámec pro získání komplexních omicsových dat. Na základě realizace systémové charakteristiky nemoci se nyní vyvíjejí různé důležité klinické aplikace, například systémová analýza, modelování a simulace nemoci.
 
S aplikací systémové patologie je nejčastěji studováno odhadování molekulární dráhy. Nejdříve byly vyvinuty metody pro identifikaci normálních celulárních funkcí, abychom mohli odhadnout molekulární dráhy z profilu genové exprese. Jedna z prvních klíčových studií prosazující tento přístup se snažila objevit genové regulační sítě v Saccharomyces cerevisiae z profilu genové exprese použitím Bayesiánské identifikační metody sítí [72]. Od té doby bylo vynalezeno mnoho druhů různých metod, z nichž se dnes používají hlavně následující dvě.
 
První je koexpresní model, což je neřízený pravděpodobnostní model, založený na korelačním koeficientu, parciálním korelačním koeficientu (Gaussův grafický model) [73] nebo vzájemné informaci (Relevantní síť) [74], ARANCNE [75], mezi libovolnými páry genů. Druhý model je Bayesianský síťový model [76], což je řízený grafický model pro reprezentaci pravděpodobnosti kauzality mezi aktivitami genů. Ačkoliv některé tyto čistě datové přístupy dosáhly úspěchu při objevení drah nemocí [77], předpokládá se [78], že čistě datové přístupy k mikroarray datům mají mnoho omezení; potřebují velký vzorek a zachytí pouze části biologicky relevantních sítí.
 
Kombinace transkriptomických dat a biologických znalostí průběhu se považuje za vhodnější pro odhad průběhu nemoci. Například profil genové exprese nemocných buněk, které jsou superponovány na meziproteinovou interakční síť za účelem identifikace podsítě způsobující nemoc, se nazývá CGI (kombinace exprese genů a dat proteinové interakce). Chuang a kol. aplikovali tento přístup na profily genové exprese metastatických a nemetastatických pacientů s rakovinou prsu za účelem identifikace podsítí, jejichž úroveň exprese koreluje s prognózou metastázy [79].
 
Také jsme superponovali profil genové exprese na BIND (Biomolekulární interakční síť, http://bond.unleashedinformatics.com/index.jsp), kde je meziproteinová interakce kombinovaná s interakcí genu (DNA) - proteinu (transkripční faktor) za účelem identifikace kauzativního procesu pro opětovný výskyt hepatocelulárního karcinomu po operaci [80].
 
Další slibný přístup je eQTL [81], který považuje profil genové exprese za jeden z kvantitativních příznaků (fenotypů) a aplikuje statistickou genetiku pro výzkum aberací genetického lokusu. Přístup eQTL může skloubit profil genové exprese s omezeným počtem kauzativních genů. Kromě reverzního inženýrství, CGI a eQTL, bylo oznámeno mnoho metod pro systémovou patologii nemocí. Tyto v podstatě podobné koncepty jako „biologie rakovinných systémů" [82] nebo „systémová genetika nemocí" [83] předpokládají, že pouze integrovaný přístup k nemocem jako je systémová patologie může plně využít omicsů nemocí.
 
Topologický síťový přístup je slibnou oblastí systémové patologie. Jeong [84] zjistil, že stupeň (počet spojení uzliny) v síti meziproteinových interakcí se řídí „neomezenou" (zákon síly) distribucí, což znamená strukturu kmen-větve. Mnoho topologických síťových studií bylo vykonáno například na síti nemocí nebo genové síti nemoci [42]. My jsme použili metodu pohyblivé stratifikace pro získání podsítí ve specifickém rozsahu za účelem nalezení hustě spojené střední vrstvy („páteř") meziproteinové interakční sítě (PPI), kromě dobře známé struktury kmen - větve [85]. Na této třívrstvové struktuře PPI jsme zmapovali cílové proteiny léků schválených FDA. Bylo zjištěno, že tyto proteiny se nalézají především ve střední vrstvě sítě PPI (Obr. 3). Tento výsledek znamená, že kmenové uzliny (proteiny vysokého stupně) jsou nevhodné jako cíl léků, protože mají široké možnosti vedlejších účinků.
 
Avšak střední vrstva proteinů je vhodná jako cíl léků s méně vážnými vedlejšími účinky a vyšší účinností jako páteřní proteiny. Topologická analýza nevyžaduje numerické informace celulární sítě jako reakční koeficient, takže je vhodnější udělat si závěry o celulární síti, u které je těžké získat kvantitativní informace.

Co je v této oblasti stejně důležité a ještě nebylo zkoumáno, je kvantitativní analýza kvalitativních systémů a simulace [86] průběhu nemoci. Některé kvalitativní metody byly kdysi zkoumány v rámci běžného výzkumu. Jak jsme se zmínili výše, kvantitativní informace se těžce získávají v celulární síti, zatímco máme spoustu kvalitativních strukturálních znalostí o signální dráze a regulační síti. Nová metodologie by měla strukturálně a kvalitativně analyzovat a předpovídat chování průběhu nemoci.

Tab. 2.: Prvky třígenerační omicsové medicíny


5. Diskuze a závěr

V tomto článku jsme popsali důležité prvky a vývoj omicsové medicíny a informatiky, která se k ní vztahuje. Při popisu vývoje omicsové medicíny jsme použili „třígenerační model". V první generaci jsme začali genomickou medicínou a potom jsme pokračovali k „(postgenomické) omicsové medicíně", jakožto k druhé generaci, a nakonec jsme se dostali k medicíně založené na omicsových systémech, jakožto třetí generaci, která je stále v počátcích a čeká na budoucí vývoj.

Třígenerační model se zdá být vhodným konceptem pro popis vlastního vývoje omicsové medicíny. Na základě tohoto modelu je typická informační metoda použitá v každé generaci jasně stanovena; klasická statistika (statistická genetika) první generace byla nahrazena datovým přístupem jako je strojové učení, vytěžování dat nebo exploratorní statistika, která byla později nahrazena modelovým (hypotézovým) přístupem.

Další výhodou třígeneračního modelu je, že poskytuje jednotnou platformu, která může zahrnovat všechny tři koncepty molekulární medicíny: 1) „genomická medicína" snažící se o uskutečnění personalizované medicíny na základě vrozené diference v genomu, 2) (postgenomická) omicsová medicína snažící se o realizaci prediktivní medicíny na základě profilů genové exprese a hmotnostního spektra proteinu, které se liší podle stádia nemoci, 3) systémová medicína usilující o celkové porozumění nemoci na základě znalosti celulárních drah a jejich změn při nemocech (Tab.2).
 
I když jsme spíše přecenili význam nově zavedených prvků u každé generace, měli bychom poznamenat, že u vlastní lékařské činnosti obsahuje další generace prvky generace předešlé. Například druhá generace omicsové medicíny zahrnuje personalizovanou péči genomické medicíny. Takže lékařské systémy třetí generace představují nejúplnější medicínu včetně personalizované a prediktivní péče.
 
Nemoc je obecně chápána jako komplexní systém v tom smyslu, že to je hierarchicky organizovaný, soběstačný, dynamický systém, který se vyvíjí podle svých vlastních zákonů. Uvedli jsme různé inherentní prvky nemoci jakožto dynamického komplexního systému, jako jsou například soběstačnost, hypertenze, dvousměrná kauzalita, evoluční dynamika HIV, expanze rakovinných klonů, rakovinná metastáza (EMT) jakožto fázová tranzice systémů, možnost kvalitativního kauzálního zdůvodnění dynamiky nemoci a topologická lokace cílů léků v proteinové interakční síti.
 
Mohli bychom očekávat, že se ve světle systémového přístupu objeví docela rozdílný pohled na nemoc. Avšak systémový přístup k nemoci je teoreticky v počátcích a v budoucnosti je potřeba udělat mnoho práce.
 
Naopak v praktických aplikacích systémového konceptu nemoci bylo předloženo mnoho metod informatiky, včetně použití reverzního inženýrství k odhadu celulární sítě nemoci z omicsových dat.

Na závěr uvádíme, že pochopení nemoci na základě procesů, což nazýváme systémovou patologií, je nejslibnější rámec pro plné využití informačního obsahu omicsů nemoci a komprehensivní poznání procesu nemoci. Spolu s předešlými generacemi omicsových věd můžeme očekávat, že omicsové systémy podstatně změní současnou lékařskou péči a učiní ji více personalizovanou a prediktivní.

Poděkování

Tato práce vznikla za podpory Speciálního koordinačního fondu pro podpory vědy a technologie (Programy „Podpora talentu v nových oborech" a „Program pro vývoj a výzkum kritických problémů") Ministerstva vzdělání, kultury, sportu, vědy a technologie Japonska. Autor by rád poděkoval Dr. Kaoru Mogushi za pomoc při přípravě tohoto článku a také oponentům za jejich konstruktivní komentáře, které vylepšily tento článek.

Článek přeložila společnost Bio-Consult laboratories, spol. s.r.o., Centrum biomedicínské informatiky, s podporou projektu 1M06014 MŠMT ČR. 

Literatura

[1] Weinstein J.N.: Fishing expeditions. Science 1998; 282: 628-629. 
[2]
Weinstein J.N.: ‘Omic' and hypothesis-driven researchin the molecular pharmacology of cancer.Curr Opin Pharmacol 2002; 2: 361-365.
[3]
Knaup P., Ammenwerth E., Brandner R., Brigl B.,Fischer G., Garde S., Lang E., Pilgram R., Ruderich F., Singer R., Wolff A.C., Haux R., Kulikowski C.: Towardsclinical bioinformatics: advancing genomic medicinewith informatics methods and tools. Methods Inf Med 2004; 43: 302-307.
[4]
Gaughan A.: Bridging the divide: the need for translationalinformatics. Pharmacogenomics 2006; 7:117-122.
[5]
Guttmacher A.E., Collins F.S.: Genomic medicine - aprimer. N Engl J Med 2002; 347: 1512-1520.
[6]
Kumar D.: Genomic medicine: a new frontier ofmedicine in the twenty first century. Genomic Med2007; 1: 3-7.
[7]
Schena M., Shalon D., Davis R.W., Brown P.O.: Quantitativemonitoring of gene expression patterns witha complementary DNA microarray. Science 1995; 70: 467-470.
[8]
Fodor S.P., Rava R.P., Huang X.C., Pease A.C., Holmes C.P., Adams C.L.: Multiplexed biochemical assays withbiological chips. Nature 1993; 364: 555-556.
[9]
Ren B., Robert F., Wyrick J.J., Aparicio O., Jennings E.G., Simon I., Zeitlinger J., Schreiber J., Hannett N., Kanin E., Volkert T.L., Wilson C.J., Bell S.P., Young R.A.: Genome-wide location and function of DNA bindingproteins. Science 2000; 290: 2306-2309.
[10]   
Shoemaker D.D., Schadt E.E., Armour C.D., He Y.D.,Garrett-Engele P., McDonagh P.D., Loerch P.M., Leonardson A., Lum P.Y., Cavet G., Wu L.F., Altschuler S.J., Edwards S., King J., Tsang J.S., Schimmack G., Schelter J.M., Koch J., Ziman M., Marton M.J., Li B., Cundiff P., Ward T., Castle J., Krolewski M., Meyer M.R., Mao M., Burchard J., Kidd M.J., Dai H., Phillips J. W., Linsley P.S., Stoughton R., Scherer S., Boguski M.S.: Experimental annotation of the human genomeusing microarray technology. Nature 2001; 409: 922-927. 
[11]
 Xing Y., Kapur K., Wong W.H.: Probe selection and expression index computation of Affymetrix ExonArrays. PLoS ONE 2006; 1: e88.
[12]
Tanaka K., Waki H., Ido Y., Akita S., Yoshida Y., Yoshida T.: Protein and polymer analyses up to m/z100000 by laser ionization time-of-flight mass spectrometry.Rapid Commun Mass Spectrom 1988; 2: 151-153. 
[13]
Hutchens T.W., Yip T.T.: New desorption strategies for the mass spectrometric analysis of macromolecules.Rapid Commun Mass Spectrom 1993; 7: 576-580. 
[14]
Golub T.R., Slonim D.K., Tamayo P., Huard C., Gaasenbeek M., Mesirov J.P., Coller H., Loh M.L., Downing J.R.,Caligiuri M.A., Bloomfield C.D., Lander E.S.: Molecularclassification of cancer: class discovery and class prediction by gene expression monitoring. Science1999; 286: 531-537.
[15]
Alizadeh A.A., Eisen M.B., Davis R.E., Ma C., Lossos I.S., Rosenwald A., Boldrick J.C., Sabet H., Tran T., Yu X., Powell J.I., Yang L., Marti G.E., Moore T., Hudson J., LuL, Lewis D.B., Tibshirani R., Sherlock G., Chan W.C., Greiner T.C., Weisenburger D.D., Armitage J.O., Warnke R., Levy R., Wilson W., Grever M.R., Byrd J.C., Botstein D., Brown P.O., Staudt L.M.: Distinct types ofdiffuse large B-cell lymphoma identified by geneexpression profiling. Nature 2000; 403: 503-511. 
[16]
Rosenwald A., Wright G., Chan W.C., Connors J.M., Campo E., Fisher R.I., Gascoyne R.D., Muller-Hermelink H.K., Smeland E.B., Giltnane J.M., Hurt E.M., Zhao H., Averett L., Yang L., Wilson W.H., Jaffe E.S., Simon R., Klausner R.D., Powell J., Duffey P.L., Longo D.L., Greiner T.C., Weisenburger D. D., Sanger W.G., Dave B.J., Lynch J.C., Vose J., Armitage J.O., Montserrat E., López-Guillermo A., Grogan T.M., Miller T.P., LeBlanc M. , Ott G., Kvaloy S., Delabie J., Holte H., Krajci P., Stokke T., Staudt L.M.: The use of molecular profiling to predict survival after chemotherapy fordiffuse large-B-cell lymphoma. N Engl J Med 2002; 346: 1937-1947. 
[17]
Tanaka H.: Bioinformatics and genomics for openingnew perspective for personalized care. StudHealth Technol Inform 2008; 134: 47-58.
[18]
Petricoin E.F., Ardekani A.M., Hitt B.A., Levine P.J., Fusaro V.A., Steinberg S.M., Mills G.B., Simone C., Fishman D.A., Kohn E.C., Liotta L.A.: Use of proteomicpatterns in serum to identify ovarian cancer. Lancet 2002; 359: 572-577. 
[19]
Meani F., Pecorelli S., Liotta L., Petricoin E.F.: Clinical application of proteomics in ovarian cancer preventionand treatment. Mol Diagn Ther 2009; 13:297-311.
[20]
Grubb R.L., Deng J., Pinto P.A., Mohler J.L., Chinnaiyan A., Rubin M., Linehan W.M., Liotta L.A., Petricoin E.F., Wulfkuhle J.D.: Pathway biomarker profiling of localizedand metastatic human prostate cancer reveal metastatic and prognostic signatures. J ProteomeRes 2009; 8: 3044-3054. 
[21]
Tanaka H.: System-theoretic approach to life, genome and disease. Proc of 3rd annual conference ofChemo-Bioinformatics 2002. p 3. 
[22]
Tanaka H., Nakaya J.: Research and education forbiomedical informatics at Tokyo Medical andDental University. Yearb Med Inform 2007. pp
157-162.
[23]
Kitano H.: Systems biology: a brief overview. Science 2002; 295: 1662-1664.
[24]
Kitano H.: Computational systems biology. Nature2002; 420: 206-210.
[25]
Hood L., Heath J.R., Phelps M.E., Lin B.: Systems biology and new technologies enable predictive andpreventative medicine. Science 2004; 306: 640-643. 
[26]
Auffray C., Chen Z., Hood L.: Systems medicine: the future of medical genomics and healthcare. GenomeMed 2009; 1: 2. 
[27]
International human genome sequencing consortium.Finishing the euchromatic sequence of thehuman genome. Nature 2004; 431: 931-945.
[28]
Strachan T., Andrew P.R.: Human molecular genetics (3rd edition). New York: Garland Publishing;2003. 
[29]
Gusella J.F., Wexler N.S., Conneally P.M., Naylor S.L., Anderson M.A., Tanzi R.E., Watkins P.C., Ottina K.,Wallace M.R., Sakaguchi A.Y.: A polymorphic DNAmarker genetically linked to Huntington's disease.Nature 1983 306: 234-238.
[30]
Balding D.J., Bishop M., Cannings C.: Handbook of Statistical Genetics (3rd edition). Hoboken: Wiley;2007. 
[31]
Huntington's Disease Collaborative ResearchGroup. A novel gene containing a trinucleotiderepeat that is expanded and unstable on Hun -
tington's disease chromosomes. Cell 1993; 72:971-983.
[32]
Hoffman E.P., Brown R.H., Kunkel L.M.: Dystrophin: the protein product of the Duchenne muscular dystrophylocus. Cell 1987; 51: 919-928. 
[33]
Rommens J.M., Iannuzzi M.C., Kerem B., Drumm M.L., Melmer G., Dean M., Rozmahel R., Cole J.L., Kennedy D., Hidaka N.: Identification of the cystic fibrosis gene: chromosome walking and jumping. Science1989; 245: 1059-1065.
[34]
Schaid D.J., Sommer S.S.: Genotype relative risks:methods for design and analysis of candidate-geneassociation studies. Am J Hum Genet 1993; 53: 114-1126.
[35]
Reich D.E., Cargill M., Bolk S., Ireland J., Sabeti P.C., Richter D.J., Lavery T., Kouyoumjian R., Farhadian S.F., Ward R., Lander E.S.: Linkage disequilibrium in thehuman genome. Nature 2001; 411: 199-204.
[36]
Hardy J., Singleton A.: Genomewide association studies and human disease. N Engl J Med 2009; 360:1759-1768. 
[37]
Frayling T.M.: Genome-wide association studies provide new insights into type 2 diabetes aetiology.Nat Rev Genet 2007; 8: 657-662. 
[38]
 Diabetes Genetics Initiative. Genome-wide association analysis identifies loci for type 2 diabetes andtriglyceride levels. Science 2007; 316: 1331-1336.
[39]
The Wellcome Trust case control consortium. Genome-wide association study of 14,000 cases ofseven common diseases and 3,000 shared controls.Nature 2007; 447: 661-678.
[40]
Teo Y.Y., Small K.S., Clark T.G., Kwiatkowski D.P.: Perturbation analysis: a simple method for filteringSNPs with erroneous genotyping in genome-wideassociation studies. Ann Hum Genet 2008; 72:368-374. 
[41]
International Hapmap consortium. The International HapMap Project. Nature 2003; 426:789-796. 
[42]
Goh K.I., Cusick M.E., Valle D., Childs B., Vidal M., Barabási A.L.: The human disease network. Proc NatlAcad Sci U.S.A. 2007; 104: 8685-8690. 
[43]
Evans W.E., Relling M.V.: Moving towards individualized medicine with pharmacogenomics. Nature2004; 429: 464-468. 
[44]
Lazarou J., Pomeranz B.H., Corey P.N.: Incidence of adverse drug reactions in hospitalized patients: ameta-analysis of prospective studies. JAMA 1998;279: 1200-1205. Methods Inf Med 2/2010 © Schattauer 
[45]
FDA. Guidance for Industry Pharmacogenomic Data Submissions, 2003. http://www.fda.gov/cder/guidance/5900dft.pdf 
[46]
Blackledge G., Averbuch S. Gefitinib (‘Iressa', ZD1839) and new epidermal growth factor receptorinhibitors. Br J Cancer 2004; 90: 566-572. 
[47]
Lynch T.J., Bell D.W., Sordella R., Gurubhagavatula S., Okimoto R.A., Brannigan B.W., Harris P.L., Haserlat S.M., Supko J.G., Haluska F.G., Louis D.N., Christiani D.C., Settleman J., Haber D.A.: Activating mutations in the epidermal growth factor receptor underlyingresponsiveness of non-small-cell lung cancer togefitinib. N Engl J Med 2004; 350: 2129-2139.
[48]
Asahina H., Yamazaki K., Kinoshita I., Sukoh N., Harada M., Yokouchi H., Ishida T., Ogura S., Kojima T., Okamoto Y.,  Fujita Y., Dosaka-Akita H., Isobe H., Nishimura M.: A phase II trial of gefitinib as firstline therapy for advanced non-small cell lungcancer with epidermal growth factor receptor mutations.Br J Cancer 2006; 95: 998-1004.
[49]
Baselga J.: Clinical trials of Herceptin (trastuzumab). Eur J Cancer 2001; 37 (Suppl 1): S18-24. 
[50]
Slamon D.J., Leyland-Jones B., Shak S., Fuchs H., Paton V., Bajamonde A., Fleming T., Eiermann W., Wolter J., Pegram M., Baselga J., Norton L.: Use of chemotherapyplus a monoclonal antibody against HER2 for etastatic breast cancer that overexpresses HER2.N Engl J Med 2001; 344: 783-792.
[51]
Schwarz U.I., Ritchie M.D., Bradford Y., Li C., Dudek S.M., Frye-Anderson A., Kim R.B., Roden D.M., Stein C.M.: Genetic determinants of response to warfarinduring initial anticoagulation. N Engl J Med 2008; 58: 999-1008. 
[52]
Aneesh T.P., Sonal S.M., Jose A., Chandrana L., Zachariaha S.M.: Pharmacogenomics: The Right Drug tothe Right Person. J Clin Med Res 2009; 1: 191-194. 
[53]
van't Veer L.J., Dai H., van de Vijver M.J., He Y.D., Hart A.A., Mao M., Peterse H.L., van der Kooy K., Marton M.J., Witteveen A.T., Schreiber G.J., Kerkhoven R.M., Roberts C., Linsley P.S., Bernards R., Friend S.H.: Gene expression profiling predicts clinical outcome ofbreast cancer. Nature 2002; 415: 530-536. 
[54]
Sřrlie T., Tibshirani R., Parker J., Hastie T., Marron J.S., Nobel A., Deng S., Johnsen H., Pesich R., Geisler S., Demeter J., Perou C.M., Lřnning P.E., Brown P.O.: ,Břrresen-Dale AL, Botstein D. Repeated observation of breast tumor subtypes in independent geneexpression data sets. Proc Natl Acad Sci U.S.A. 2003;100: 8418-8423.
[55]
Slodkowska E.A., Ross J.S.: MammaPrint 70-gene signature: another milestone in personalized medicalcare for breast cancer patients. Expert Rev MolDiagn 2009; 9: 417-422.
[56]
Asad J., Jacobson A.F., Estabrook A., Smith S.R., Boolbol S.K., Feldman S.M., Osborne M.P., Boachie-Adjei K., Twardzik W., Tartter P.I.: Does oncotype DX recurrencescore affect the management of patients with early-stage breast cancer? Am J Surg 2008; 196:527-529. 
[57]
Cheng J.C., Wooten E.C., Tsimelzon A., Hilsenbeck S.G., Gutierrez M.C., Elledge R., Mohsin S., Osborne C.K., Chamness G.C., Allred D.C., O'Connell P.: Gene expressionprofiling for the prediction of therapeutic response to docetaxel in patients with breast cancer.Lancet 2003; 362: 362-369. 
[58]
Ayers M., Symmans W.F., Stec J., Damokosh A.I., Clark E., Hess K., Lecocke M., Metivier J., Booser D., Ibrahim N., Valero V., Royce M., Arun B., Whitman G., Ross J., Sneige N., Hortobagyi G.N., Pusztai L.: Gene expression profiles predict complete pathologic responseto neoadjuvant paclitaxel and fluorouracil,doxorubicin, and cyclophosphamide chemotherapy in breast cancer. J Clin Oncol 2004; 22:2284-2293. 
[59]
Mogushi K., Nomura F., Tomonaga T., Sunaga M., Sogawa K., Tanaka H.: Evaluation of feature selectionand disease classification method for protein expressionprofile analysis using SELDI-TOF-MS. Proc. 2nd Annual Meeting of Japan Society forClinical Proteomics 2006. p 20. 
[60]
Shendure J., Ji H.: Next-generation DNA sequencing. Nat Biotechnol 2008; 26: 1135-1145. 
[61]
Trapnell C., Salzberg S.L.: How to map billions of short reads onto genomes. Nat Biotechnol 2009; 27:455-457. 
[62]
Kleemann R., Verschuren L., van Erk M.J., Nikolsky Y., Cnubben N.H., Verheij E.R., Smilde A.K., Hendriks H.F., Zadelaar S., Smith G.J., Kaznacheev V., Nikolskaya T., Melnikov A.,  Hurt-Camejo E., van der Greef J., van Ommen B., Kooistra T.:  Atherosclerosis and liverinflammation induced by increased dietary cholesterolintake: a combined transcriptomics and metabolomics analysis. Genome Biol. 2007; 8:R200.
[63]
Zhao J.J., Roberts T.M., Hahn W.C.: Functional genetics and experimental models of human cancer.Trends Mol Med 2004; 10: 344-350. 
[64]
Hirano T.: Cytokines in autoimmune disease and chronic inflammatory proliferative disease. CytokineGrowth Factor Rev 2002; 13: 297-298. 
[65]
Schiffrin E.L.: Remodeling of resistance arteries inessential hypertension and effects of antihypertensivetreatment. Am J Hypertens 2004; 17: 1192-200.
[66]
Drummond A., Rodrigo A.G.: Reconstructing genealogies of serial samples under the assumption of amolecular clock using serial-sample UPGMA. MolBiol Evol 2000; 17: 1807-1815.
[67]
Ren F., Ogishima S., Tanaka H.: Longitudinal phylogenetic tree of within-host viral evolution fromnoncontemporaneous samples: a distance-basedsequential-linking method. Gene 2003; 317: 89-95.
[68]
Hasegawa N., Sugiura W., Shibata J., Matsuda M., Ren F., Tanaka H.: Inferring within-patient HIV-1 evolutionarydynamics under anti-HIV therapy usingserial virus samples with vSPA. BMC Bioinformatics 2009; 10: 360. 
[69]
Michor F., Iwasa Y., Nowak M.A.: Dynamics of cancer progression. Nat Rev Cancer 2004; 4: 197-205. 
[70]
Lee J.M., Dedhar S., Kalluri R., Thompson E.W.: The epithelial-mesenchymal transition: new insights insignaling, development, and disease. J Cell Biol2006; 172: 973-981.
[71]
Liang S., Fuhrman S., Somogyi R.: Reveal, a general reverse engineering algorithm for inference ofgenetic network architectures. Pac Symp Biocomput1998; 18-29.
[72]
Friedman N., Linial M., Nachman I., Pe'er D.: Using Bayesian networks to analyze expression data. JComput Biol 2000; 7: 601-620. 
[73]
Edwards D.: Introduction to Graphical Modelling. Heidelberg: Springer; 2000. 
[74]
Butte A.J., Kohane I.S.: Mutual information relevance networks: functional genomic clustering usingpairwise entropy measurements. Pac Symp Biocomput2000. pp 418-429.
[75]
Margolin A.A., Nemenman I., Basso K., Wiggins C., Stolovitzky G., Dalla Favera R., Califano A.: ARACNE: an algorithm for the reconstruction ofgene regulatory networks in a mammalian cellular context. BMC Bioinformatics 2006; 7 (Suppl1): S7. 
[76]
Friedman N., Koller D.: Being Bayesian about network structure. Math Learn 2003; 50: 95-126. 
[77]
Basso K., Margolin A.A., Stolovitzky G., Klein U., Dalla-Favera R., Califano A.: Reverse engineering ofregulatory networks in human B cells. Nat Genet2005; 37: 382-390.
[78]
Markowetz F., Spang R.: Inferring cellular networks - a review. BMC Bioinformatics 2007; 8 (Suppl 6): S5. 
[79]
Chuang H.Y., Lee E., Liu Y.T., Lee D., Ideker T.: Network-based classification of breast cancer metastasis.Mol Syst Biol 2007; 3: 140. 
[80]
Tanaka S., Mogushi K., Yasen M., Noguchi N., Kudo A., Kurokawa T., Nakamura N., Inazawa J., Tanaka H., Arii S.: Surgical contribution to recurrence-freesurvival in patients with macrovascular-invasionnegative hepatocellular carcinoma. J Am Coll Surg2009; 208: 368-374. 
[81]
Göring H.H., Curran J.E., Johnson M.P., Dyer T.D., Charlesworth J., Cole S.A., Jowett J.B., Abraham L.J., Rainwater D.L., Comuzzie A.G., Mahaney M.C., Almasy L., MacCluer J.W., Kissebah A.H., Collier G.R., Moses E.K., Blangero J.: Discovery of expressionQTLs using large-scale transcriptional profiling inhuman lymphocytes. Nat Genet 2007; 39:208-1216. 
[82]
Wang E., Lenferink A., O'Connor-McCourt M.: Cancer systems biology: exploring cancer-associatedgenes on cellular networks. Cell Mol Life Sci2007; 64: 1752-1762.
[83]
Sieberts S.K., Schadt E.E.: Moving toward a system genetics view of disease. Mamm Genome 2007; 18:389-401. 
[84]
Jeong H., Tombor B., Albert R., Oltvai Z.N., Barabási A.L.: The large-scale organization of metabolic networks.Nature 2000; 407: 651-654.
[85]
Hase T., Tanaka H., Suzuki Y., Nakagawa S., Kitano H.: Structure of protein interaction networks and theirimplications on drug design. PLoS Comput Biol 2009; 5: e1000550.
[86]
Kuipers B.: Qualitative Reasoning: Modeling andSimulation with Incomplete Knowledge (Artificial Intelligence).Cambridge: The MIT Press; 1994. p 13.