Miért létezik ez a benchmark, és mit tesztel
A mesterséges intelligencia által támogatott vérkép értelmezése egyre inkább elterjedt a fogyasztói és klinikai munkafolyamatokban, ugyanakkor a laboratóriumi orvoslásra szabott, reprodukálható értékelési keretrendszerek továbbra is ritkák. Ebben a környezetben a legfontosabb kérdések nem azok, amelyeket az általános orvosi kérdés-válasz benchmarkok lefednek: képes-e egy motor elkülöníteni a vashiányt a thalassaemia-tréjtől, ha a vörösvértestek átlagos térfogata (MCV) azonos, túldiagnosztizálja-e a Gilbert-kórt hepatitiszként, és képes-e kóros eltérést „gyártani” egy teljesen normális szűrőpanelben?
Egyetlen vérvizsgálati panel általában elég jelet tartalmaz ahhoz, hogy több, egymással versengő értelmezést is alátámasszon, és az értelmező klinikus feladata nem az, hogy tankönyvi választ „előhúzzon”, hanem hogy ezeket az értelmezéseket egymáshoz mérlegelje. Az a motor, amely jól teljesít a tankönyvi esetekben, még elbukhat azokon az eseteken, amelyek a legfontosabbak: a differenciáldiagnosztikai buktatókon, az ártalmatlan variánsokon, amelyek önmagukban riasztónak tűnnek, és a teljesen normális paneleken, amelyek arra csábítják a magabiztos asszisztenseket, hogy kóros eltérést „gyártsanak”.
Ezt a benchmarkot pontosan ezekre a hibamódokra építették. A tizenöt esetet mindegyikhez egy-egy konkrét diagnosztikai tulajdonság alapján választották ki: egy vashiányos mikrocitózist, amelyet el kell különíteni a azonos átlagos vörösvértest-térfogattal (MCV) járó béta-thalasszémia-hordozó állapottól; egy Gilbert-kór megjelenést, ahol az egyetlen eltérés a szisztolált (indirekt) hiperbilirubinémia; valamint egy tizenöt paraméteres szűrőpanelt, amelyben minden analit a saját referencia-tartományán belül van. A rubrika jutalmazza azokat a motorokat, amelyek az egyes eseteket a maguk feltételei szerint olvassák el, és bünteti azokat, amelyek olyan magabiztos diagnózist próbálnak megállapítani, amelyre nincs is indok.
Thomas Klein, MD-ként azért választottam ezt az esetsort, mert ezek azok a mintázatok, amelyeket a laboratóriumi medicina asszisztensei a leggyakrabban rosszul kezelnek. A költséges hibamód nem az, hogy "kihagynak egy ritka betegséget" — hanem az, hogy rutinszerű kóros leleteket gyártanak olyan páciensek számára, akiknél az nincs is jelen. A miénk Orvosi validáció a hub a tágabb keretrendszert írja le; ez az oldal a V11 első koncepció-bizonyítékát, valamint a V11 Második Frissítést ismerteti, amely 100 000 anonimizált esetre skálázta — egy SQL-alapú klinikai adattárból, amely 127 országot lefed — ugyanazzal a pontozási rubrikával, bájtazonosan, és utólagos hangolás nem engedélyezett.
Legújabb referenciafuttatás — V11 Második Frissítés (2026. április 26.)
A 2026. április 26-i V11 Második Frissítés referenciafuttatása egy összetett pontszámot eredményezett: 99.80% ugyanazon az előzetesen regisztrált rubrikán, amelyet a V11 első kiadása használt, kiértékelve: 100 000 anonimizált eset az Kantesti SQL-alapú klinikai adattárból, és lefedve: 127 országban és 75+ nyelvek. Minden eset a motor elsődleges útvonalán befejeződött; a trap-eset hiperdiagnózis jelző aktiválások szinten maradtak: 0 / 87,412. A V11 eredeti futása 2026. április 23-án 15 kézzel válogatott esetet fedett le (összetett 99.12%), és validálta a rubrikát; a Második Frissítés ezt a rubrikát bájtazonosan megőrzi, és a kiértékelést populációszintű kohorszra terjeszti ki.
Az összesített képlet három összetevőt kombinál: strukturális megfelelés a hét kötelező jelentési szekcióval és tizenhat kötelező alcímmel, klinikai pontosság mérve kulcsszó-visszahívással + pontozási rendszer visszahívással + valószínűségi eloszlás érvényességi ellenőrzéssel, és válasz késleltetése az elsődleges útvonal szolgáltatási szintjének célértéke ellen. A pontos bontást az alábbi rubrikaformula mutatja — ezeknek a súlyoknak vagy rész-rubrikáknak egyetlen elemét sem módosították a Második Frissítésben.
A fennmaradó 0.20 százalékpontnyi mozgástér szinte teljes egészében a klinikai részpontszámra bomlik — kevés esetnél (elsősorban Hepatológiában és Reumatológiában) egy várt pontozási-rendszer kulcsszó hiányzott a motor értelmezéséből, annak ellenére, hogy a diagnosztikus tartalom helyes volt. A 100 000 esetből álló Második Frissítés kohorszban egyetlen eset sem hagyta ki magát a diagnózist. A késleltetés a V11 első kiadásában mért átlag 20.17 s-ról a Második Frissítésben 13.26 s-ra javult, tükrözve a két futás közötti gyártási motoroptimalizálásokat; a rubrika, a pontozási kód és az API-végpont változatlan.
Országonként az összetett pontszámok 0.9971-től (India) 0.9985-ig (Svájc) terjedtek a 30 legnagyobb arányban képviselt országban. A további 97 ország hosszú farka (összesen ≈7 300 eset) nem mutatott szisztematikus romlást. Az esetek száma alapján a legnagyobb hozzájárulók az Egyesült Államok (10 500), Brazília (9 500), Spanyolország (9 000), Olaszország (8 000), Németország (7 800), Franciaország (7 400), Portugália (5 800), Türkiye (3 400), az Egyesült Királyság (2 900) és Mexikó (2 500) voltak.
15 esettől 100 000-ig: a kohorsz alakulása 127 országban
Az eredeti V11 esetpanel hét szakterületet fedett le — hematológia, endokrinológia, anyagcsere-orvostan, hepatológia, nefrológia, kardiológia, reumatológia — plusz két dedikált hiperdiagnózis trap esetet, ahol minden eset egy anonimizált, valós betegrekord volt, az Kantesti klinikai adattárból, írásos tájékozott beleegyezéssel. A V11 Második Frissítés a kiértékelést kiterjeszti: 100 000 anonimizált esetre 127 országban, nyolc szakterületre elosztva (az eredeti hét plusz egy dedikált belgyógyászati „bucket”, amely a trap részhalmazt elnyeli). Ugyanaz a pontozási rubrika kerül alkalmazásra bájtazonosan mindkét futás során.
Az anonimizálás a Safe Harbor megközelítéssel történt: az összes közvetlen azonosítót eltávolították vagy lecserélték, és minden rekordhoz egy benchmarkon belüli esetszámkódot rendeltek a BT-NNN-LABEL formátumban (V11 első) vagy egy stabil anonimizált case_uid a Második Frissítéshez. A feldolgozás a következők szerint történt: GDPR 9. cikk (2) bekezdés j) pont tudományos kutatás céljából, megfelelő biztosítékok mellett, valamint a megfelelő, az Egyesült Királyság GDPR-nek megfelelő rendelkezések szerint. A közzétett tesztkörnyezetben (harness), a technikai jelentésben vagy a kiadott adatkészletekben sehol nem jelenik meg személyazonosításra alkalmas információ.
V11 első kiadás — 15 kézzel válogatott eset
Az eredeti V11-es esetsor panelt Dr. Thomas Klein kézzel válogatta össze, hogy azokat a diagnosztikai mintázatokat gyakoroltassa, amelyeket a laboratóriumi medicina asszisztensei a leggyakrabban elrontanak. A tizenöt eset mindegyike egy-egy konkrét diagnosztikai tulajdonság alapján lett kiválasztva, az alábbiak szerint.
Miért pont ez az eloszlás
A hematológia három esetet kap, mert a mikrocitás differenciáldiagnózisok és a makrocitás differenciáldiagnózisok a legnagyobb volumenű csapdák a valós laboratóriumi gyakorlatban. Az endokrinológia is három esetet kap, mert a Hashimoto-kór, a PCOS és a D-vitamin hiány megjelenési formái eltérő diagnosztikai alakzatokat gyakorolnak (autoantitest-vezérelt, hormonarany-vezérelt, egyetlen marker-vezérelt). Az egyeletes szakterületek továbbra is jelentősek, mert a CKD, az ASCVD-kockázat és az SLE mindegyikének saját pontozási rendszere van, amelyet a motor hívjon meg (KDIGO-stádium, ASCVD 10 éves kockázat, illetve 2019 EULAR/ACR SLE kritériumok).
V11 második frissítés — 100 000 anonimizált eset 127 országban
A második frissítés az eredeti V11-es, 15 esetet tartalmazó, beégetett (hard-coded) Python-iterálást egy paraméterezett, csak olvasható SQL-lekérdezéssel váltja fel az Kantesti klinikai adattárban (anonymised_blood_panels). A lekérdezés szűrőfeltételei: consent_research = 1 AND released_for_benchmark = 1 , és átláthatóság céljából minden benchmark futás elején ki van nyomtatva. A kohorsz megoszlása szakterület szerint az alábbiakban látható.
Földrajzi megoszlás – top 10 ország
A kohorsz 127 országot ölel fel (ISO 3166-1 alpha-2). Európa 57,7%-t, az Amerikák 25,4%-t, Ázsia–Csendes-óceán 6,2%-t, a megnevezett Közel-Kelet/Afrika bejegyzések 3,4%-t adnak, és további 97 ország hosszú farka együttesen nagyjából 7,3%. A tíz legnagyobb hozzájáruló az Egyesült Államok (10 500), Brazília (9 500), Spanyolország (9 000), Olaszország (8 000), Németország (7 800), Franciaország (7 400), Portugália (5 800), Törökország (3 400), az Egyesült Királyság (2 900) és Mexikó (2 500). Az országonkénti összetett pontszámok 0,9971-től (India) 0,9985-ig (Svájc) terjedtek.
Az előre regisztrált rubrika, magyarázata
Az előregisztráció a legfontosabb módszertani döntés ebben a benchmarkban. Minden várt diagnózis, minden klinikai pontozási rendszer és minden jelentésrész a forráskódba lett rögzítve mielőtt a motort meghívták. A rubrika utólagos finomhangolása tehát a motor „kényeztetésére” lehetetlen.
A kompozit pontszámot három komponens alkotja. A strukturális komponens 35 százalékot tesz ki, és azt méri, hogy a motor visszaadta-e a hét kötelező jelentésrészt (fejléc, összefoglaló, fő megállapítások, differenciál, pontozási rendszerek, ajánlások, utánkövetés) és a bennük lévő tizenhat kötelező alszakaszt. A szakasz-meglét 40 százalékot, az alszakasz-meglét pedig 60 százalékot nyom a strukturális számításban.
A klinikai komponens 55 százalékot tesz ki, és három dolgot egyesít: diagnózis-kulcsszó felidézés (a klinikai alszám 70 százaléka), pontozási rendszer felidézés (20 százalék — a motor kiszámítja-e a Mentzer-, FIB-4-, HOMA-IR-, ASCVD-kockázatot, a KDIGO-stádiumot, valamint az EULAR/ACR kritériumokat, ahol releváns), és egy valószínűség-összeg érvényességi ellenőrzést (10 százalék — a differenciál valószínűségeinek összege a [90, 110] intervallumon belül kell legyen). Csapdaeseteknél legfeljebb 0,30 explicit hiperdagnózis-büntetés kerül levonásra, amely 0,10/fabrikált patológia-flag alapján számolódik, és legfeljebb három flagig van korlátozva.
A késleltetési komponens 10 százalékot tesz ki. A 20 másodpercnél rövidebb válasz megkapja a teljes 0,10-et, a 40 másodpercnél rövidebb válasz 0,05-öt kap, és minden ennél lassabb válasz nulla. A 20 másodperces cél a gyártási elsődleges primary-path szolgáltatási szintű célkitűzést tükrözi; a 40 másodperces felső korlát a 2. fázisú visszaesési keretet jelenti a nagy terhelésű motorhívásokhoz.
Mit akadályoz meg az előregisztráció
Az első fél által készített benchmarkok hírhedtek amiatt, hogy utólagos rubrika-finomhangolással felfújják a saját számaikat. A minta szinte mindig ugyanaz: a csapat lefuttatja a motort, látja, hol teljesít alul, majd csendben úgy állítja át a rubrikát, hogy az alulteljesítő területek kevesebbet számítsanak. A rubrikának az első motorhívás előtt a forráskódba rögzítésével és a tesztkör MIT licenc alatti közzétételével ez az átalakítás láthatóvá válik a verziókezelésben. Bárki klónozhatja a repót, ellenőrizheti a rubrika szerzői dátumait, és igazolhatja, hogy a motor eredményeit nem használták a pontozás alakítására.
Hiperdagnózis-csapda esetek — miért a túlzott „rámondás” a valódi hibamód
A patológia agresszív túlhívása normál szűrőképernyőkön dokumentált hibamódja a fogyasztóknak szánt orvosi asszisztenseknek. Ennek a következményköltségei közé tartozik a szükségtelen kivizsgálás, a beteg szorongása és az iatrogén kivizsgálás. A benchmark két csapdaesete úgy van kialakítva, hogy ez a hibamód látható és pontozható legyen.
🟡 1. csapda — BT-014-GILBERT
Megjelenés. Egy 24 éves férfi összbilirubinszintje 2,4 mg/dL. A direkt frakció normális, a transzaminázok és az alkalikus foszfatáz a saját referencia-tartományukon belül vannak, a retikulociták nem feltűnőek, és a haptoglobin valamint az LDH kizárja a haemolysist.
Helyes értelmezés. Gilbert-kór — egy jóindulatú UGT1A1 polimorfizmus. Az értelmezés nem hivatkozhat hepatitisre, cirrhosisra, haemolyticus anaemiára vagy epeúti obstrukcióra.
V11 eredmény. Kompozit 1.000. A hat monitorozott túldiagnózis-flag közül egyik sem jelent meg aktív diagnózisként.
🟡 2. csapda — BT-015-HEALTHY
Megjelenés. Egy 35 éves nő egy tizenöt paraméteres rutin szűrőpanellel. Minden analit kényelmesen a saját referencia-tartományán belül van.
Helyes értelmezés. Megnyugtatás és életmódbeli fenntartás. Az értelmezés nem gyárthat határérték-közeli kórképeket pusztán azért, hogy klinikailag hasznosnak hasson.
V11 eredmény. Összetett 1.000. A hét monitorozott túldiagnosztizálási riasztás közül egyetlen sem jelent meg aktív diagnózisként — cukorbetegség, vérszegénység, hypothyreosis, diszlipidémia, hepatitis, vesebetegség, hiányállapot.
Mindkét mintavételi ponton összesen tizenhárom monitorozott hiperdianosztizálási riasztást ellenőriztek. Egyetlen sem aktiválódott. Ez az az eredmény, amely a legfontosabb bármely klinikus számára, aki mesterséges intelligencia motort triázs- vagy konzultációt megelőző eszközként kíván használni: a rendszer nem talált ki betegséget, ha nem létezett.
Mentzer-index: a vashiány elkülönítése a thalasszémia minor (thalaszszémia-hordozói) jellegtől
Egy másik, nagy értékű megállapítás a BT-001-es eset (vashiányos vérszegénység) és a BT-007-es eset (béta-thalasszémia minor) párosítása. Mindkettő mikrocitózissal jár, és ez egy jól ismert buktató a naiv osztályozók számára. A Mentzer-index, amelyet az MCV osztva az RBC-számmal számolnak, vashiányban 13 felett van, thalasszémia-hordozói állapotban pedig 13 alatt.
A BT-001-ben a beteg 34 éves nő volt, hemoglobin 10,4 g/dL, MCV 72,4 fL, RBC 4,1 × 10¹²/L, ferritin 6 ng/mL, valamint emelkedett TIBC. A körülbelül 17,7-es Mentzer-index igazolja a tényleges vashiányt. A BT-007-ben a beteg 28 éves férfi volt mikrocitózissal (MCV 65,8 fL), de magas RBC-számmal (6,2), normál RDW-vel, normál ferritinnel és 5,6 százalékos HbA2-vel. A körülbelül 10,6-os Mentzer-index thalasszémia-hordozói állapotra utal, és az emelkedett HbA2 megerősíti a béta-thalasszémia minort.
Mindkét eset 1.000 pontszámot kapott. A motor mindkét értelmezésben kifejezetten a Mentzer-indexet használta, és minden alkalommal helyes diagnózist adott. Ez a teljes benchmark leginkább klinikailag megnyugtató eredménye, mert a thalasszémia-hordozói állapot vashiányként való téves besorolása nem megfelelő vaspótlást eredményez, és elmaradnak a családszűrési lehetőségek; a vashiány thalasszémiaként való téves besorolása pedig késlelteti az egyszerű helyettesítő kezelést. A mi ferritin-tartomány-irányelvünk magyarázza a tágabb differenciáldiagnosztikai kontextust.
Esetenkénti eredmények a V11 kezdeti referenciafuttatásból (2026. április 23.)
Az eredeti V11 referenciafuttatás a 15 esetből álló proof-of-concept kohorszon szolgál mint módszertani alap a Második frissítéshez: az alábbi, esetenkénti minden részlet bemutatja, hogyan kezeli a rubrika egy valós motorválaszt. A tizenöt esetből tizenkettő elérte az elsődleges útvonalon a maximális összetett pontszámot (1,000); három eset a 2. fázisú (Phase 2) visszaesésen (fallback) keresztül lett kiszolgálva, így elveszett a 0,05 késleltetési bónusz, de minden klinikai és strukturális tartalom megmaradt. Egy esetből hiányzott egyetlen kötelező alfejezet; egy eset visszaadott egy némileg csökkentett valószínűségi eloszlásösszeget.
A PCOS-eset (BT-008) elveszített egyetlen kötelező alfejezetet a válaszstruktúrában — tizenhatból tizenöt helyett tizenhatból tizenhat —, ami a strukturális pontszámot 1,000-ről 0,963-ra csökkentette. Az SLE-eset (BT-011) egy csekély mértékben csökkent valószínűségeloszlás-összeggel tért vissza, amely a klinikai pontszámot 0,965-re vitte le, miközben minden diagnosztikai kulcsszót és pontozási rendszert megőrzött. Egyik, tökéletlen alapeset sem mulasztott el egy helyes diagnózist.
V11 Második frissítés összesített eredményei – 100 000 eset
Népesedési (populációs) léptékben az egyes esetek sorai nem olvashatók ember számára, ezért a Második frissítés összesített mutatókat közöl, nem pedig egy 100 000 soros táblát. Az összesített fő szám az alábbiakban látható; szakterületenként és országonkénti bontás a technikai jelentésben és a Figshare feltöltésben jelenik meg. Egy rétegzett véletlen mintát n = 201 nyers motorválaszok (determinisztikus seed 20260426) a GitHub results/ könyvtárban kerül közzétételre ellenőrzés céljából.
Mit nem árul el a főcím pontszáma
Ezen a konkrét előre regisztrált értékelési rubrikán 99,80 százalékos összpontszám, egy 127 országot átfogó, 100 000 esetből álló anonimizált kohorszban, közel a plafon teljesítményt jelent — de gondos keretezést igényel. Az eredmény a motor viselkedését írja le a V11-ben a forráskódba rögzített rubrikával szemben; nem általános állítás a motor vadon előforduló minden egyes vérvizsgálati panelen való helyességéről.
A pontszám azt jelzi, hogy a motor a jelen értékeléshez kiválasztott diagnosztikai mintákat helyesen kezelte a populációs méretű kohorszban, egy publikált és reprodukálható módszertanon keresztül. Nem állítja, hogy a motor helyes minden vadon előforduló vérvizsgálati panelen. Nem állítja, hogy a motornak ki kellene váltania a klinikai döntéshozatalt. És nem állítja, hogy a motor felülmúlja a többi mesterséges intelligencia rendszert — az egyéb motorokkal végzett összehasonlító elemzések szándékosan ezen jelentés hatókörén kívül estek.
Amit a pontszám ténylegesen megalapoz, az egy alapérték. Mivel a rubrika és a keretrendszer nyilvános, a motor jövőbeli verziói ugyanazzal a rubrikával értékelhetők — alkalmazva a V11 kezdeti 15 esetre, a Második frissítés 100 000 esetből álló kohorszára, vagy bármely későbbi bővítésre — és a publikált pontszám és bármely későbbi futás közötti különbség maga is mérhető. Ez az előzetes regisztráció értéke: a teljesítményre vonatkozó állításokat tesztelhető állításokká alakítja.
Hogyan reprodukálható ez a benchmark 10 perc alatt
A reprodukáláshoz mindössze egy Kantesti API hitelesítő adatkészlet és egy Python 3.10 vagy újabb környezet szükséges, a következőkkel: requests és reportlab telepítve. A teljes futtató környezet egyetlen, önálló Python-modul, amelyet az MIT-licenc alatt adtak ki.
Négy lépés egy friss futtatáshoz
Egy. Klónozd a repót: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. Kettő. A függőségek telepítése ezzel: pip install -r requirements.txt (A Második frissítés hozzáadja: mysql-connector-python ≥ 8.0 az SQL-esetbetöltőhöz). Három. Állítsd be KANTESTI_USERNAME és KANTESTI_PASSWORD mint környezeti változók a motor API-jához. A Második frissítés SQL-esetbetöltőjéhez emellett állítsd be: KANTESTI_DB_HOST, KANTESTI_DB_PORT, KANTESTI_DB_NAME, KANTESTI_DB_USER, és KANTESTI_DB_PASSWORD — a betöltő csak olvasási jogosultságú szerepkörön keresztül csatlakozik (bench_reader) amelynek nincsenek jogosultságai az azonosító táblákhoz. Négy. Futtasd python benchmark_bloodtest.py --limit 100000 a teljes Second-Update futtatáshoz, vagy python benchmark_bloodtest.py --limit 1000 gyors iterációhoz. A kimenetek ide kerülnek: ./benchmark_results/: egy CSV pontozólap országonként és szakterületenként oszlopokkal, egy JSON összesítés, egy rétegzett-véletlenszerű nyers válasz mintavétel, valamint egy Markdown jelentés.
A hivatkozási futtatások 2026. április 23-án (V11 kezdeti, 15 eset) és 2026. április 26-án (V11 Second Update, 100,000 eset) megőrződnek a results/ adattár könyvtárában. Egy új futtatás új, időbélyegzett pontozólapot hoz létre úgy, hogy a hivatkozási futtatások érintetlenek maradnak. Ha a futtatásod érdemben eltérő eredményt ad, kérjük, nyiss egy GitHub issue-t a futtatás időbélyegével és a válasz metaadataiban visszaadott motorverzióval.
Korlátok és jövőbeli munka
Még 100,000 esetnél is, 127 országra kiterjedően, négy korlátozás megérdemel egyértelmű elismerést: a hosszú farok országok alulmintavételezése, az egyszeri kiértékelés, az egyetlen motor hatóköre és az egyetlen adatforrás eredete. Mindegyiket aktív utánkövetési munkában kezeljük.
Hosszú farok országok lefedettsége. A Second Update 127 országot ölel fel, de az eloszlás kiegyensúlyozatlan — az első 10 hozzájáruló a ≈66.4% esetekből részesedik, és a további 97 ország hosszú farka együtt ≈7.3%-ot ad (összesen kb. 7,300 eset, országonként átlagosan ~75 eset). Ezért a hosszú farokban lévő országonkénti kompozitok zajosabbak, mint amit a fő számok sugallnak. A jövőbeli futtatások elsőbbséget fognak adni az alulmintavételezett országokból történő toborzásnak, hogy megerősítsék az országonkénti becsléseket.
Egyszeri kiértékelés. A kohorsz minden egyes esetét egyszer értékelték. A nagy nyelvi modellek nem elhanyagolható kimeneti varianciát mutatnak még alacsony mintavételi hőmérséklet mellett is, ezért a többfutásos protokoll, esetenként öt kiértékeléssel és jelentett varianciával a természetes következő lépés — különösen a csapdaeset-részhalmazon, ahol a mintavételi „jitter” melletti konzisztencia a biztonsági állítás része.
Egyetlen motor hatóköre. Ez a jelentés egyetlen motort jellemez. Az alternatív mesterséges intelligencia rendszerekkel végzett összehasonlító elemzések itt nem tartoznak a hatókörbe; ezeket külön, független vizsgálatként folytathatjuk megfelelő módszertannal, ugyanazzal a MIT-licencű keretrendszerrel szemben.
Az adatok egyetlen forrásból származó eredete. A 100,000 eset anonimizált, valós betegrekordokból áll, amelyeket egyetlen klinikai adattárból merítettek (az Kantesti SQL-alapú klinikai adatwarehouse-ből). Ezek egy válogatott, éles gyártási folyamatot reprezentálnak, és nem tekinthetők globális szinten a populációt reprezentáló véletlenszerű mintavételnek. A kiértékelés külső forrásból származó többközpontú adatokra való kiterjesztése a tervek között szerepel.
Ezen a négyen túl a legnagyobb hatású tervezett kiterjesztés az országonkénti többnyelvű paritás. Az Kantesti AI Engine 75+ nyelven szolgálja a felhasználókat, és a nyelv szerint rétegzett Second-Update rész-kohorszok (török, német, spanyol, francia, olasz, portugál, arab, mandarin) futtatása számszerűsíteni fogja a kimeneti minőséget a motor által támogatott nyelveken. Minden nyelv szerint rétegzett elemzés saját DOI-val és keretrendszer-ágával kerül publikálásra.