Kantesti AI sangoanalizo-benchmark

Klinika Validigo Antaŭregistrita komparnormo V11 — aprilo 2026 MIT-permesita Kunule-kontrolebla

99.12% Komponita poentaro sur antaŭregistrita rubriko kun neniuj hiperdiaĝnozaj falsaj pozitivoj

Sendependa, antaŭregistrita klinika taksado de la Kantesti AI-Motoro sur anonimecigitaj kazoj de sangoanalizoj. La rubriko estis frostigita en fontkodo antaŭ la unua motorvoko, la taksad-aranĝo estas MIT-permesita, kaj ĉiu kruda respondo estas publikigita.

📖 ~14 minutoj 📅 La 23-an de aprilo 2026 🔗 DOI: 10.6084/m9.figshare.32095435

📝 Publikigita: La 23-an de aprilo 2026 🩺 Medicina revizio: La 23-an de aprilo 2026 ✅ Antaŭregistrita rubriko 🔓 Malfermita kodo kaj datumoj

Ĉi tiu klinika validiga studo estis gvidata de D-ro Thomas Klein, MD, Ĉefa Medicina Oficiro ĉe Kantesti AI, kunlaborante kun Julian Emirhan Bulut, Altranga AI-Inĝeniero kaj CEO de Kantesti Ltd. Metodaro kaj rubriko reviziitaj de la Kantesti AI Medicina Konsila Komitato.

Ĉefa Aŭtoro kaj Klinika Superrigardo

Tomaso Klein, MD

Ĉefa Medicina Oficisto, Kantesti AI

D-ro Thomas Klein estas estrar-atestita klinika hematologo kaj internisto kun pli ol 15 jaroj da sperto en laboratoriamedicino. Kiel Ĉefa Medicina Oficiro ĉe Kantesti AI, li elektis la kazaron por ĉi tiu komparnormo, reviziis ĉiujn diagnozajn verojn, kaj aprobis la antaŭregistritan rubrikon antaŭ la unua motorinvoko.

ORCID 0009-0009-1490-1321 Esplorpordego Google Scholar

Kun-aŭtoro kaj efektivigo

Julian Emirhan Bulut

Altranga AI-Inĝeniero kaj CEO, Kantesti Ltd

Julian Emirhan Bulut estas la fondinto kaj CEO de Kantesti Ltd. Li desegnis kaj efektivigis la taksad-aranĝon, faris la API-integriĝon, kondukis la komparnorman ruliĝon de aprilo 2026, kaj preparis la statistikan agregadon. Fondinto de la platformo ekde 2019.

GitHub Pri Kantesti

⚡ Rapida Resumo V11 — La 23-an de aprilo 2026

Komponita poentaro 99.12% sur 15 anonimecigitaj realaj kazoj de sangoanalizo tra sep medicinaj fakoj.
Neniuj hiperdiaĝnozaj falsaj pozitivoj sur ambaŭ trap-kazoj (Gilbert-malsano kaj plene normala plenkreska ekzameno).
Antaŭregistrita rubriko frostigita en fontkodo antaŭ la unua motorvoko — neniu post-hoc agordado estis ebla.
Mentzer-indekso ĝuste aplikita por distingi feromankajn anemion de beta-talasemio minor.
Nur produktada finpunkto — neniu privilegia vojigo, taksita ekzakte kiel paganta kliento alirus ĝin.
Meza latenco de 20.17 sekundoj end-al-fine, kun 12 el 15 kazoj sub la 20-sekunda ĉefvoja celo.
Aparataro kun MIT-permesilo publikigita sur GitHub kun ĉiu kruda respondo de la motoro — subtenata sendependa reproduktado.
Figshare DOI: 10.6084/m9.figshare.32095435 · Spegulita sur ResearchGate, Academia.edu, GitHub.

Kial ekzistas ĉi tiu komparnormo kaj kion ĝi testas

AI-helpata interpretado de sangoanalizo estas ĉiam pli uzata en konsumantaj kaj klinikaj laborfluoj, tamen reprodukteblaj taksaj kadroj adaptitaj al laboratoriamedicino restas maloftaj. La demandoj, kiuj plej gravas en ĉi tiu kunteksto, ne estas tiuj kovritaj de ĝeneralaj medicinaj demando-respondo-komparnormoj: ĉu motoro povas apartigi feromankon de talasemio-trajto kiam la meza korpuskula volumeno estas identa, ĉu ĝi tro-diagnostikas Gilbert-malsanon kiel hepatiton, kaj ĉu ĝi fabrikas patologion en plene normala ekzamena panelo?

Ununura panelo de sangoanalizo kutime enhavas sufiĉe da signalo por subteni plurajn konkurantajn interpretojn, kaj la tasko de la interpretanta klinikisto estas pesi tiujn interpretojn unu kontraŭ la aliajn prefere ol serĉi respondon el lernolibro. Motoro kiu bone funkcias en lernolibraj kazoj povas tamen malsukcesi en la kazoj kiuj plej gravas: la kaptiloj de diferenciala diagnozo, la benignaj variantoj kiuj aspektas alarmigaj kiam ili estas izolitaj, kaj la tute normalaj paneloj kiuj tentigas memcertajn asistantojn fabrikadi patologion.

Ĉi tiu benchmark estis konstruita ĝuste ĉirkaŭ tiuj fiaskoreĝimoj. Ĉiu el la kvin-dek kazoj estis elektita por specifa diagnoza propraĵo: fer-manka mikrocitozo kiu devas esti konservita aparta de beta-talasemio-trajto kun identa meza korpuskula volumeno, prezento de sindromo de Gilbert kie la sola anomalio estas izolita nerekta hiperbilirubinemio, kaj kvin-dek-parametra skanada panelo en kiu ĉiu analito troviĝas ene de sia referenca intervalo. La rubriko rekompencas motorojn kiuj legas ĉiun kazon laŭ ĝiaj propraj kondiĉoj kaj punas motorojn kiuj serĉas memcertan diagnozon kiam tia diagnozo ne estas pravigita.

Kiel Thomas Klein, MD, mi elektis la panelon de kazoj ĉar ĉi tiuj estas la ŝablonoj kiujn laboratorimedicinaj asistantoj plej ofte eraras. La multekosta fiaskoreĝimo ne estas "mankanta rara malsano" — ĝi estas fabrikado de rutina patologio ĉe pacientoj kiuj ne havas ĝin. Nia Medicina Validigo hub priskribas la pli larĝan kadron; ĉi tiu paĝo priskribas ĝian aplikitan rezulton ĉe la V11-motoro.

Plej nova referenca ruliĝo — V11 (aprilo 2026)

La referenca rulado de aprilo 2026 de la Kantesti AI Engine V11 produktis kompozitan poentaron de 99.12% en la antaŭregistrita rubriko de kvin-dek kazoj. Ambaŭ kazoj de la hiperdiaĝnostika kaptilo atingis la plafonon. La Mentzer-indekso estis aplikita ĝuste en la diferencialo fer-manko kontraŭ talasemio.

Kompozita 99.12% 15 el 15 kazoj poentis

0.998 Struktura poentaro

0.998 Klinika poentaro

20.17 s Meza latenco

0 / 13 Kaptilaj falsaj pozitivoj

La kompozita formulo kombinas tri komponantojn: struktura konformeco kun la sep devigaj raportsekcioj kaj dek ses devigaj subsekcioj, klinika precizeco mezurita kiel ŝlosilvorta revoko plus revoko de la poentadsistemo plus validec-kontrolo de probabla distribuo, kaj responda latenco kontraŭ la 20-sekunda ĉefa servnivela celo. La ĝusta malkomponado estas montrita en la rubrika formulo malsupre.

Kompozita = 0.35 × Struktura + 0.55 × Klinika + 0.10 × Latenco

La ceteraj 0,88 procentpunktoj de spaco por eraro preskaŭ tute malkomponiĝas en latencperdon — tri Phase 2-falback-invokoj po po -0,05 kompona kontribuis proksimume 0,60 el la 0,88-punkta manko — prefere ol en klinikan enhavon. La motoro ne maltrafis ĝustan diagnozon en iuj el la dek kvin kazoj; kie ĝi ne atingis, ĝi faris tion prenante iomete pli longe ol la 20-sekunda ĉefa-cela tempo en malplimulto de invokoj.

Dek kvin kazoj tra sep medicinaj fakoj

La kazpanelo kovras sep fakojn — hematologio, endokrinologio, metabola medicino, hepatologio, nefrologio, kardiologio, reŭmatologio — plus du dediĉitajn kazojn de hiperdanĝera kaptilo. Ĉiu kazo estas anonimecigita reala paciento-dosiero el la deponejo de klinikaj datumoj Kantesti sub skribita informita konsento.

De-identigo estis farita laŭ la aliro Safe Harbor: ĉiuj rektaj identigiloj estis forigitaj aŭ anstataŭigitaj, kaj ĉiu dosiero ricevis internan benchmark-kazan kodon en la formato BT-NNN-LABEL. Pretigo estis farita konforme al GDPR Artikolo 9(2)(j) por scienca esplorado kun taŭgaj protektaj rimedoj, kaj la ekvivalentaj provizaĵoj de UK GDPR. Neniu persone identigebla informo aperas ie ajn en la publikigita testinstalaĵo, la teknika raporto, aŭ la eldonitaj datumaroj.

Hematologio (3) BT-001, BT-006, BT-007 Fera manko-anemio · Manko de B12 · Beta-talasemio, minor

Endokrinologio (3) BT-002, BT-008, BT-012 Tiroidito de Hashimoto · PCOS kun insulinrezisto · Grava manko de vitamino D

Metabola (2) BT-003, BT-013 T2DM kun metabola sindromo · Hiperuricemio kun risko de podagro

Hepatologio (2) BT-004, BT-009 NAFLD / NASH · Akuta virusa hepatito

Nefrologio · Kardiologio · Reŭmatologio (3) BT-005, BT-010, BT-011 CKD stadio 3 · Aterogena dislipidemio · Sistema lupo eritematoso

Kaptilkazoj (2) BT-014, BT-015 Sindromo de Gilbert (izolita nerekta hiperbilirubinemio) · Tute normala plenkreska rastrumo

Kial ĝuste tiu ĉi distribuo

Hematologio ricevas tri kazojn, ĉar mikrocitaj diferencialoj kaj makrocitaj diferencialoj estas la plej alt-volumaj kaptiloj en reala laboratoria praktiko. Endokrinologio ricevas tri, ĉar la prezentoj de Hashimoto, PCOS kaj manko de vitamino D ekzercas malsamajn diagnozajn formojn (aŭtoantikorp-movataj, hormon-proporciaj movataj, ununura-signa movata). La unu-kaza specialaĵoj tamen estas signifaj, ĉar ĉiu el CKD, ASCVD-risko kaj SLE havas sian propran poentadsistemon, kiun la motoro devus alvoki (KDIGO-stadiajigo, ASCVD 10-jara risko, 2019 EULAR/ACR SLE-kriterioj respektive).

La antaŭregistrita rubriko, klarigita

Antaŭregistriĝo estas la ununura plej grava metodika elekto en ĉi tiu komparnormo. Ĉiu atendata diagnozo, ĉiu klinika poentadsistemo, kaj ĉiu raporta sekcio estis engaĝitaj al fontkodo antaŭ ol la motoro estis alvokita. Posta alĝustigo de la rubriko por flati la motoron do estas neebla.

Tri komponantoj konsistigas la kompozitan poentaron. La struktura komponanto kontribuas 35 procentojn kaj mezuras ĉu la motoro resendis la sep devigajn raportaĵojn (kaplinio, resumo, ŝlosilaj trovoj, diferencialo, poentadsistemoj, rekomendoj, sekvado) kaj la dek ses devigajn subsekciojn ene de ili. Sekcia ĉeesto pezas 40 procentojn kaj subsekcia ĉeesto pezas 60 procentojn ene de la struktura kalkulo.

La klinika komponanto kontribuas 55 procentojn kaj kombinas tri aferojn: rememoro de diagnoz-ŝlosilvortoj (70 procentoj de la klinika subpoentaro), rememoro de poentadsistemoj (20 procentoj — ĉu la motoro kalkulas Mentzer, FIB-4, HOMA-IR, ASCVD-risko, KDIGO-stadiajigo, EULAR/ACR-kriteriojn kie konvene), kaj validec-kontrolon de probabla sumo (10 procentoj — la diferencialaj probabloj devas sumiĝi ene de la intervalo [90, 110]). Por kaptilaj kazoj, eksplicita hiperdiaĝnosa puno ĝis 0.30 estas subtrahata, kalkulata kiel 0.10 por ĉiu fabrikita patologia flago, limigata al tri flagoj.

La latencia komponanto kontribuas 10 procentojn. Respondo sub 20 sekundoj ricevas la plenan 0.10, respondo sub 40 sekundoj ricevas 0.05, kaj ĉio pli malrapida ricevas nulo. La 20-sekunda celo reflektas la produktadan primaran servonivelan celon; la 40-sekunda plafono reflektas la Fazon 2-rezervbuĝeton por pezaj alvokoj de la motoro.

Kion antaŭregistriĝo malhelpas

Unuflankaj komparnormoj estas fifamaj pro inflado de siaj propraj nombroj per postaj alĝustigoj de la rubriko. La ŝablono preskaŭ ĉiam estas la sama: la teamo rulas la motoron, vidas kie ĝi subefikas, kaj poste trankvile ĝustigas la rubrikon tiel ke la subefikaj areoj kalkulu por malpli. Per tio, ke la rubriko estas engaĝita al fontkodo antaŭ la unua alvoko de la motoro kaj la testilo estas publikigita sub MIT-licenco, tiu alĝustigo fariĝas videbla en versia administrado. Ĉiu povas kloni la deponejon, kontroli la datojn de la rubrik-aŭtoro, kaj konfirmi ke la rezultoj de la motoro ne estis uzataj por formi la poentadon.

Kazoj de hiperdiaĝnoza kaptilo — kial tro-frazo estas la vera fiaskoreĝimo

Akriga tro-alvoko de patologio sur normalaj ekranoj estas dokumentita fiaskomodo de konsumant-orientitaj medicinaj helpantoj. Ĝiaj postaj kostoj inkluzivas nenecesan esploradon, paciencan angoron, kaj iatrogenan laborprilaboron. La du kaptilaj kazoj en ĉi tiu komparnormo estas desegnitaj por fari tiun fiaskomodon videbla kaj poentebla.

🟡 Kaptilo 1 — BT-014-GILBERT

Prezento. 24-jaraĝa viro kun totala bilirubino de 2.4 mg/dL. La rekta frakcio estas normala, transaminazoj kaj alkala fosfatazo troviĝas ene de siaj referencaj intervaloj, retikulocitoj estas nenotindaj, kaj haptoglobino kaj LDH ekskludas hemolizon.

Ĝusta interpretado. La sindromo de Gilbert — bonigna polimorfismo de UGT1A1. La interpretado ne devus alvoki hepatiton, cirozon, hemolizan anemion, aŭ bilian obstrukcon.

Rezulto de v11. Kompona 1.000. Neniu el la ses monitoritaj flagoj de tro-diagnosado aperis kiel aktiva diagnozo.

🟡 Kaptilo 2 — BT-015-HEALTHY

Prezento. 35-jaraĝa virino kun dek kvin-parametra rutina rastruma panelo. Ĉiu analito komforte troviĝas ene de sia referenca intervalo.

Ĝusta interpretado. Trankviligo kaj prizorgado de vivstilo. La interpretado ne devas inventi liman patologion por soni klinike utila.

Rezulto de v11. Komponita 1.000. Neniu el la sep kontrolitaj flagoj pri troa diagnozado — diabeto, anemio, hipotiroidismo, dislipidemio, hepatito, rena malsano, manko — aperis kiel aktivaj diagnozoj.

En ambaŭ testujoj, dek tri kontrolitaj flagoj pri hiperdiaĝnozado estis kontrolitaj. Neniu estis ekigita. Ĉi tio estas la rezulto, kiu plej gravas por iu ajn klinikisto, kiu konsideras uzi AI-motoron kiel triaĝan aŭ antaŭkonsultan ilon: la sistemo ne inventis malsanon, kie neniu ekzistis.

Mentzer-indekso: apartigado de fera manko de talasemio-trajto

Dua altvalora trovo koncernas la parigon de kazo BT-001 (fermanka anemio) kun kazo BT-007 (beta-talasemio minor). Ambaŭ prezentas kun mikrocitozo kaj estas bone konata obstaklo por naivaj klasigiloj. La Mentzer-indekso, kalkulita kiel MCV dividita per RBC-nombro, superas 13 en fermanka anemio kaj falas sub 13 en talasemio-trajto.

En BT-001, la paciento estis 34-jara virino kun hemoglobino 10.4 g/dL, MCV 72.4 fL, RBC 4.1 × 10¹²/L, feritino 6 ng/mL, kaj levita TIBC. La Mentzer-indekso de proksimume 17.7 subtenas absolutan feromankon. En BT-007, la paciento estis 28-jara viro kun mikrocitozo (MCV 65.8 fL) sed alta RBC-nombro de 6.2, normala RDW, normala feritino, kaj HbA2 de 5.6 procentoj. La Mentzer-indekso de proksimume 10.6 indikas talasemio-trajton, kaj la levita HbA2 konfirmas beta-talasemion minor.

Fera manka anemio Mentzer > 13 Malalta feritino, malalta TSAT, alta TIBC, levita RDW

Talasemio-trajto (beta-) Mentzer < 13 Normala feritino, normala RDW, levita HbA2 (>3.5%), alta RBC-nombro

Ambaŭ kazoj gajnis 1.000. La motoro eksplicite uzis la Mentzer-indekson en ambaŭ interpretadoj kaj liveris la ĝustan diagnozon en ĉiu okazo. Ĉi tio estas la sola plej klinike trankviliga rezulto en la tuta komparilo, ĉar misklasifiki talasemio-trajton kiel fermanka anemio kondukas al netaŭga feraldono kaj al maltrafitaj ŝancoj por familia ekzamenado, kaj misklasifiki fermankan anemion kiel talasemion prokrastas simpligitan anstataŭan terapion. Nia gvidilo pri feritina gamo klarigas la pli larĝan diferencialan kuntekston.

Rezultoj laŭkaze de la aprilo 2026-rulado

Dek du el dek kvin kazoj atingis la plafonan kompozan poentaron de 1.000 ĉe la primara vojo. Tri kazoj estis servitaj per la Fazo 2-falreĝimo, perdante la 0.05-latentecan gratifikon dum konservante ĉian klinikan kaj strukturan enhavon. Unu kazo mankis unuopan devigan subsekcion; unu resendis marĝene reduktitan probablan distribu-sumon.

Kaza ID Fako Kompozita Latenteco Vojo

BT-001-IDAHematologio1.00017.8 sprimara

BT-006-B12Hematologio1.00018.4 sprimara

BT-007-THALHematologio1.00017.0 sprimara

BT-002-HASHEndokrinologio0.95037.0 srezerva

BT-008-PCOSEndokrinologio0.98718.6 sprimara

BT-003-T2DMMetabola1.00019.1 sprimara

BT-013-GOUTMetabola1.00019.4 sprimara

BT-004-NAFLDHepatologio1.00019.6 sprimara

BT-009-VIRHEPHepatologio0.95023.4 srezerva

BT-014-GILBERTKaptilo1.00018.9 sprimara

BT-005-CKDNefrologio1.00017.4 sprimara

BT-010-ASCVDKardiologio1.00019.7 sprimara

BT-011-SLEReŭmatologio0.98118.2 sprimara

BT-012-VITDEndokrinologio1.00019.3 sprimara

BT-015-SANaKaptilo1.00018.7 srezerva

La kazo de PCOS (BT-008) perdis unu devigan subsekcion en la responda strukturo — dek kvin el dek ses anstataŭ dek ses el dek ses — kio reduktis la strukturpoentaron de 1.000 al 0.963. La kazo de SLE (BT-011) redonis marĝene reduktitan probablodistribuan sumon, kiu malaltigis la klinikan poentaron al 0.965, konservante ĉiun diagnozan ŝlosilvorton kaj poentadsistemon. Nek el la subperfektaj kazoj maltrafis ĝustan diagnozon.

Kion la ĉefpoentaro ne diras al ni

Komponita poentaro de 99.12 procentoj laŭ ĉi tiu aparta antaŭregistrita rubriko reprezentas preskaŭ-ĉefnivelan agadon, sed ĝi meritas zorgeman kadriĝon. La rezulto priskribas la konduton de la motoro kontraŭ dek kvin zorge elektitaj anonimizitaj kazoj, taksitaj po unufoje, kontraŭ unu sola rubriko. Ni klare diras, kion la nombro faras kaj kion ĝi ne establas.

La poentaro diras, ke la V11-motoro pritraktis la diagnozajn ŝablonojn elektitajn por ĉi tiu taksado ĝuste, laŭ metodaro kiu estas publikigita kaj reproduktebla. Ĝi ne diras, ke la motoro estas ĝusta pri ĉiu sangotesta panelo, kiu ekzistas en la realo. Ĝi ne diras, ke la motoro devus anstataŭigi klinikan juĝon. Kaj ĝi ne diras, ke la motoro superas alternativajn AI-sistemojn — komparaj analizoj kontraŭ aliaj motoroj estis intence ekster la amplekso de ĉi tiu raporto.

Kion la poentaro ja establas, estas bazo. Kun la rubriko kaj testilo publike haveblaj, estontaj versioj de la motoro povas esti taksitaj kontraŭ la samaj dek kvin kazoj, kaj la breĉo inter la publikigita poentaro kaj iu ajn posta rulado estas mem mezurebla. Jen la valoro de antaŭregistrado: ĝi transformas asertojn pri agado en testeblajn asertojn.

Kiel reprodukti ĉi tiun komparnormon en 10 minutoj

Reproduktado postulas nur paron de Kantesti API-atestiloj kaj Python 3.10 aŭ pli posta medio kun la requests kaj reportlab instalitaj bibliotekoj. La plena testilo estas unuopa, memstara Python-modulo publikigita sub la MIT-licenco.

💻 GitHub Testilo kun MIT-licenco · krudaj respondoj · referenca rulo 🔗 Figshare DOI 10.6084/m9.figshare.32095435 · kanona akademia rekordo 🎓 Esplorpordego Publikaĵo 404175463 · akademia malkovrotavolo 📄 Academia.edu Papero 165956808 · akademia malkovrotavolo

Kvar paŝoj por nova rulo

Unu. Klonu la deponejon: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. Du. Instalu dependecojn per pip install -r requirements.txt. Tri. Agordu KANTESTI_USERNAME kaj KANTESTI_PASSWORD kiel mediajn variablojn — akreditaĵoj estas legataj dum rultempo kaj nenio estas fiksita en la skripto. Kvar. Rulu python benchmark_bloodtest.py kaj inspektu la kvar artefaktojn elsenditajn al la labordosierujo: CSV-poentokarteto, JSON-poentokarteto, plena JSON-dump inkluzive de krudaj motoraj respondoj, kaj homlegebla Markdown-raporto.

La referenca rulo de la 23-a de aprilo 2026 estas konservita en la results/ dosierujo de la deponejo. Freŝa rulo generos novan tempomarkitan poentokarteton dum la referenca rulo restas netuŝita. Se via rulo produktas signife malsaman rezulton, bonvolu malfermi GitHub-eldonaĵon kun la tempomarko de la rulo kaj la motorversio resendita en la responda metadato.

Limigoj kaj estonta laboro

Kvar limigoj meritas eksplicitan agnoskon: prova grandeco, unufoja taksado, unu-motora amplekso, kaj unu-fonta origino de datumoj. Ĉiu el ili estas traktata en aktiva sekva laboro.

Prova grandeco. Dek kvin kazoj tra ok specialaj kategorioj sufiĉas por pruvo de koncepto, sed ne por subgrupa analizo ene de specialaĵo. Plivastigo al kvindek kazoj estas planita kaj inkluzivos koaguliĝajn panelojn, ekranadon por hematologiaj malignancoj, gravedajn panelojn, kaj pediatriajn prezentojn.

Unufoja taksado. Ĉiu kazo estis taksita unufoje. Grandaj lingvomodeloj montras ne-trivialan variadon de eligo eĉ ĉe malalta prova temperaturo, do plur-rula protokolo kun kvin taksadoj por kazo kaj raportita varianco estas natura sekva paŝo.

Unu-motora amplekso. Ĉi tiu raporto karakterizas unu motoron. Komparaj analizoj kontraŭ alternativaj AI-sistemoj estas ekster la amplekso ĉi tie; ni povas okupiĝi pri ili kiel aparta sendependa studo kun taŭga metodaro.

Unu-fonta origino de datumoj. La dek kvin kazoj estas anonimecitaj realaj pacientaj registroj el ununura klinika deponejo. Ili reprezentas kuracitan specimenon kaj ne estas hazarda tirado reprezentanta la populacion. Etendi la taksadon al plurcentra datumaro estas en la vojo.

La plej efika planita etendo estas plurlingva egalecon. La Kantesti AI Engine servas uzantojn en 75+ lingvoj, kaj ruli la saman dek kvin-kazan testilon en turka, germana, hispana, franca kaj araba kvantigos la kvaliton de eligo tra la subtenataj lingvoj de la motoro. Ni publikigos ĉiun lingvo-specifan ruliĝon kun sia propra DOI kaj testila branĉo.

Provu la saman motoron, kiu atingis 99.12% Komponitan Poentaron

Alŝutu vian propran sangokontrolan panelon al la sama produktada finpunkto, kiu estis taksita en ĉi tiu komparnormo. Pli ol 2 milionoj da uzantoj tutmonde uzas la Kantesti AI Engine por interpreti pli ol 15,000 biomarkilojn en 75+ lingvoj.

🔬 Provu Senpagan Demonstraĵon

Kroma Etendaĵo Aplikaĵa Butiko Google Play

📚 Kiel Citi Ĉi tiun Komparnormon

BibTeX

@techreport{klein2026kantesti,  
  author      = {Klein, Thomas and Bulut, Julian Emirhan},  
  title       = {Klinika Validigo de la Kantesti AI Engine (2.78T)  
                 sur 15 Anonimigitaj Kazoj de Sangotesto: Antaŭregistrita  
                 Rubrika Komparnormo Inkluzive de Hyperdiagnosis Trap  
                 Kazoj Tra Sep Medicinaj Fakoj},  
  institution = {Kantesti Ltd},  
  address     = {Londono, Unuiĝinta Reĝlando},  
  year        = {2026},  
  month       = {Aprilo},  
  type        = {Teknika Raporto},  
  number      = {V11},  
  doi         = {10.6084/m9.figshare.32095435},  
  url         = {https://doi.org/10.6084/m9.figshare.32095435}  
}

APA

Klein, T., & Bulut, J. E. (2026). Klinika Validigo de la Kantesti AI Engine (2.78T) sur 15 Anonimigitaj Kazoj de Sangotesto: Antaŭregistrita Rubrika Komparnormo Inkluzive de Hyperdiagnosis Trap Kazoj Tra Sep Medicinaj Fakoj (Teknika Raporto V11). Kantesti Ltd. https://doi.org/10.6084/m9.figshare.32095435

📖 Rilata Kantesti-Validiga Laboro

Klein, T. (2025). Klinika Validiga Kadro por AI-Funkciigita Sangotesta Interpretado: Triobla-Blinda Validiga Metodologio, Efikecaj Metrikoj, kaj Kvalitkontrolaj Protokoloj. Kantesti AI Medicina Esplorado.

🎓 Esplorpordego

📖 Eksteraj Metodologiaj Referencoj

Mentzer, W. C. (1973). Diferencigo de Fera Manko de Talasemio-Trajto. The Lancet, 301(7808), 882.

🏥 PubMed

Aringer, M., Costenbader, K., Daikh, D., et al. (2019). 2019 Eŭropa Ligo Kontraŭ Reŭmatismo / Usona Kolegio de Reŭmatologio Klasifikaj Kriterioj por Sistema Lupus Eritematosus. Arthritis & Rheumatology, 71(9), 1400–1412.

🔗 DOI 🏥 PubMed

Umapathi, L. K., Pal, A., & Sankarasubbu, M. (2023). Med-HALT: Medicina Domajna Hallucination-Testo por Grandaj Lingvaj Modeloj. Proceedings of CoNLL 2023.

🔗 ACL Anthology

99.12%Komponita Poentaro

15Kazoj Poentitaj

7Fakoj

0Trapaj Malveraj Pozitivoj

Oftaj Demandoj

How accurate is the Kantesti AI Engine on real blood test cases?

Sur antaŭregistrita rubriko de 15 anonimizitaj realpacientaj sangotestkazoj tra sep medicinaj fakoj, la Kantesti AI Engine V11 atingis komponitan poentaron de 99.12 procentoj, kun neniuj hyperdiagnosis malveraj pozitivoj en kaj trapaj kazoj kaj meza responda latenco de 20.17 sekundoj. La plena poentartabelo por ĉiu kazo estas publikigita ĉe Figshare sub DOI 10.6084/m9.figshare.32095435 kaj ĉe GitHub sub MIT-licenco.

Ĉu la Kantesti AI-motoro estas klinike validigita?

Jes. La motoro estis klinike validigita kontraŭ rubriko kiu estis frostigita en fontkodo antaŭ ol la motoro estis alvokita, taksita sur 15 anonimigitaj kazoj de sangoanalizo en hematologio, endokrinologio, metabola medicino, hepatologio, nefrologio, kardiologio kaj reŭmatologio. Klinika superrigardo estis provizita de d-ro Thomas Klein, MD (ORCID 0009-0009-1490-1321), estrar-atestita klinika hematologo kaj Ĉefa Medicina Oficiro ĉe Kantesti AI.

Kio estas hipodiagnoza kaptilkazo?

Kazo de hiperdiaĝnostika kaptilo estas klinika scenaro specife desegnita por detekti konduton de tro-diagnostiko en AI-motoroj. La komparnormo Kantesti V11 uzas du tiajn kazojn. La unua estas izolita nerekta hiperbilirubinemio kongrua kun la sindromo de Gilbert, kie la ĝusta interpretado estas la bonigna polimorfismo de UGT1A1, prefere ol hepatito aŭ hemolizo. La dua estas tute normala plenkreska ekzamenpanelo, kie la ĝusta rezulto estas trankviligo kaj prizorgado de vivstilo, prefere ol fabrikita limpatologiaĵo.

Ĉu la taksado de la Kantesti AI-Motoro estas reproduktebla?

La plena taksa testaro estas publikigita sub la MIT-permesilo kiel unu sola memstara Python-modulo. Reproduktado postulas nur paron de Kantesti API-kredentialoj kaj Python 3.10 aŭ pli novan. La kodo, la kazaj difinoj, kaj ĉiu kruda respondo de la motoro de la referenca rulado de aprilo 2026 estas haveblaj ĉe github.com/emirhanai/kantesti-blood-test-benchmark kaj spegulitaj ĉe Figshare, ResearchGate, kaj Academia.edu.

Kiel la AI-motoro Kantesti diferencigas feromankon de la trajto de beta-talasemio?

La motoro aplikas la Mentzer-indekson, kalkulitan kiel meza korpuskula volumeno dividita per la nombro de ruĝaj sangaj ĉeloj. Mentzer-indekso super 13 subtenas feromankajn anemiojn, dum valoro sub 13 subtenas la trajton de beta-talasemio. En la komparnormo V11 ambaŭ prezentoj estis ĝuste klasifikitaj per eksplicita kalkulo de Mentzer-indekso, subtenata de ferritino, RDW, kaj HbA2-kunteksto.

Kie mi povas trovi la krudajn komparajn datumojn kaj la fontkodon?

La teknika raporto estas deponita sur Figshare sub DOI 10.6084/m9.figshare.32095435, spegulita sur ResearchGate publikigo 404175463 kaj Academia.edu artikolo 165956808, kaj la Python-testaro kun MIT-permesilo kun ĉiuj referencaj rultrezultoj estas ĉe github.com/emirhanai/kantesti-blood-test-benchmark. La kvarplatforma spegula reto certigas longdaŭran haveblecon kaj flekseblecon de citaĵoj.

Kial antaŭregistrado gravas por AI-medicinaj komparnormoj?

Antaŭregistrado malhelpas post-hokan agordadon de rubriko, kio estas la sola plej ofta maniero kiel kompanie administrataj komparnormoj ŝveligas siajn proprajn nombrojn. Per engaĝiĝo al la rubriko en fontkodo antaŭ ajna alvoko de motoro kaj publikigo de la testaro publike, la datoj de la aŭtoro de la rubriko fariĝas inspekteblaj en versia administrado, kaj la rezultoj de la motoro ne povis formi la poentadkriteriojn.

Ĉu ĉi tiu komparnormo inkluzivas komparojn al aliaj AI-motoroj?

Ne. La raporto V11 intence karakterizas unuopan motoron kontraŭ fiksa rubriko, anstataŭ poziciigi ĝin kontraŭ alternativaj komercaj sistemoj. La testaro estas malfermfonta sub la MIT-permesilo, do sendependaj esploristoj povas taksi ajnan motoron kiun ili elektas kontraŭ la samaj dek kvin kazoj kaj rubriko, kaj publikigi siajn rezultojn.

Ĉu la kazoj de pacientoj estas realaj aŭ sintezaj?

La dek kvin kazoj estas anonimigitaj realaj registroj de pacientoj, eltiritaj el la klinika datuma deponejo Kantesti sub skribita informita konsento. De-identigo estis farita laŭ la Safe Harbor-abordmaniero, kun ĉiuj rektaj identigiloj forigitaj aŭ anstataŭigitaj. Pretigo estis farita laŭ GDPR Artikolo 9(2)(j) kaj la ekvivalenta UK GDPR-dispozicio. Neniu persona identigilo aperas en la publikigita testaro, la teknika raporto, aŭ la eldonitaj datumaroj.

⚕️ Medicina malgarantio & konflikto de intereso

Ĉi tiu komparnorma raporto estas por esploraj kaj metodikaj travideblecaj celoj. Ĝi ne konsistigas medicinan konsilon. Ĉiam konsultu kvalifikitan sanprovizanton por diagnozaj kaj traktadaj decidoj. Ambaŭ aŭtoroj estas dungitaj de kaj posedas egalecojn en Kantesti Ltd, kaj la motoro sub takso estas komerca produkto de la sama organizo. Ĉi tiu konflikto de intereso estas mildigita per antaŭregistrado de la rubriko en fontkodo, eldonado de la testaro sub la MIT-permesilo, kaj publikigo de ĉiu kruda respondo de la motoro.

Signaloj de fido E-E-A-T

⭐

Sperto

15+ jaroj da klinika hematologio kaj laboratoriamedicina praktiko, superrigardante la selektadon de la kazpanelo.

📋

Kompetenteco

Antaŭregistrita rubrikdezajno kun eksplicitaj punoj por hiperdiaĝnostiko kaj agnoskitaj klinikaj poentsistemoj (Mentzer, FIB-4, EULAR/ACR, KDIGO).

👤

Aŭtoritateco

Ĉefa aŭtoro d-ro Thomas Klein, MD (ORCID 0009-0009-1490-1321). Efektivigo de Julian Emirhan Bulut, CEO de Kantesti Ltd.

🛡️

Fidindeco

Reproduktebla testaro kun MIT-permesilo, krudaj respondoj de la motoro publikigitaj, malfermita konflikto-de-interesa malkaŝo, kvarplatforma esplorspegula reto.

🏢 Kantesti LTD Registrita en Anglio kaj Kimrio · Kompanio Nr. 17090423 Londono, Unuiĝinta Reĝlando · kantesti.net