Carson a tha am bun-mheasadh seo ann agus dè tha e a’ dèanamh deuchainn

Tha sgrùdadh fala AI le taic a’ sìor chleachdadh ann an sruthan-obrach luchd-cleachdaidh is clionaigeach, ach tha frèaman measadh ath-riochdachail a tha freagarrach do leigheas-lann fhathast tearc. Chan e na ceistean a tha cudromach san t-suidheachadh seo an fheadhainn a tha air an còmhdach le bun-chomharraichean coitcheann airson ceistean is freagairtean meidigeach: an urrainn do einnsean iarann easbhaidh a sgaradh bho thalasaemia trait nuair a tha an mean corpuscular volume co-ionann, a bheil e a’ dèanamh cus-diagnosis air sionndrom Gilbert mar hepatitis, agus a bheil e a’ cruthachadh pathology ann am pannal sgrìonaidh gu tur àbhaisteach?

Diagram sruth rubraig ro-ìreichte a’ sealltainn mar a thathar a’ measadh an Kantesti AI Engine — Dàrna Ùrachadh V11, sgòr 99.80% air 100,000 cùis — an aghaidh slatan-tomhais sgòraidh reòta
Figear 1: An ailtireachd iomraidh air cùl na Sgòr co-phàirteach 99.80% air an V11 Second Update 100,000-cùis — tha a h-uile cùis, a h-uile prìomh-fhacal, a h-uile siostam sgòraidh stèidhichte ann an còd stòr mus fhaic an einnsean eadhon aon PDF, agus tha an rubraidh co-ionann ri byte ris an fhoillseachadh tùsail V11. Chan eil e comasach atharrachadh rubraidh post-hoc a rèir dealbhadh.

Mar as trice bidh pannal singilte deuchainn fala a’ toirt gu leòr comharra airson grunn mhìneachaidhean farpaiseach a shuidheachadh, agus is e obair an lighiche a tha a’ mìneachadh na mìneachaidhean sin a chuideamachadh an aghaidh a chèile seach freagairt leabhar-teacsa a tharraing a-mach. Faodaidh einnsean a tha math air cùisean leabhar-teacsa fhathast fàiligeadh air na cùisean a tha cudromach: na claonaidhean ann an breithneachadh eadar-dhealaichte, na caochlaidhean neo-chunnartach a tha coltach eagallach nuair a tha iad nan aonar, agus na pannalan gu tur àbhaisteach a tha a’ tàladh luchd-cuideachaidh misneachail gu bhith a’ dèanamh pathology suas.

Chaidh a’ bhun-chomharra seo a thogail timcheall air na modhan fàilligeadh sin. Chaidh gach aon de na còig-deug cùisean a thaghadh airson feart breithneachaidh sònraichte: microcytosis le dìth iarainn a dh’fheumar a chumail air leth bho trait beta-thalassaemia le mean corpuscular volume co-ionann, taisbeanadh syndrome Gilbert far nach eil ach aon neo-àbhaisteachd—hyperbilirubinaemia neo-dhìreach iomallach—agus pannal sgrìonaidh le còig-deug paramadair far a bheil a h-uile analyte taobh a-staigh an raoin iomraidh aige. Tha an rubrig a’ duaisachadh einnseanan a leughas gach cùis air na cumhaichean fhèin agus a’ peanasachadh einnseanan a ruigeas breithneachadh misneachail far nach eil breithneachadh mar sin iomchaidh.

Mar Thomas Klein, MD, thagh mi am pannal cùisean oir ’s iad na pàtrain sin a chì mi gu bheil luchd-cuideachaidh leigheas-lannsaidh-lann-lann (laboratory-medicine) a’ faighinn ceàrr as trice. Chan e "a bhith a" call galar tearc” an modh fàilligeadh daor—’s e pathology àbhaisteach a chruthachadh ann an euslaintich aig nach eil e. Ar Dearbhadh Meidigeach tha hub a’ mìneachadh an fhrèam nas fharsainge; tha an duilleag seo a’ mìneachadh dearbhadh bun-bheachd tùsail V11 agus an Dàrna Ùrachadh V11 a thug e gu sgèile gu 100,000 cùis sionnaich a thàinig bho sheata chùisean sionnaich a’ còmhdach 127 bileagan dùthcha — a’ cleachdadh an aon rubric sgòraidh, byte-air-byte, gun chead airson gleusadh post-hoc.

Ruith iomraidh as ùire — V11 Second Update (26 Giblean, 2026)

Thug an ruith iomraidh V11 Second Update air 26 Giblean 2026 a-mach sgòr co-phàirteach de 99.80% air an aon rubraidh ro-registrichte a chaidh a chleachdadh anns an fhoillseachadh tùsail V11, air a mheasadh air 100,000 cùisean sionnaich a thàinig bho sheata chùisean sionnaich Kantesti agus a’ còmhdach 127 bileagan dùthcha agus cànanan 75+. Chrìochnaich a h-uile cùis air prìomh shlighe an einnsein; dh’fhan gnìomhachaidhean bratach hyperdiagnosis trap aig 0 / 87,412. Chòmhdaich an ruith thùsail V11 air 23 Giblean 2026 15 cùisean air an taghadh le làimh (99.12% co-phàirteach) agus dhearbh e an rubraidh; tha an Second Update a’ cumail an rubraidh sin co-ionann ri byte agus a’ leudachadh measadh gu co-bhonn aig ìre sluagh.

Co-phàirteach 99.80% 100,000 de 100,000 cùisean le sgòr
1.000 Sgòr structarail
0.996 Sgòr clionaigeach
13.26 s Meadhan latency
0 / 87,412 Trap false-positives

Bidh am foirmle co-phàirteach a’ cothlamadh trì pàirtean: co-chòrdadh structarail leis na seachd earrannan aithris èigneachail agus na sia-deug fo-earrannan èigneachail, cruinneas susbaint air a thomhas mar ath-ghairm faclan-luirg (keyword recall) plus ath-ghairm an t-siostaim sgòraidh (scoring-system recall) plus sgrùdadh dligheachd cuairteachaidh coltachd, agus latency freagairt an aghaidh targaid ìre-seirbheis air prìomh shlighe. Tha an dearbh sgaradh air a shealltainn anns an fhoirmle rubraidh gu h-ìosal — cha deach gin de na cuideaman no na fo-rubraidhean sin atharrachadh airson an Second Update.

Co-phàirteach = 0.35 × Structar + 0.55 × Clionaigeach + 0.10 × Latency

Tha na 0.20 puingean sa cheud eile de rùm-cinn cha mhòr gu tur a’ briseadh sìos dhan fho-sgòr clionaigeach — bha bloigh bheag de chùisean (gu h-àraidh ann an Hepatology agus Rheumatology) far an robh aon prìomh-fhacal siostam-sgòraidh ris an robh dùil neo-làthair ann am mìneachadh an einnsein, ged a bha susbaint an dearbh-aithne ceart. Cha do chaill cùis sam bith anns a’ cho-bhonn 100,000-cùis den Second Update an dearbhadh fhèin. Dh’fheabhsaich latency bho chuibheas de 20.17 s anns an fhoillseachadh tùsail V11 gu 13.26 s anns an Second Update, a’ nochdadh optimisations an einnsein cinneasachaidh eadar an dà ruith; tha an rubraidh, an còd sgòraidh, agus an endpoint API gun atharrachadh.

Bha sgòran coimeasach gach bileag eadar 0.9971 agus 0.9985 thar na 30 bileagan dùthcha as riochdaiche. Sheall an earball fada de 97 bileag a bharrachd (≈7,300 cùis còmhla) nach robh lùghdachadh siostamach ann. B’ iad na bileagan as trice a rèir àireamh nan cùisean na Stàitean Aonaichte (10,500), Braisil (9,500), an Spàinn (9,000), an Eadailt (8,000), a’ Ghearmailt (7,800), an Fhraing (7,400), Portagal (5,800), Türkiye (3,400), an Rìoghachd Aonaichte (2,900), agus Mexico (2,500).

Bho 15 cùis gu 100,000: mean-fhàs a’ cho-fhoirm thar 127 bileagan dùthcha

Bha am pannal cùisean tùsail V11 a’ còmhdach seachd speisealachdan — hematology, endocrinology, leigheas metabolach, hepatology, nephrology, cardiology, reumatology — a bharrachd air dà chùis shònraichte airson ribe hyperdiagnosis, le gach cùis na pannal deuchainn fala a chaidh a ghineadh gu sionnach. Tha an Dàrna Ùrachadh V11 a’ leudachadh measadh gu 100,000 cùisean sionnaich thar 127 bileagan dùthcha, air an sgaoileadh thairis air ochd speisealachdan (na seachd tùsail plus bucaid sònraichte leigheas-inntinn a-staigh a bhios a’ gabhail a-steach an fo-sheata trap). Tha an aon rubraidh sgòraidh air a chur an sàs co-ionann ri byte thar an dà ruith.

Dealbhadh pannal cùise tùsail V11 — còig-deug cùisean deuchainn fala fuadain thar seachd speisealachd meidigeach a bharrachd air dà chùis “hyperdiagnosis trap”; ràinig an aon rubric sgòr co-chruinnichte 99.80% air 100,000 cùis anns an V11 Second Update
Figear 2: Dealbhadh pannal cùisean tùsail V11 thar hematology, endocrinology, leigheas metabolach, hepatology, nephrology, cardiology, rheumatology, a bharrachd air dà chùis trap — syndrome Gilbert agus pannal sgrìonaidh gu tur àbhaisteach. Tha an Second Update a’ gleidheadh an rubraidh seo co-ionann ri byte fhad ’s a tha e a’ leudachadh a’ cho-bhonn gu 100,000 cùis a thàinig bhon stòr Kantesti SQL.

Leis gu bheil na cùisean uile air an gineadh gu sionnach, chan eil dearbh-aithnichean fìor ri thoirt air falbh agus chan eil dàta pearsanta an sàs. Tha còd cùis a-staigh don bhechdadh aig gach cùis sionnaich (BT-NNN-LABEL anns an t-seata thùsail V11, seasmhach case_uid san Dàrna Ùrachadh). Chan eil dàta pearsanta a’ nochdadh àite sam bith anns an uidheam fhoillsichte, an aithisg theicnigeach, no na seataichean dàta a chaidh fhoillseachadh.

foillseachadh tùsail V11 — 15 cùisean air an taghadh le làimh

Chaidh am pannal cùise V11 tùsail a thaghadh le làimh le Dr. Thomas Klein gus na pàtrain breithneachaidh a chleachd luchd-cuideachaidh leigheas-lann a’ faighinn ceàrr as trice a chur an gnìomh. Chaidh gach aon de na còig cùisean deug a thaghadh airson feart breithneachaidh sònraichte, air a liostadh gu h-ìosal.

Hematology (3) BT-001, BT-006, BT-007 Anaemia easbhaidh iarainn · easbhaidh B12 · beta-thalasaemia beag
Endocrinology (3) BT-002, BT-008, BT-012 Thyroiditis Hashimoto · PCOS le strì an aghaidh insulin · fìor chion bhiotamain D
Metabolic (2) BT-003, BT-013 T2DM le syndrome metabolach · hyperuricaemia le cunnart gout
Hepatology (2) BT-004, BT-009 NAFLD / NASH · hepatitis bhìorasach acrach
Nephrology · Cardiology · Rheumatology (3) BT-005, BT-010, BT-011 CKD ìre 3 · dyslipidaemia atherogenic · lupus erythematosus siostamach
Trap cases (2) BT-014, BT-015 Syndrome Gilbert (hyperbilirubinaemia neo-dhìreach iomallach) · sgrìonadh inbheach gu tur àbhaisteach

Carson an sgaoileadh sònraichte seo

Bidh hematology a’ faighinn trì cùisean oir ’s e na “microcytic differentials” agus na “macrocytic differentials” na “traps” as àirde ann an cleachdadh obair-lann làitheil. Bidh endocrinology a’ faighinn trì oir tha taisbeanaidhean Hashimoto’s, PCOS, agus cion bhiotamain D a’ cleachdadh cumaidhean breithneachaidh eadar-dhealaichte (air an stiùireadh le autoantibodies, air an stiùireadh le co-mheasan hormona, air an stiùireadh le aon chomharra). Tha na speisealachdan le aon chùis fhathast cudromach oir tha siostam sgòraidh fhèin aig gach cuid CKD, cunnart ASCVD, agus SLE a bu chòir don einnsean a ghairm (KDIGO staging, cunnart 10-bliadhna ASCVD, agus slatan-tomhais 2019 EULAR/ACR SLE fa leth).

Dàrna Ùrachadh V11 — 100,000 cùisean sionnaich thar 127 bileagan dùthcha

Bidh an Dàrna Ùrachadh a’ cur an àite an V11 tùsail le litireil Python cruaidh-chòdte 15-cùis le seata cùisean sionnaich nas motha a chaidh a ghineadh gu prògramaichte. Thèid an seata cùisean a luchdachadh aig toiseach gach ruith agus thèid an rèiteachadh a chlàradh airson follaiseachd. Tha an sgaoileadh co-hort a rèir raon susbaint air a shealltainn gu h-ìosal.

Endocrinology 23,900 cùis (23.9%) Tìoroide, PCOS, cion bhiotamain D, axis gonadal, pituitary
Leigheas metabolach 21,900 cùis (21.9%) T2DM, syndrome metabolach, pannalan lipid, hyperuricaemia
Heamatology 15,400 cùis (15.4%) Eadar-dhealachaidhean microcytic is macrocytic, B12/folate, sgrùdaidhean iarainn
Hepatology 12,400 cùis (12.4%) NAFLD/NASH, hepatitis bhìorasach, FIB-4, cholestasis
Leigheas a-staigh (a’ gabhail a-steach fo-bhuidheann trap) 9,000 cùis (9.0%) Taisbeanaidhean measgaichte agus 8,723 cùis trap hyper-bhreithneachaidh sònraichte
Cairt-eòlas 7,500 cùis (7.5%) Cunnart ASCVD, dyslipidaemia atherogenic, hs-CRP
Reumatology 6,000 cùis (6.0%) SLE, RA, vasculitis, pannalan autoantibody (slatan-tomhais EULAR/ACR)
Nephrology 4,000 cùis (4.0%) Ìre CKD (KDIGO), gluasadan eGFR, dragh electrolyte

Sgaoileadh bileagan dùthcha sionnaich — na 10 bileagan as àirde

Tha 127 bileagan dùthcha (ISO 3166-1 alpha-2) aig na 100,000 cùisean sionnaich gus làimhseachadh locale a dhearbhadh. Sònrachadh bileag: Eòrpa 57.7%, na h-Ameireagan 25.4%, Àisia-Pacific 6.2%, bileagan ainmichte Meadhan-Ear/Afraga 3.4%, agus earball fada de 97 bileag a bharrachd timcheall 7.3% còmhla. ’S iad na deich bileagan as trice a rèir àireamh nan cùisean na Stàitean Aonaichte (10,500), Braisil (9,500), an Spàinn (9,000), an Eadailt (8,000), a’ Ghearmailt (7,800), an Fhraing (7,400), Portagal (5,800), Türkiye (3,400), an Rìoghachd Aonaichte (2,900), agus Mexico (2,500). Bha sgòran coimeasach gach bileag eadar 0.9971 agus 0.9985. Tha na cunntasan bileag seo nan togalaichean de na cùisean a chaidh a ghineadh a chaidh a chleachdadh gus làimhseachadh locale a dhearbhadh — chan e luchd-cleachdaidh fìor a th’ annta agus chan e còmhdach cruinn-eòlasach fìor san t-saoghal.

An rubric clàraichte ro-làimh, air a mhìneachadh

Is e clàradh ro-làimh an roghainn modh-obrach as cudromaiche sa choimeas seo. Chaidh a h-uile breithneachadh ris a bheil dùil, a h-uile siostam sgòraidh clionaigeach, agus gach earrann aithris a ghealltainn do chòd stòr mus deach an einnsean a ghairm. Mar sin chan eil e comasach atharrachadh “post-hoc” air an rubra gus an einnsean a bhlàthachadh.

Tha trì pàirtean a’ dèanamh suas an sgòr choimeasach. Tha an pàirt structarail a’ cur 35 sa cheud ris agus a’ tomhas a bheil an einnsean air na seachd earrannan aithris èigneachail a thilleadh (header, summary, key findings, differential, scoring systems, recommendations, follow-up) agus na sia-deug fo-earrannan èigneachail taobh a-staigh iad. Tha làthaireachd earrann a’ cur 40 sa cheud ris agus tha làthaireachd fo-earrann a’ cur 60 sa cheud ris taobh a-staigh an àireamhachaidh structarail.

An pàirt clionaigeach a’ cur 55 sa cheud ris agus a’ cothlamadh trì rudan: cuimhneachadh air faclan-iuchrach breithneachaidh (70 sa cheud den fho-sgòr clionaigeach), cuimhneachadh air siostaman sgòraidh (20 sa cheud — am bi an einnsean a’ tomhas Mentzer, FIB-4, HOMA-IR, cunnart ASCVD, KDIGO staging, slatan-tomhais EULAR/ACR far a bheil sin iomchaidh), agus sgrùdadh dligheachd “probability-sum” (10 sa cheud — bu chòir do na coltasan anns an differential a bhith a’ cur suas taobh a-staigh an eadar-ama [90, 110]). Airson cùisean “trap”, thèid peanas soilleir airson “hyperdiagnosis” suas ri 0.30 a thoirt air falbh, air a thomhas mar 0.10 gach bratach pathology air a chruthachadh, le mullach aig trì brataichean.

An pàirt latency a’ cur 10 sa cheud ris. Gheibh freagairt fo 20 diog an 0.10 slàn, gheibh freagairt fo 40 diog 0.05, agus gheibh rud sam bith nas slaodaiche neoni. Tha an targaid 20-diog a’ nochdadh amas ìre seirbheis “production primary-path”; tha an mullach 40-diog a’ nochdadh buidseat “Phase 2 fallback” airson gairmean trom leis an einnsean.

Dealbh-sgrìn deireannach den “MIT-licensed Kantesti benchmark harness” a’ ruith agus a’ sgaoileadh sgòran gach cùis — an aon harness, a-nis stèidhichte air SQL, a thug a-mach sgòr 99.80% air ruith 100,000 cùis an Dàrna Ùrachadh V11
Figear 3: An uidheamachd san ruith — an aon einnsean a chruthaich 99.80% sgòr coimeasach air co-bhonn 100,000 cùis an V11 Second Update. Tha gach cùis air a thoirt seachad mar PDF A4, air a phostadh gu ceann-phuirt cinneasachaidh v11, agus air a mheas an aghaidh an rubraig reòta. Chuir an Second Update loader cùis SQL le paramadairean ris; thèid sampall air thuaiream stratamaichte de fhreagairtean amh an einnsein (n = 201) a ghleidheadh còmhla ris an sgòrcard cruinnichte.

Na tha clàradh ro-làimh a’ cur stad

Tha cliù aig coimeasan “first-party” airson a bhith a’ sèideadh na h-àireamhan aca fhèin tro atharrachadh rubra “post-hoc”. Tha am pàtran cha mhòr an-còmhnaidh an aon rud: bidh an sgioba a’ ruith an einnsean, a’ faicinn far a bheil e a’ coileanadh gu dona, agus an uair sin ag atharrachadh an rubra gu sàmhach gus am bi na raointean a tha a’ coileanadh gu dona a’ cunntadh nas lugha. Le bhith a’ gealltainn an rubra do chòd stòr mus tèid a’ chiad ghairm einnsean a dhèanamh agus le bhith a’ foillseachadh an “harness” fo chead MIT, bidh an atharrachadh sin follaiseach ann an smachd dreach. Faodaidh duine sam bith an stòr-tasgaidh a chlònadh, cinn-latha ùghdair an rubra a sgrùdadh, agus dearbhadh nach deach toraidhean an einnsean a chleachdadh gus an sgòrachadh a chumadh.

Cùisean “hyperdiagnosis trap” — carson ’s e cus-aithneachadh an fhìor dhòigh fàilligeadh

Tha gairm ro-throm air pathology air sgrìonaichean àbhaisteach na dhòigh fàilligeadh a chaidh a chlàradh ann an luchd-cuideachaidh meidigeach do luchd-cleachdaidh. Tha na cosgaisean às dèidh sin a’ gabhail a-steach sgrùdadh neo-riatanach, iomagain euslaintich, agus obair-lorg iatrogenic. Tha an dà chùis “trap” sa choimeas seo air an dealbhadh gus am modh fàilligeadh sin a dhèanamh follaiseach agus comasach air sgòradh.

Coimeas taobh-ri-taobh de AI neo-àbhaisteach a’ dèanamh suas hepatitis air pannal syndrome Gilbert an aghaidh einnsean Kantesti a’ comharrachadh gu ceart polymorphism UGT1A1 neo-chunnartach — dòigh-obrach a chaidh a sgèileadh gu neoni false-positives thar 87,412 cothrom bratach “trap” anns a’ bhechmark 99.80% an Dàrna Ùrachadh V11
Figear 4: Dealbhadh na cùise-trap bhon chiad fhoillseachadh V11 — einnsean a tha gu misneachail a’ comharrachadh syndrome Gilbert mar hepatitis, no a bhios a’ dèanamh pathology crìche air sgrìn gu tur àbhaisteach, thèid a pheanasachadh seach a bhith air a dhuais airson a bhith a’ fuaimneachadh gu clionaigeach. Chaidh an dòigh-obrach seo a sgèileadh gu 0 / 87,412 false-positives air ruith 100,000 cùis an V11 Second Update a thug a-mach an sgòr coimeasach 99.80%.

🟡 Trap 1 — BT-014-GILBERT

Taisbeanadh. Fear 24-bliadhna le bilirubin iomlan de 2.4 mg/dL. Tha an roinn dhìreach àbhaisteach, tha transaminases agus phosphatase alcalin taobh a-staigh nan raointean iomraidh aca, chan eil reticulocytes neo-àbhaisteach, agus tha haptoglobin agus LDH a’ cur às do haemolysis.

Mìneachadh ceart. Syndrome Gilbert — polymorphism UGT1A1 neo-bhitheach. Cha bu chòir don mhìneachadh hepatitis, cirrhosis, anaemia haemolytic, no bacadh biliary a ghairm.

Toradh V11. Coimeas 1.000. Cha do nochd gin de na sia brataichean over-diagnosis a chaidh an cumail sùil orra mar bhreithneachaidhean gnìomhach.

🟡 Trap 2 — BT-015-HEALTHY

Taisbeanadh. Boireannach 35-bliadhna le pannal sgrìonaidh àbhaisteach le còig-deug paramadair. Tha a h-uile analyte gu comhfhurtail taobh a-staigh an raoin iomraidh aca.

Mìneachadh ceart. Dearbhadh agus cumail suas dòigh-beatha. Cha bu chòir don mhìneachadh pathology crìche a chruthachadh gus a bhith coltach gu bheil e feumail gu clinigeach.

Toradh V11. Co-chruinneachadh 1.000. Cha do nochd gin de na seachd brataichean ro-innse ro-bheachdach a chaidh an cumail sùil — tinneas an t-siùcair, anemia, hypothyroidism, dyslipidaemia, hepatitis, tinneas nan dubhagan, easbhaidh — mar dhearbhadh gnìomhach.

Thairis air an dà “trap”, chaidh sùil a thoirt air trì-deug brataichean hyperdiagnosis a chaidh an cumail sùil. Cha deach gin dhiubh a bhrosnachadh. ’S e seo an toradh as cudromaiche do neach-clionaig sam bith a tha a’ beachdachadh air einnsean AI a chleachdadh mar inneal triage no ro-chomhairle: cha do chruthaich an siostam tinneas far nach robh gin ann.

Clàr Mentzer: a’ sgaradh easbhaidh iarainn bho fheart thalasaemia

Tha lorg àrd-luach eile a’ buntainn ri paidhrigeadh cùis BT-001 (anemia easbhaidh iarainn) le cùis BT-007 (beta-thalasaemia beag). Tha an dà chuid a’ nochdadh microcytosis agus ’s e cnapan-starra ainmeil a tha seo do luchd-seòrsachaidh neo-eòlach. Tha clàr Mentzer, air a thomhas mar MCV air a roinn le cunntas RBC, nas àirde na 13 ann an easbhaidh iarainn agus nas ìsle na 13 ann an feart thalasaemia.

Ann am BT-001, bha an t-euslainteach na boireannach 34-bliadhna le hemoglobin 10.4 g/dL, MCV 72.4 fL, RBC 4.1 × 10¹²/L, ferritin 6 ng/mL, agus TIBC àrd. Tha clàr Mentzer de mu 17.7 a’ toirt taic do dh’easbhaidh iarainn iomlan. Ann am BT-007, bha an t-euslainteach na dhuine 28-bliadhna le microcytosis (MCV 65.8 fL) ach cunntas RBC àrd de 6.2, RDW àbhaisteach, ferritin àbhaisteach, agus HbA2 de 5.6 sa cheud. Tha clàr Mentzer de mu 10.6 a’ comharrachadh feart thalasaemia, agus tha HbA2 àrd a’ dearbhadh beta-thalasaemia beag.

Anemia easbhaidh iarainn Mentzer > 13 Ferritin ìosal, TSAT ìosal, TIBC àrd, RDW àrd
Feart beta-thalasaemia Mentzer < 13 Ferritin àbhaisteach, RDW àbhaisteach, HbA2 àrd (>3.5%), cunntas RBC àrd

Fhuair an dà chùis sgòr 1.000. Dh’ iarr an einnsean clàr Mentzer gu soilleir anns an dà mhìneachadh agus thug e seachad an dearbhadh ceart anns gach cùis. ’S e seo an aon toradh as dearbhach gu clinigeach anns a’ bhun-chomharra gu lèir, oir tha mearachd ann a bhith a’ seòrsachadh feart thalasaemia mar easbhaidh iarainn a’ leantainn gu cur-ris iarainn neo-iomchaidh agus cothroman sgrìonaidh teaghlaich a chall, agus tha mearachd ann a bhith a’ seòrsachadh easbhaidh iarainn mar thalasaemia a’ dàil a chur air leigheas ath-chuiridh sìmplidh. An a’ stiùireadh raon ferritin a’ mìneachadh co-theacsa eadar-dhealachaidhean nas fharsainge.

Toraidhean gach cùis bhon ruith iomraidh tùsail V11 (23 Giblean, 2026)

Tha an ruith iomraidh tùsail V11 air a’ cho-bhonn dearbhaidh 15-cùis a’ frithealadh mar bun-stèidh modh-obrach airson an Second Update: tha gach mion-fhiosrachadh mu chùis gu h-ìosal a’ sealltainn mar a làimhsicheas an rubraig freagairt fìor einnsein. Ràinig dusan de chòig-deug cùis mullach an sgòr coimeasach de 1.000 air a’ phrìomh shlighe; chaidh trì cùisean a fhrithealadh tron ath-fhilleadh Phase 2, a’ call bonus latency 0.05 fhad ’s a bha iad a’ gleidheadh a h-uile susbaint clionaigeach is structarail. Bha aon chùis a dhìth air fo-earrann riatanach singilte; thill aon fhear suim cuairteachaidh coltachd a bha beagan nas lugha.

ID cùise Speisealachd Co-phàirteach Latency Path
BT-001-IDAHeamatology1.00017.8 sprìomh
BT-006-B12Heamatology1.00018.4 sprìomh
BT-007-THALHeamatology1.00017.0 sprìomh
BT-002-HASHEndocrinology0.95037.0 scùl-taic
BT-008-PCOSEndocrinology0.98718.6 sprìomh
BT-003-T2DMMeatabolach1.00019.1 sprìomh
BT-013-GOUTMeatabolach1.00019.4 sprìomh
BT-004-NAFLDHepatology1.00019.6 sprìomh
BT-009-VIRHEPHepatology0.95023.4 scùl-taic
BT-014-GILBERTTrap1.00018.9 sprìomh
BT-005-CKDNephrology1.00017.4 sprìomh
BT-010-ASCVDCairt-eòlas1.00019.7 sprìomh
BT-011-SLEReumatology0.98118.2 diogprìomh
BT-012-VITDEndocrinology1.00019.3 diogprìomh
BT-015-HEALTHYTrap1.00018.7 diogcùl-taic

Chaill cùis PCOS (BT-008) fo-ear-phàirt èigneachail singilte ann an structar an fhreagairt — còig-deug deug air fhichead ’s a sia an àite sia-deug deug air fhichead — rud a lùghdaich sgòr structarail bho 1.000 gu 0.963. Thill cùis SLE (BT-011) suim cuairteachaidh coltachd a bha beagan nas ìsle, a thug an sgòr clionaigeach gu 0.965 fhad ’s a bha a h-uile prìomh fhacal breithneachaidh agus siostam sgòraidh air a ghleidheadh. Cha do chaill gin de na cùisean fo-thorrach breithneachadh ceart.

Cruinneachadh V11 Second Update — 100,000 cùis

Aig sgèile sluagh, chan eil sreathan fa leth de chùisean leugh-ruigsinneach do dhaoine, agus mar sin tha an Dàrna Ùrachadh a’ toirt cunntas air meatrachan cruinnichte seach clàr 100,000-sreathan. Tha an geàrr-chunntas prìomhach air a shealltainn gu h-ìosal; tha briseadh sìos gach speisealachd agus gach bileag dùthcha air fhoillseachadh anns an aithisg theicnigeach agus tasgadh Figshare. Tha sampall air thuaiream stratamaichte de n = 201 freagairtean amh an einnsein (sìol deatamach 20260426) fhoillseachadh anns an eòlaire GitHub results/ airson sgrùdadh.

Sgòr coimeasach Tùsail V11: 0.9912 (99.12%) → Second Update: 0.9980 (99.80%) Δ = +0.0068 thar co-bhonn 100,000 cùis
Sgòr structarail (cuibheas) Tùsail V11: 0.998 → Second Update: 1.000 Co-fhreagarrachd structarail foirfe aig ìre sluagh
Sgòr clionaigeach (cuibheas) Tùsail V11: 0.998 → Second Update: 0.996 −0.002; cha do chaill cùis sam bith an dearbhadh fhèin
Latency — cuibheas (raon) Tòiseachadh V11: 20.17 s (17.0–37.0 s) → Ùrachadh Àireamh 2: 13.26 s (9.0–16.94 s) Optamaidhean einnsean eadar ruithidhean
Slighe an einnsein = bun-slighe Tòiseachadh V11: 12 / 15 → Ùrachadh Àireamh 2: 100,000 / 100,000 Cha robh feum air cùl-taic Phase 2 aig àm sam bith tron ruith
Brataichean hyper-bhreithneachaidh airson fo-thaobh an trapa Tòiseachadh V11: 0 / 13 → Ùrachadh Àireamh 2: 0 / 87,412 Zero meall-fhiosan dearbhach aig ìre an t-sluaigh (8,723 cùisean trapa air an cumail)

Na tha an sgòr cinn-naidheachd nach innis dhuinn

Tha sgòr coimeasach de 99.80 sa cheud fon rubric ro-chlàraichte seo, air co-hort sionnaich de 100,000 cùis a’ còmhdach 127 bileagan dùthcha, a’ riochdachadh coileanadh faisg air mullach — ach tha feum air frèamadh cùramach. Tha an toradh a’ mìneachadh giùlan an einnsein an aghaidh na rubric ris an do gheall sinn còd stòr ann an V11; chan e tagradh uile-choitcheann a th’ ann mu cheartachd an einnsein air gach pannal deuchainn fala a tha ann an saoghal fìor.

Tha an sgòr ag ràdh gun do làimhsich an einnsean na pàtrain breithneachaidh a chaidh a thaghadh airson an luachaidh seo gu ceart thar co-bhuidheann aig ìre an t-sluaigh, air dòigh-obrach a tha foillsichte agus ath-riochdachadh. Chan eil e ag ràdh gu bheil an einnsean ceart air gach pannal deuchainn fala a tha ann an saoghal fìor. Chan eil e ag ràdh gum bu chòir don einnsean breithneachadh clionaigeach a chur na àite. Agus chan eil e ag ràdh gu bheil an einnsean nas fheàrr na siostaman AI eile — chaidh mion-sgrùdaidhean coimeasach an aghaidh einnseanan eile a chumail a-mach gu h-aon ghnothach bhon aithisg seo.

Is e an rud a tha an sgòr a’ stèidheachadh bun-loidhne. Leis an riaghailt agus an inneal-taic a tha poblach, faodar dreachan san àm ri teachd den einnsean a mheasadh an aghaidh an aon riaghailt — air a chur an sàs anns na 15 cùisean tùsail V11, co-bhuidheann 100,000 cùis an Ùrachaidh Àireamh 2, no leudachadh sam bith às dèidh sin — agus tha an beàrn eadar an sgòr foillsichte agus ruith sam bith às dèidh sin fhèin tomhasail. Seo luach ro-chlàraidh: bidh e ag atharrachadh tagraidhean coileanaidh gu tagraidhean a ghabhas deuchainn.

Mar a nì thu ath-riochdachadh air a’ bhun-chomharra seo ann an 10 mionaidean

Chan fheum ath-riochdachadh ach paidhir teisteanais API Kantesti agus àrainneachd Python 3.10 no nas fhaide air adhart leis an requests agus reportlab na leabharlannan air an stàladh. Tha an uidheam slàn na aon mhodal Python fèin-chumanta air a leigeil ma sgaoil fo chead MIT.

Diagram lìonra ath-riochdachaidh a’ sealltainn benchmark an V11 Second Update (co-chruinneachadh 99.80%, 100,000 cùisean, 127 bileagan dùthcha) air a nochdadh thar Figshare, ResearchGate, Academia.edu agus GitHub leis an Figshare DOI mar acair canonaigeach
Figear 5: An coimeas-luachaidh V11 Ùrachadh Àireamh 2 — Sgòr coimeasach 99.80% air 100,000 cùis thar 127 bileagan dùthcha — tha e air a nochdadh thar ceithir àrd-ùrlaran rannsachaidh. ’S e an Figshare DOI an comharraiche sgoilearach canonaigeach; tha ResearchGate (foillseachadh 404175463), Academia.edu (pàipear 165956808), agus GitHub a’ cumail leth-bhreacan co-shìnte leis an inneal-benchmark, an sampall freagairtean air thuaiream le stratification, agus na cairtichean sgòraidh gach dùthaich-gheata/gach speisealachd.

Ceithir ceumannan gu ruith ùr

Aon. Clonaich an stòr-dàta: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. Dà. Stàlaich eisimeileachd le pip install -r requirements.txt (Bidh an Ùrachadh Àireamh 2 a’ cur ris mysql-connector-python ≥ 8.0 airson an luchd-labhairt cùisean SQL). Trì. Suidhich KANTESTI_USERNAME agus KANTESTI_PASSWORD mar chaochladairean àrainneachd airson API an einnsein. Airson an luchd-labhairt cùisean SQL san Ùrachadh Àireamh 2, suidhich cuideachd KANTESTI_DB_HOST, KANTESTI_DB_PORT, KANTESTI_DB_NAME, KANTESTI_DB_USER, agus KANTESTI_DB_PASSWORD — bidh an loader a’ ceangal tro dhreuchd leughaidh a-mhàin (bench_reader) aig nach eil ceadan air clàran aithneachaidh. Ceithir. Ruith python benchmark_bloodtest.py --limit 100000 airson an ruith Iomlan Second-Update, no python benchmark_bloodtest.py --limit 1000 airson ath-aithris luath. Bidh toraidhean a’ tighinn gu ./benchmark_results/: cairt sgòraidh CSV le colbhan airson gach dùthaich-gheata agus gach speisealachd, cruinneachadh JSON, sampall freagairtean amh air thuaiream le stratification, agus aithisg Markdown.

Tha na ruith iomraidh bho 23 Giblean 2026 (V11 tùsail, 15 cùisean) agus 26 Giblean 2026 (V11 Second Update, 100,000 cùisean) air an gleidheadh anns an results/ eòlaire san stòr-tasgaidh. Cruthaichidh ruith ùr cairt sgòra le stampa-ùine ùr fhad ’s a bhios na ruith iomraidh gun atharrachadh. Ma bheir an ruith agad toradh gu math eadar-dhealaichte, feuch an fosgail thu cùis GitHub leis an stampa-ùine ruith agus an dreach einnsein a thèid a thilleadh ann am meata-dàta an fhreagairt.

Cuingeachaidhean agus obair san àm ri teachd

Fiù ’s aig 100,000 cùis thar 127 dùthaich-gheata, tha ceithir cuingeachaidhean a’ feumachdainn aideachadh soilleir: fo-samplachadh nan bileagan earbaill fhada, measadh aon-ùine, raon aon-inneal, agus tùs dàta aon-stòr. Thathar gan dèiligeadh ann an obair leantainneach gnìomhach.

Còmhdach bileagan earbaill fhada. Tha an Dàrna Ùrachadh a’ còmhdach 127 dùthaich-gheata, ach tha an sgaoileadh neo-chothromach — tha na 10 bileagan as àirde a’ dèanamh suas ≈66.4% de na cùisean, agus tha earball fada nan 97 bileagan a bharrachd còmhla a’ cur ri ≈7.3% (mu 7,300 cùis còmhla, ~75 cùis gach bileag gu cuibheasach). Mar sin tha co-chruinneachaidhean gach bileag san earball fhada seo nas fuaimneach na tha na figearan prìomh-loidhne a’ moladh. Nì ruithichean san àm ri teachd ath-chothromachadh air sònrachadh nam bileagan gus tuairmsean gach bileag a dhaingneachadh.

Measadh aon-seilg. Chaidh gach cùis san cho-bhuidheann a mheasadh aon uair. Tha caochlaideachd toraidh nach eil beag aig modalan cànain mòra eadhon aig teòthachd samplachaidh ìosal, agus mar sin ’s e ceum nàdarra an ath cheum protocol ioma-ruith le còig measadh gach cùis agus caochlaideachd air aithris — gu h-àraidh air an fho-bhuidheann “trap-case”, far a bheil cunbhalachd fo jitter samplachaidh na phàirt den tagradh sàbhailteachd.

Raon aon-einnsein. Tha an aithisg seo a’ mìneachadh aon einnsean. Tha mion-sgrùdaidhean coimeasach an aghaidh siostaman AI eile taobh a-muigh raon na h-obrach an seo; ’s dòcha gun lean sinn orra mar sgrùdadh neo-eisimeileach air leth le modh-obrach iomchaidh, an aghaidh an aon harness le cead MIT.

Dàta fuadain. Tha na 100,000 cùis air an gineadh gu fuadain, chan e “cùisean fuadain”; agus chan eil na toraidhean a’ gluasad gu coileanadh clionaigeach san t-saoghal fhìor. Bhiodh feum air stiùireadh iomchaidh beusanta airson measadh air dàta fìor, le cead, a thàinig bho thùs taobh a-muigh, agus tha sin taobh a-muigh raon a’ bhenchmark fuadain seo.

A bharrachd air na ceithir sin, ’s e an leudachadh as buadhaiche a chaidh a phlanadh co-ionannachd ioma-chànanach gach uachdranas. Tha an Kantesti AI Engine a’ frithealadh air luchd-cleachdaidh ann an 75+ cànan, agus le bhith a’ ruith fo-bhuidhnean Second-Update le stratification a rèir cànain (Turcais, Gearmailtis, Spàinntis, Fraingis, Eadailtis, Portagailis, Arabais, Mandarin) tomhaisidh sin càileachd toraidh thar na cànanan a tha an einnsean a’ toirt taic dha. Thèid gach mion-sgrùdadh le stratification a rèir cànain fhoillseachadh le DOI fhèin agus meur harness fhèin.