Carson a tha am bun-mheasadh seo ann agus dè tha e a’ dèanamh deuchainn

Tha sgrùdadh fala AI le taic a’ sìor chleachdadh ann an sruthan-obrach luchd-cleachdaidh is clionaigeach, ach tha frèaman measadh ath-riochdachail a tha freagarrach do leigheas-lann fhathast tearc. Chan e na ceistean a tha cudromach san t-suidheachadh seo an fheadhainn a tha air an còmhdach le bun-chomharraichean coitcheann airson ceistean is freagairtean meidigeach: an urrainn do einnsean iarann easbhaidh a sgaradh bho thalasaemia trait nuair a tha an mean corpuscular volume co-ionann, a bheil e a’ dèanamh cus-diagnosis air sionndrom Gilbert mar hepatitis, agus a bheil e a’ cruthachadh pathology ann am pannal sgrìonaidh gu tur àbhaisteach?

Diagram sruth-obrach clàr-ìre ro-foillsichte a’ sealltainn mar a thathar a’ measadh Inneal AI Kantesti an aghaidh slatan-tomhais sgòraidh reòta
Figear 1: Ailtireachd a’ bhun-chomharra — tha a h-uile cùis, a h-uile prìomh-fhacal, agus a h-uile siostam sgòraidh stèidhichte sa chòd stòr mus fhaic an einnsean eadhon aon PDF. Chan eil tuning rubric post-hoc comasach a rèir dealbhaidh.

Mar as trice bidh pannal singilte deuchainn fala a’ toirt gu leòr comharra airson grunn mhìneachaidhean farpaiseach a shuidheachadh, agus is e obair an lighiche a tha a’ mìneachadh na mìneachaidhean sin a chuideamachadh an aghaidh a chèile seach freagairt leabhar-teacsa a tharraing a-mach. Faodaidh einnsean a tha math air cùisean leabhar-teacsa fhathast fàiligeadh air na cùisean a tha cudromach: na claonaidhean ann an breithneachadh eadar-dhealaichte, na caochlaidhean neo-chunnartach a tha coltach eagallach nuair a tha iad nan aonar, agus na pannalan gu tur àbhaisteach a tha a’ tàladh luchd-cuideachaidh misneachail gu bhith a’ dèanamh pathology suas.

Chaidh a’ bhun-chomharra seo a thogail timcheall air na modhan fàilligeadh sin. Chaidh gach aon de na còig-deug cùisean a thaghadh airson feart breithneachaidh sònraichte: microcytosis le dìth iarainn a dh’fheumar a chumail air leth bho trait beta-thalassaemia le mean corpuscular volume co-ionann, taisbeanadh syndrome Gilbert far nach eil ach aon neo-àbhaisteachd—hyperbilirubinaemia neo-dhìreach iomallach—agus pannal sgrìonaidh le còig-deug paramadair far a bheil a h-uile analyte taobh a-staigh an raoin iomraidh aige. Tha an rubrig a’ duaisachadh einnseanan a leughas gach cùis air na cumhaichean fhèin agus a’ peanasachadh einnseanan a ruigeas breithneachadh misneachail far nach eil breithneachadh mar sin iomchaidh.

Mar Thomas Klein, MD, thagh mi am pannal cùisean oir ’s iad na pàtrain sin a chì mi gu bheil luchd-cuideachaidh leigheas-lannsaidh-lann-lann (laboratory-medicine) a’ faighinn ceàrr as trice. Chan e "a bhith a" call galar tearc” an modh fàilligeadh daor—’s e pathology àbhaisteach a chruthachadh ann an euslaintich aig nach eil e. Ar Dearbhadh Meidigeach hub a’ mìneachadh an frèam nas fharsainge; tha an duilleag seo a’ mìneachadh a thoradh cleachdaidh air an einnsean V11.

Ruith iomraidh as ùire — V11 (Giblean 2026)

Rinn ruith iomraidh Giblean 2026 den Kantesti AI Engine V11 sgòr co-phàirteach de 99.12% air an rubrig ro-chlàraichte le còig-deug cùisean. Fhuair an dà chùis “trap” hyperdiagnosis sgòr aig a’ mhullach. Chaidh clàr-innse Mentzer a chur an sàs gu ceart anns an eadar-dhealachadh eadar dìth iarainn agus thalassaemia.

Co-phàirteach 99.12% 15 de 15 cùisean fhuair sgòr
0.998 Sgòr structarail
0.998 Sgòr clionaigeach
20.17 s Meadhan latency
0 / 13 Trap false-positives

Bidh am foirmle co-phàirteach a’ cothlamadh trì pàirtean: co-chòrdadh structarail leis na seachd earrannan aithris èigneachail agus na sia-deug fo-earrannan èigneachail, cruinneas clionaigeach air a thomhas mar ath-ghairm faclan-luirg (keyword recall) plus ath-ghairm an t-siostaim sgòraidh (scoring-system recall) plus sgrùdadh dligheachd cuairteachaidh coltachd, agus latency freagairt an aghaidh an targaid prìomh-ìre seirbheis 20-diog. Tha an dearbh sgaradh air a shealltainn anns an fhoirmle rubrig gu h-ìosal.

Co-phàirteach = 0.35 × Structar + 0.55 × Clionaigeach + 0.10 × Latency

Cha mhòr gu tur tha na 0.88 puingean sa cheud a tha air fhàgail de dh’fhuasgladh (headroom) a’ briseadh sìos gu call latency—thug trì gairmean cùl-taic (fallback) Ìre 2 aig −0.05 gach fear, gu h-iomlan, mu 0.60 de na 0.88 puingean den easbhaidh—chan ann gu susbaint clionaigeach. Cha do chaill an einnsean breithneachadh ceart air gin de na còig cùisean deug; far an do thuit e goirid, rinn e sin le bhith a’ toirt beagan nas fhaide na an targaid phrìomh-shlighe 20 diog ann am mion-roinn bheag de na gairmean.

Còig-deug cùis thar seachd speisealachdan meidigeach

Tha am pannal cùise a’ còmhdach seachd speisealachdan—hematology, endocrinology, metabolic medicine, hepatology, nephrology, cardiology, rheumatology—agus cuideachd dà chùis shònraichte airson “hyperdiagnosis trap”. Tha gach cùis na chlàr fìor euslaintich air a dhì-aithneachadh, air a tharraing à tasglann dàta clionaigeach Kantesti fo chead fiosraichte sgrìobhte.

Mapa còmhdaich de chòig cùisean deug fala gun urra air an sgaoileadh thar seachd speisealachdan meidigeach, a bharrachd air cùisean ribe hyperdiagnosis
Figear 2: Sgaoileadh chùisean thar hematology, endocrinology, metabolic medicine, hepatology, nephrology, cardiology, rheumatology, a bharrachd air dà chùis “trap”—syndrome Gilbert agus pannal sgrìonaidh gu tur àbhaisteach.

Chaidh dì-aithneachadh a dhèanamh fo dhòigh-obrach Safe Harbor: chaidh na h-uile comharraichean dìreach a thoirt air falbh no an cur nan àite, agus chaidh còd cùise a shònrachadh do gach clàr anns an fhoirm BT-NNN-LABEL. Chaidh giullachd a dhèanamh a rèir GDPR Artaigil 9(2)(j) airson rannsachadh saidheansail le dìonan iomchaidh, agus na h-aon ullachaidhean co-ionann ann an UK GDPR. Chan eil fiosrachadh sam bith a dh’fhaodadh aithne pearsanta a dhèanamh ri fhaicinn an àite sam bith anns a’ chùis-luachaidh a chaidh fhoillseachadh, anns an aithisg theicnigeach, no anns na seataichean dàta a chaidh an leigeil ma sgaoil.

Hematology (3) BT-001, BT-006, BT-007 Anaemia easbhaidh iarainn · easbhaidh B12 · beta-thalasaemia beag
Endocrinology (3) BT-002, BT-008, BT-012 Thyroiditis Hashimoto · PCOS le strì an aghaidh insulin · fìor chion bhiotamain D
Metabolic (2) BT-003, BT-013 T2DM le syndrome metabolach · hyperuricaemia le cunnart gout
Hepatology (2) BT-004, BT-009 NAFLD / NASH · hepatitis bhìorasach acrach
Nephrology · Cardiology · Rheumatology (3) BT-005, BT-010, BT-011 CKD ìre 3 · dyslipidaemia atherogenic · lupus erythematosus siostamach
Trap cases (2) BT-014, BT-015 Syndrome Gilbert (hyperbilirubinaemia neo-dhìreach iomallach) · sgrìonadh inbheach gu tur àbhaisteach

Carson an sgaoileadh sònraichte seo

Bidh hematology a’ faighinn trì cùisean oir ’s e na “microcytic differentials” agus na “macrocytic differentials” na “traps” as àirde ann an cleachdadh obair-lann làitheil. Bidh endocrinology a’ faighinn trì oir tha taisbeanaidhean Hashimoto’s, PCOS, agus cion bhiotamain D a’ cleachdadh cumaidhean breithneachaidh eadar-dhealaichte (air an stiùireadh le autoantibodies, air an stiùireadh le co-mheasan hormona, air an stiùireadh le aon chomharra). Tha na speisealachdan le aon chùis fhathast cudromach oir tha siostam sgòraidh fhèin aig gach cuid CKD, cunnart ASCVD, agus SLE a bu chòir don einnsean a ghairm (KDIGO staging, cunnart 10-bliadhna ASCVD, agus slatan-tomhais 2019 EULAR/ACR SLE fa leth).

An rubric clàraichte ro-làimh, air a mhìneachadh

Is e clàradh ro-làimh an roghainn modh-obrach as cudromaiche sa choimeas seo. Chaidh a h-uile breithneachadh ris a bheil dùil, a h-uile siostam sgòraidh clionaigeach, agus gach earrann aithris a ghealltainn do chòd stòr mus deach an einnsean a ghairm. Mar sin chan eil e comasach atharrachadh “post-hoc” air an rubra gus an einnsean a bhlàthachadh.

Tha trì pàirtean a’ dèanamh suas an sgòr choimeasach. Tha an pàirt structarail a’ cur 35 sa cheud ris agus a’ tomhas a bheil an einnsean air na seachd earrannan aithris èigneachail a thilleadh (header, summary, key findings, differential, scoring systems, recommendations, follow-up) agus na sia-deug fo-earrannan èigneachail taobh a-staigh iad. Tha làthaireachd earrann a’ cur 40 sa cheud ris agus tha làthaireachd fo-earrann a’ cur 60 sa cheud ris taobh a-staigh an àireamhachaidh structarail.

An pàirt clionaigeach a’ cur 55 sa cheud ris agus a’ cothlamadh trì rudan: cuimhneachadh air faclan-iuchrach breithneachaidh (70 sa cheud den fho-sgòr clionaigeach), cuimhneachadh air siostaman sgòraidh (20 sa cheud — am bi an einnsean a’ tomhas Mentzer, FIB-4, HOMA-IR, cunnart ASCVD, KDIGO staging, slatan-tomhais EULAR/ACR far a bheil sin iomchaidh), agus sgrùdadh dligheachd “probability-sum” (10 sa cheud — bu chòir do na coltasan anns an differential a bhith a’ cur suas taobh a-staigh an eadar-ama [90, 110]). Airson cùisean “trap”, thèid peanas soilleir airson “hyperdiagnosis” suas ri 0.30 a thoirt air falbh, air a thomhas mar 0.10 gach bratach pathology air a chruthachadh, le mullach aig trì brataichean.

An pàirt latency a’ cur 10 sa cheud ris. Gheibh freagairt fo 20 diog an 0.10 slàn, gheibh freagairt fo 40 diog 0.05, agus gheibh rud sam bith nas slaodaiche neoni. Tha an targaid 20-diog a’ nochdadh amas ìre seirbheis “production primary-path”; tha an mullach 40-diog a’ nochdadh buidseat “Phase 2 fallback” airson gairmean trom leis an einnsean.

Glacadh-sgrìn deireannach den inneal-benchmark le cead MIT aig Kantesti a’ ruith agus a’ sgaoileadh sgòran gach cùis
Figear 3: An “harness” ann an cur gu bàs. Tha gach cùis air a thoirt seachad gu A4 PDF, air a phostadh gu puing-deireadh v11 na riochdachaidh, agus air a sgòradh an aghaidh an rubra reòta. Thèid a h-uile freagairt amh a shàbhaladh còmhla ris an sgòrcard cruinnichte.

Na tha clàradh ro-làimh a’ cur stad

Tha cliù aig coimeasan “first-party” airson a bhith a’ sèideadh na h-àireamhan aca fhèin tro atharrachadh rubra “post-hoc”. Tha am pàtran cha mhòr an-còmhnaidh an aon rud: bidh an sgioba a’ ruith an einnsean, a’ faicinn far a bheil e a’ coileanadh gu dona, agus an uair sin ag atharrachadh an rubra gu sàmhach gus am bi na raointean a tha a’ coileanadh gu dona a’ cunntadh nas lugha. Le bhith a’ gealltainn an rubra do chòd stòr mus tèid a’ chiad ghairm einnsean a dhèanamh agus le bhith a’ foillseachadh an “harness” fo chead MIT, bidh an atharrachadh sin follaiseach ann an smachd dreach. Faodaidh duine sam bith an stòr-tasgaidh a chlònadh, cinn-latha ùghdair an rubra a sgrùdadh, agus dearbhadh nach deach toraidhean an einnsean a chleachdadh gus an sgòrachadh a chumadh.

Cùisean “hyperdiagnosis trap” — carson ’s e cus-aithneachadh an fhìor dhòigh fàilligeadh

Tha gairm ro-throm air pathology air sgrìonaichean àbhaisteach na dhòigh fàilligeadh a chaidh a chlàradh ann an luchd-cuideachaidh meidigeach do luchd-cleachdaidh. Tha na cosgaisean às dèidh sin a’ gabhail a-steach sgrùdadh neo-riatanach, iomagain euslaintich, agus obair-lorg iatrogenic. Tha an dà chùis “trap” sa choimeas seo air an dealbhadh gus am modh fàilligeadh sin a dhèanamh follaiseach agus comasach air sgòradh.

Coimeas taobh ri taobh de AI neo-chùramach a’ dèanamh hepatitis air pannal syndrome Gilbert an coimeas ri einnsean Kantesti a’ comharrachadh gu ceart polymorphism neo-chunnartach UGT1A1
Figear 4: Dealbhadh nan cùisean “trap”. Bidh einnsean a tha gu misneachail a’ comharrachadh syndrome Gilbert mar hepatitis, no a tha a’ cruthachadh pathology crìche air sgrìn gu tur àbhaisteach, air a pheanasachadh — chan ann air a dhuaisachadh airson fuaim clionaigeach.

🟡 Trap 1 — BT-014-GILBERT

Taisbeanadh. Fear 24-bliadhna le bilirubin iomlan de 2.4 mg/dL. Tha an roinn dhìreach àbhaisteach, tha transaminases agus phosphatase alcalin taobh a-staigh nan raointean iomraidh aca, chan eil reticulocytes neo-àbhaisteach, agus tha haptoglobin agus LDH a’ cur às do haemolysis.

Mìneachadh ceart. Syndrome Gilbert — polymorphism UGT1A1 neo-bhitheach. Cha bu chòir don mhìneachadh hepatitis, cirrhosis, anaemia haemolytic, no bacadh biliary a ghairm.

Toradh V11. Coimeas 1.000. Cha do nochd gin de na sia brataichean over-diagnosis a chaidh an cumail sùil orra mar bhreithneachaidhean gnìomhach.

🟡 Trap 2 — BT-015-HEALTHY

Taisbeanadh. Boireannach 35-bliadhna le pannal sgrìonaidh àbhaisteach le còig-deug paramadair. Tha a h-uile analyte gu comhfhurtail taobh a-staigh an raoin iomraidh aca.

Mìneachadh ceart. Dearbhadh agus cumail suas dòigh-beatha. Cha bu chòir don mhìneachadh pathology crìche a chruthachadh gus a bhith coltach gu bheil e feumail gu clinigeach.

Toradh V11. Co-chruinneachadh 1.000. Cha do nochd gin de na seachd brataichean ro-innse ro-bheachdach a chaidh an cumail sùil — tinneas an t-siùcair, anemia, hypothyroidism, dyslipidaemia, hepatitis, tinneas nan dubhagan, easbhaidh — mar dhearbhadh gnìomhach.

Thairis air an dà “trap”, chaidh sùil a thoirt air trì-deug brataichean hyperdiagnosis a chaidh an cumail sùil. Cha deach gin dhiubh a bhrosnachadh. ’S e seo an toradh as cudromaiche do neach-clionaig sam bith a tha a’ beachdachadh air einnsean AI a chleachdadh mar inneal triage no ro-chomhairle: cha do chruthaich an siostam tinneas far nach robh gin ann.

Clàr Mentzer: a’ sgaradh easbhaidh iarainn bho fheart thalasaemia

Tha lorg àrd-luach eile a’ buntainn ri paidhrigeadh cùis BT-001 (anemia easbhaidh iarainn) le cùis BT-007 (beta-thalasaemia beag). Tha an dà chuid a’ nochdadh microcytosis agus ’s e cnapan-starra ainmeil a tha seo do luchd-seòrsachaidh neo-eòlach. Tha clàr Mentzer, air a thomhas mar MCV air a roinn le cunntas RBC, nas àirde na 13 ann an easbhaidh iarainn agus nas ìsle na 13 ann an feart thalasaemia.

Ann am BT-001, bha an t-euslainteach na boireannach 34-bliadhna le hemoglobin 10.4 g/dL, MCV 72.4 fL, RBC 4.1 × 10¹²/L, ferritin 6 ng/mL, agus TIBC àrd. Tha clàr Mentzer de mu 17.7 a’ toirt taic do dh’easbhaidh iarainn iomlan. Ann am BT-007, bha an t-euslainteach na dhuine 28-bliadhna le microcytosis (MCV 65.8 fL) ach cunntas RBC àrd de 6.2, RDW àbhaisteach, ferritin àbhaisteach, agus HbA2 de 5.6 sa cheud. Tha clàr Mentzer de mu 10.6 a’ comharrachadh feart thalasaemia, agus tha HbA2 àrd a’ dearbhadh beta-thalasaemia beag.

Anemia easbhaidh iarainn Mentzer > 13 Ferritin ìosal, TSAT ìosal, TIBC àrd, RDW àrd
Feart beta-thalasaemia Mentzer < 13 Ferritin àbhaisteach, RDW àbhaisteach, HbA2 àrd (>3.5%), cunntas RBC àrd

Fhuair an dà chùis sgòr 1.000. Dh’ iarr an einnsean clàr Mentzer gu soilleir anns an dà mhìneachadh agus thug e seachad an dearbhadh ceart anns gach cùis. ’S e seo an aon toradh as dearbhach gu clinigeach anns a’ bhun-chomharra gu lèir, oir tha mearachd ann a bhith a’ seòrsachadh feart thalasaemia mar easbhaidh iarainn a’ leantainn gu cur-ris iarainn neo-iomchaidh agus cothroman sgrìonaidh teaghlaich a chall, agus tha mearachd ann a bhith a’ seòrsachadh easbhaidh iarainn mar thalasaemia a’ dàil a chur air leigheas ath-chuiridh sìmplidh. An a’ stiùireadh raon ferritin a’ mìneachadh co-theacsa eadar-dhealachaidhean nas fharsainge.

Toraidhean gach cùis bhon ruith sa Ghiblean 2026

Ràinig dusan de chòig-deug chùisean mullach an sgòir cho-chruinneachaidh de 1.000 air a’ phrìomh phàirt. Chaidh trì cùisean a fhrithealadh tron “Phase 2 fallback”, a’ call bonus latency 0.05 fhad ’s a bha iad a’ gleidheadh a h-uile susbaint clionaigeach is structarail. Bha aon chùis a’ dìth aon fho-earrann èigneachail; thill aon fhear suim cuairteachaidh coltachd air a lùghdachadh beagan.

ID cùise Speisealachd Co-phàirteach Latency Path
BT-001-IDAHeamatology1.00017.8 sprìomh
BT-006-B12Heamatology1.00018.4 sprìomh
BT-007-THALHeamatology1.00017.0 sprìomh
BT-002-HASHEndocrinology0.95037.0 scùl-taic
BT-008-PCOSEndocrinology0.98718.6 sprìomh
BT-003-T2DMMeatabolach1.00019.1 sprìomh
BT-013-GOUTMeatabolach1.00019.4 sprìomh
BT-004-NAFLDHepatology1.00019.6 sprìomh
BT-009-VIRHEPHepatology0.95023.4 scùl-taic
BT-014-GILBERTTrap1.00018.9 sprìomh
BT-005-CKDNephrology1.00017.4 sprìomh
BT-010-ASCVDCairt-eòlas1.00019.7 sprìomh
BT-011-SLEReumatology0.98118.2 diogprìomh
BT-012-VITDEndocrinology1.00019.3 diogprìomh
BT-015-HEALTHYTrap1.00018.7 diogcùl-taic

Chaill cùis PCOS (BT-008) fo-ear-phàirt èigneachail singilte ann an structar an fhreagairt — còig-deug deug air fhichead ’s a sia an àite sia-deug deug air fhichead — rud a lùghdaich sgòr structarail bho 1.000 gu 0.963. Thill cùis SLE (BT-011) suim cuairteachaidh coltachd a bha beagan nas ìsle, a thug an sgòr clionaigeach gu 0.965 fhad ’s a bha a h-uile prìomh fhacal breithneachaidh agus siostam sgòraidh air a ghleidheadh. Cha do chaill gin de na cùisean fo-thorrach breithneachadh ceart.

Na tha an sgòr cinn-naidheachd nach innis dhuinn

Tha sgòr co-phàirteach de 99.12 sa cheud fon riaghailt ro-chlàraichte shònraichte seo a’ riochdachadh coileanadh faisg air mullach, ach tha feum air frèamadh cùramach. Tha an toradh a’ mìneachadh giùlan an einnsein an aghaidh còig-deug cùisean gun urra a chaidh an taghadh gu cùramach, air an luachadh aon uair gach fear, fo aon riaghailt. Tha sinn soilleir mu na tha an àireamh a’ dearbhadh agus nach eil a’ dearbhadh.

Tha an sgòr ag ràdh gun do làimhsich einnsean V11 na pàtrain breithneachaidh a chaidh a thaghadh airson an luachaidh seo gu ceart, air dòigh-obrach a chaidh fhoillseachadh agus a ghabhas ath-riochdachadh. Chan eil e ag ràdh gu bheil an einnsean ceart air gach pannal deuchainn fala a tha ann an saoghal fìor. Chan eil e ag ràdh gum bu chòir don einnsean breithneachadh lighiche a chur na àite. Agus chan eil e ag ràdh gu bheil an einnsean nas fheàrr na siostaman AI eile — chaidh mion-sgrùdaidhean coimeasach an aghaidh einnseanan eile a chumail a-mach à raon an aithris seo a dh’aona ghnothach.

Is e bun-loidhne a tha an sgòr a’ dearbhadh. Leis an riaghailt agus an uidheam (harness) poblach, faodar dreachan san àm ri teachd den einnsean a mheasadh an aghaidh an aon chòig-deug cùisean, agus tha an beàrn eadar an sgòr a chaidh fhoillseachadh agus ruith sam bith às dèidh sin fhèin tomhasail. Seo luach na ro-chlàraidh: bidh e ag atharrachadh tagraidhean coileanaidh gu tagraidhean a ghabhas deuchainn.

Mar a nì thu ath-riochdachadh air a’ bhun-chomharra seo ann an 10 mionaidean

Chan fheum ath-riochdachadh ach paidhir teisteanais API Kantesti agus àrainneachd Python 3.10 no nas fhaide air adhart leis an requests agus reportlab na leabharlannan air an stàladh. Tha an uidheam slàn na aon mhodal Python fèin-chumanta air a leigeil ma sgaoil fo chead MIT.

Diagram lìonra ath-riochdachaidh a’ sealltainn a’ benchmark air a sgàthanachadh thar Figshare, ResearchGate, Academia.edu agus GitHub leis an DOI Figshare mar acair canonical
Figear 5: Tha an slat-tomhais air a sgàthanachadh thar ceithir àrd-ùrlaran rannsachaidh. ’S e an Figshare DOI an comharraiche acadaimigeach canonical; bidh ResearchGate, Academia.edu, agus GitHub a’ cumail lethbhric co-shìnte le còd agus dàta amh.

Ceithir ceumannan gu ruith ùr

Aon. Clonaich an stòr-dàta: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. Dà. Stàlaich eisimeileachd le pip install -r requirements.txt. Trì. Suidhich KANTESTI_USERNAME agus KANTESTI_PASSWORD mar caochladairean àrainneachd — thèid teisteanasan a leughadh aig àm ruith agus chan eil dad air a chruadhachadh san sgriobt. Ceithir. Ruith python benchmark_bloodtest.py agus dèan sgrùdadh air na ceithir arteactan a thèid a chur a-mach don phasgan obrach: CSV scorecard, JSON scorecard, làn JSON dump a’ gabhail a-steach freagairtean amh an einnsein, agus aithisg Markdown a tha furasta do dhaoine a leughadh.

Tha an ruith iomraidh bho 23 Giblean 2026 air a ghleidheadh anns an results/ pasgan den stòr-tasgaidh. Cruthaichidh ruith ùr scorecard ùr le stampa-tìm fhad ’s a bhios an ruith iomraidh gun atharrachadh. Ma bheir an ruith agad toradh gu math eadar-dhealaichte, feuch an fosgail thu cùis air GitHub leis an stampa-tìm ruith agus an tionndadh einnsein a thilleadh ann am mheatadata an fhreagairt.

Cuingeachaidhean agus obair san àm ri teachd

Tha ceithir cuingeachaidhean airidh air aideachadh soilleir: meud an t-sampall, measadh aon-seilg, raon aon-einnsein, agus tùs dàta aon-stòr. Thathar gan dèiligeadh ann an obair leantainneach gnìomhach.

Meud an t-sampall. Tha còig-deug cùis thar ochd bucaidean speisealachd gu leòr airson dearbhadh bun-bheachd ach chan ann airson mion-sgrùdadh fo-bhuidhnean taobh a-staigh speisealachd. Thathar an dùil leudachadh gu còig-deug cùis agus bidh e a’ gabhail a-steach pannalan coagulation, sgrìonadh airson malignancy hematological, pannalan torrachais, agus taisbeanaidhean péidiatraiceach.

Measadh aon-seilg. Chaidh gach cùis a mheasadh aon uair. Bidh modalan cànain mòra a’ sealltainn caochlaideachd toraidh nach eil beag eadhon aig teòthachd samplachaidh ìosal, agus mar sin ’s e ceum nàdarra an ath cheum protocol ioma-ruith le còig measadh gach cùis agus caochlaideachd air aithris.

Raon aon-einnsein. Tha an aithisg seo a’ mìneachadh aon einnsean. Tha mion-sgrùdaidhean coimeasach an aghaidh siostaman AI eile taobh a-muigh raon an seo; ’s dòcha gun lean sinn orra mar sgrùdadh neo-eisimeileach air leth le modh-obrach iomchaidh.

Tùs dàta aon-stòr. Tha na còig-deug cùisean nan clàran fìor euslaintich gun urra a thàinig à aon stòr-tasgaidh clionaigeach. Tha iad a’ riochdachadh sampall air a chur ri chèile agus chan e tarraing air thuaiream a tha riochdachail den t-sluagh. Tha leudachadh an measadh gu dàta ioma-ionad air an rathad.

Is e an leudachadh as buadhaiche a chaidh a phlanadh co-ionannachd ioma-chànanach. Tha an Kantesti AI Engine a’ frithealadh luchd-cleachdaidh ann an 75+ cànan, agus le bhith a’ ruith an aon inneal deuchainn còig-deug-cùis ann an Turcais, Gearmailtis, Spàinntis, Fraingis, agus Arabais tomhaisidh sinn càileachd toraidh thar nan cànanan a tha an einnsean a’ toirt taic dha. Foillsichidh sinn gach ruith sònraichte cànain le a DOI fhèin agus meur an inneil.