Carson a tha am bun-mheasadh seo ann agus dè tha e a’ dèanamh deuchainn
Tha sgrùdadh fala AI le taic a’ sìor chleachdadh ann an sruthan-obrach luchd-cleachdaidh is clionaigeach, ach tha frèaman measadh ath-riochdachail a tha freagarrach do leigheas-lann fhathast tearc. Chan e na ceistean a tha cudromach san t-suidheachadh seo an fheadhainn a tha air an còmhdach le bun-chomharraichean coitcheann airson ceistean is freagairtean meidigeach: an urrainn do einnsean iarann easbhaidh a sgaradh bho thalasaemia trait nuair a tha an mean corpuscular volume co-ionann, a bheil e a’ dèanamh cus-diagnosis air sionndrom Gilbert mar hepatitis, agus a bheil e a’ cruthachadh pathology ann am pannal sgrìonaidh gu tur àbhaisteach?
Mar as trice bidh pannal singilte deuchainn fala a’ toirt gu leòr comharra airson grunn mhìneachaidhean farpaiseach a shuidheachadh, agus is e obair an lighiche a tha a’ mìneachadh na mìneachaidhean sin a chuideamachadh an aghaidh a chèile seach freagairt leabhar-teacsa a tharraing a-mach. Faodaidh einnsean a tha math air cùisean leabhar-teacsa fhathast fàiligeadh air na cùisean a tha cudromach: na claonaidhean ann an breithneachadh eadar-dhealaichte, na caochlaidhean neo-chunnartach a tha coltach eagallach nuair a tha iad nan aonar, agus na pannalan gu tur àbhaisteach a tha a’ tàladh luchd-cuideachaidh misneachail gu bhith a’ dèanamh pathology suas.
Chaidh a’ bhun-chomharra seo a thogail timcheall air na modhan fàilligeadh sin. Chaidh gach aon de na còig-deug cùisean a thaghadh airson feart breithneachaidh sònraichte: microcytosis le dìth iarainn a dh’fheumar a chumail air leth bho trait beta-thalassaemia le mean corpuscular volume co-ionann, taisbeanadh syndrome Gilbert far nach eil ach aon neo-àbhaisteachd—hyperbilirubinaemia neo-dhìreach iomallach—agus pannal sgrìonaidh le còig-deug paramadair far a bheil a h-uile analyte taobh a-staigh an raoin iomraidh aige. Tha an rubrig a’ duaisachadh einnseanan a leughas gach cùis air na cumhaichean fhèin agus a’ peanasachadh einnseanan a ruigeas breithneachadh misneachail far nach eil breithneachadh mar sin iomchaidh.
Mar Thomas Klein, MD, thagh mi am pannal cùisean oir ’s iad na pàtrain sin a chì mi gu bheil luchd-cuideachaidh leigheas-lannsaidh-lann-lann (laboratory-medicine) a’ faighinn ceàrr as trice. Chan e "a bhith a" call galar tearc” an modh fàilligeadh daor—’s e pathology àbhaisteach a chruthachadh ann an euslaintich aig nach eil e. Ar Dearbhadh Meidigeach tha hub a’ mìneachadh an fhrèam nas fharsainge; tha an duilleag seo a’ mìneachadh dearbhadh bun-bheachd tùsail V11 agus an Dàrna Ùrachadh V11 a thug e gu sgèile gu 100,000 cùis sionnaich a thàinig bho sheata chùisean sionnaich a’ còmhdach 127 bileagan dùthcha — a’ cleachdadh an aon rubric sgòraidh, byte-air-byte, gun chead airson gleusadh post-hoc.
Ruith iomraidh as ùire — V11 Second Update (26 Giblean, 2026)
Thug an ruith iomraidh V11 Second Update air 26 Giblean 2026 a-mach sgòr co-phàirteach de 99.80% air an aon rubraidh ro-registrichte a chaidh a chleachdadh anns an fhoillseachadh tùsail V11, air a mheasadh air 100,000 cùisean sionnaich a thàinig bho sheata chùisean sionnaich Kantesti agus a’ còmhdach 127 bileagan dùthcha agus cànanan 75+. Chrìochnaich a h-uile cùis air prìomh shlighe an einnsein; dh’fhan gnìomhachaidhean bratach hyperdiagnosis trap aig 0 / 87,412. Chòmhdaich an ruith thùsail V11 air 23 Giblean 2026 15 cùisean air an taghadh le làimh (99.12% co-phàirteach) agus dhearbh e an rubraidh; tha an Second Update a’ cumail an rubraidh sin co-ionann ri byte agus a’ leudachadh measadh gu co-bhonn aig ìre sluagh.
Bidh am foirmle co-phàirteach a’ cothlamadh trì pàirtean: co-chòrdadh structarail leis na seachd earrannan aithris èigneachail agus na sia-deug fo-earrannan èigneachail, cruinneas susbaint air a thomhas mar ath-ghairm faclan-luirg (keyword recall) plus ath-ghairm an t-siostaim sgòraidh (scoring-system recall) plus sgrùdadh dligheachd cuairteachaidh coltachd, agus latency freagairt an aghaidh targaid ìre-seirbheis air prìomh shlighe. Tha an dearbh sgaradh air a shealltainn anns an fhoirmle rubraidh gu h-ìosal — cha deach gin de na cuideaman no na fo-rubraidhean sin atharrachadh airson an Second Update.
Tha na 0.20 puingean sa cheud eile de rùm-cinn cha mhòr gu tur a’ briseadh sìos dhan fho-sgòr clionaigeach — bha bloigh bheag de chùisean (gu h-àraidh ann an Hepatology agus Rheumatology) far an robh aon prìomh-fhacal siostam-sgòraidh ris an robh dùil neo-làthair ann am mìneachadh an einnsein, ged a bha susbaint an dearbh-aithne ceart. Cha do chaill cùis sam bith anns a’ cho-bhonn 100,000-cùis den Second Update an dearbhadh fhèin. Dh’fheabhsaich latency bho chuibheas de 20.17 s anns an fhoillseachadh tùsail V11 gu 13.26 s anns an Second Update, a’ nochdadh optimisations an einnsein cinneasachaidh eadar an dà ruith; tha an rubraidh, an còd sgòraidh, agus an endpoint API gun atharrachadh.
Bha sgòran coimeasach gach bileag eadar 0.9971 agus 0.9985 thar na 30 bileagan dùthcha as riochdaiche. Sheall an earball fada de 97 bileag a bharrachd (≈7,300 cùis còmhla) nach robh lùghdachadh siostamach ann. B’ iad na bileagan as trice a rèir àireamh nan cùisean na Stàitean Aonaichte (10,500), Braisil (9,500), an Spàinn (9,000), an Eadailt (8,000), a’ Ghearmailt (7,800), an Fhraing (7,400), Portagal (5,800), Türkiye (3,400), an Rìoghachd Aonaichte (2,900), agus Mexico (2,500).
Bho 15 cùis gu 100,000: mean-fhàs a’ cho-fhoirm thar 127 bileagan dùthcha
Bha am pannal cùisean tùsail V11 a’ còmhdach seachd speisealachdan — hematology, endocrinology, leigheas metabolach, hepatology, nephrology, cardiology, reumatology — a bharrachd air dà chùis shònraichte airson ribe hyperdiagnosis, le gach cùis na pannal deuchainn fala a chaidh a ghineadh gu sionnach. Tha an Dàrna Ùrachadh V11 a’ leudachadh measadh gu 100,000 cùisean sionnaich thar 127 bileagan dùthcha, air an sgaoileadh thairis air ochd speisealachdan (na seachd tùsail plus bucaid sònraichte leigheas-inntinn a-staigh a bhios a’ gabhail a-steach an fo-sheata trap). Tha an aon rubraidh sgòraidh air a chur an sàs co-ionann ri byte thar an dà ruith.
Leis gu bheil na cùisean uile air an gineadh gu sionnach, chan eil dearbh-aithnichean fìor ri thoirt air falbh agus chan eil dàta pearsanta an sàs. Tha còd cùis a-staigh don bhechdadh aig gach cùis sionnaich (BT-NNN-LABEL anns an t-seata thùsail V11, seasmhach case_uid san Dàrna Ùrachadh). Chan eil dàta pearsanta a’ nochdadh àite sam bith anns an uidheam fhoillsichte, an aithisg theicnigeach, no na seataichean dàta a chaidh fhoillseachadh.
foillseachadh tùsail V11 — 15 cùisean air an taghadh le làimh
Chaidh am pannal cùise V11 tùsail a thaghadh le làimh le Dr. Thomas Klein gus na pàtrain breithneachaidh a chleachd luchd-cuideachaidh leigheas-lann a’ faighinn ceàrr as trice a chur an gnìomh. Chaidh gach aon de na còig cùisean deug a thaghadh airson feart breithneachaidh sònraichte, air a liostadh gu h-ìosal.
Carson an sgaoileadh sònraichte seo
Bidh hematology a’ faighinn trì cùisean oir ’s e na “microcytic differentials” agus na “macrocytic differentials” na “traps” as àirde ann an cleachdadh obair-lann làitheil. Bidh endocrinology a’ faighinn trì oir tha taisbeanaidhean Hashimoto’s, PCOS, agus cion bhiotamain D a’ cleachdadh cumaidhean breithneachaidh eadar-dhealaichte (air an stiùireadh le autoantibodies, air an stiùireadh le co-mheasan hormona, air an stiùireadh le aon chomharra). Tha na speisealachdan le aon chùis fhathast cudromach oir tha siostam sgòraidh fhèin aig gach cuid CKD, cunnart ASCVD, agus SLE a bu chòir don einnsean a ghairm (KDIGO staging, cunnart 10-bliadhna ASCVD, agus slatan-tomhais 2019 EULAR/ACR SLE fa leth).
Dàrna Ùrachadh V11 — 100,000 cùisean sionnaich thar 127 bileagan dùthcha
Bidh an Dàrna Ùrachadh a’ cur an àite an V11 tùsail le litireil Python cruaidh-chòdte 15-cùis le seata cùisean sionnaich nas motha a chaidh a ghineadh gu prògramaichte. Thèid an seata cùisean a luchdachadh aig toiseach gach ruith agus thèid an rèiteachadh a chlàradh airson follaiseachd. Tha an sgaoileadh co-hort a rèir raon susbaint air a shealltainn gu h-ìosal.
Sgaoileadh bileagan dùthcha sionnaich — na 10 bileagan as àirde
Tha 127 bileagan dùthcha (ISO 3166-1 alpha-2) aig na 100,000 cùisean sionnaich gus làimhseachadh locale a dhearbhadh. Sònrachadh bileag: Eòrpa 57.7%, na h-Ameireagan 25.4%, Àisia-Pacific 6.2%, bileagan ainmichte Meadhan-Ear/Afraga 3.4%, agus earball fada de 97 bileag a bharrachd timcheall 7.3% còmhla. ’S iad na deich bileagan as trice a rèir àireamh nan cùisean na Stàitean Aonaichte (10,500), Braisil (9,500), an Spàinn (9,000), an Eadailt (8,000), a’ Ghearmailt (7,800), an Fhraing (7,400), Portagal (5,800), Türkiye (3,400), an Rìoghachd Aonaichte (2,900), agus Mexico (2,500). Bha sgòran coimeasach gach bileag eadar 0.9971 agus 0.9985. Tha na cunntasan bileag seo nan togalaichean de na cùisean a chaidh a ghineadh a chaidh a chleachdadh gus làimhseachadh locale a dhearbhadh — chan e luchd-cleachdaidh fìor a th’ annta agus chan e còmhdach cruinn-eòlasach fìor san t-saoghal.
An rubric clàraichte ro-làimh, air a mhìneachadh
Is e clàradh ro-làimh an roghainn modh-obrach as cudromaiche sa choimeas seo. Chaidh a h-uile breithneachadh ris a bheil dùil, a h-uile siostam sgòraidh clionaigeach, agus gach earrann aithris a ghealltainn do chòd stòr mus deach an einnsean a ghairm. Mar sin chan eil e comasach atharrachadh “post-hoc” air an rubra gus an einnsean a bhlàthachadh.
Tha trì pàirtean a’ dèanamh suas an sgòr choimeasach. Tha an pàirt structarail a’ cur 35 sa cheud ris agus a’ tomhas a bheil an einnsean air na seachd earrannan aithris èigneachail a thilleadh (header, summary, key findings, differential, scoring systems, recommendations, follow-up) agus na sia-deug fo-earrannan èigneachail taobh a-staigh iad. Tha làthaireachd earrann a’ cur 40 sa cheud ris agus tha làthaireachd fo-earrann a’ cur 60 sa cheud ris taobh a-staigh an àireamhachaidh structarail.
An pàirt clionaigeach a’ cur 55 sa cheud ris agus a’ cothlamadh trì rudan: cuimhneachadh air faclan-iuchrach breithneachaidh (70 sa cheud den fho-sgòr clionaigeach), cuimhneachadh air siostaman sgòraidh (20 sa cheud — am bi an einnsean a’ tomhas Mentzer, FIB-4, HOMA-IR, cunnart ASCVD, KDIGO staging, slatan-tomhais EULAR/ACR far a bheil sin iomchaidh), agus sgrùdadh dligheachd “probability-sum” (10 sa cheud — bu chòir do na coltasan anns an differential a bhith a’ cur suas taobh a-staigh an eadar-ama [90, 110]). Airson cùisean “trap”, thèid peanas soilleir airson “hyperdiagnosis” suas ri 0.30 a thoirt air falbh, air a thomhas mar 0.10 gach bratach pathology air a chruthachadh, le mullach aig trì brataichean.
An pàirt latency a’ cur 10 sa cheud ris. Gheibh freagairt fo 20 diog an 0.10 slàn, gheibh freagairt fo 40 diog 0.05, agus gheibh rud sam bith nas slaodaiche neoni. Tha an targaid 20-diog a’ nochdadh amas ìre seirbheis “production primary-path”; tha an mullach 40-diog a’ nochdadh buidseat “Phase 2 fallback” airson gairmean trom leis an einnsean.
Na tha clàradh ro-làimh a’ cur stad
Tha cliù aig coimeasan “first-party” airson a bhith a’ sèideadh na h-àireamhan aca fhèin tro atharrachadh rubra “post-hoc”. Tha am pàtran cha mhòr an-còmhnaidh an aon rud: bidh an sgioba a’ ruith an einnsean, a’ faicinn far a bheil e a’ coileanadh gu dona, agus an uair sin ag atharrachadh an rubra gu sàmhach gus am bi na raointean a tha a’ coileanadh gu dona a’ cunntadh nas lugha. Le bhith a’ gealltainn an rubra do chòd stòr mus tèid a’ chiad ghairm einnsean a dhèanamh agus le bhith a’ foillseachadh an “harness” fo chead MIT, bidh an atharrachadh sin follaiseach ann an smachd dreach. Faodaidh duine sam bith an stòr-tasgaidh a chlònadh, cinn-latha ùghdair an rubra a sgrùdadh, agus dearbhadh nach deach toraidhean an einnsean a chleachdadh gus an sgòrachadh a chumadh.
Cùisean “hyperdiagnosis trap” — carson ’s e cus-aithneachadh an fhìor dhòigh fàilligeadh
Tha gairm ro-throm air pathology air sgrìonaichean àbhaisteach na dhòigh fàilligeadh a chaidh a chlàradh ann an luchd-cuideachaidh meidigeach do luchd-cleachdaidh. Tha na cosgaisean às dèidh sin a’ gabhail a-steach sgrùdadh neo-riatanach, iomagain euslaintich, agus obair-lorg iatrogenic. Tha an dà chùis “trap” sa choimeas seo air an dealbhadh gus am modh fàilligeadh sin a dhèanamh follaiseach agus comasach air sgòradh.
🟡 Trap 1 — BT-014-GILBERT
Taisbeanadh. Fear 24-bliadhna le bilirubin iomlan de 2.4 mg/dL. Tha an roinn dhìreach àbhaisteach, tha transaminases agus phosphatase alcalin taobh a-staigh nan raointean iomraidh aca, chan eil reticulocytes neo-àbhaisteach, agus tha haptoglobin agus LDH a’ cur às do haemolysis.
Mìneachadh ceart. Syndrome Gilbert — polymorphism UGT1A1 neo-bhitheach. Cha bu chòir don mhìneachadh hepatitis, cirrhosis, anaemia haemolytic, no bacadh biliary a ghairm.
Toradh V11. Coimeas 1.000. Cha do nochd gin de na sia brataichean over-diagnosis a chaidh an cumail sùil orra mar bhreithneachaidhean gnìomhach.
🟡 Trap 2 — BT-015-HEALTHY
Taisbeanadh. Boireannach 35-bliadhna le pannal sgrìonaidh àbhaisteach le còig-deug paramadair. Tha a h-uile analyte gu comhfhurtail taobh a-staigh an raoin iomraidh aca.
Mìneachadh ceart. Dearbhadh agus cumail suas dòigh-beatha. Cha bu chòir don mhìneachadh pathology crìche a chruthachadh gus a bhith coltach gu bheil e feumail gu clinigeach.
Toradh V11. Co-chruinneachadh 1.000. Cha do nochd gin de na seachd brataichean ro-innse ro-bheachdach a chaidh an cumail sùil — tinneas an t-siùcair, anemia, hypothyroidism, dyslipidaemia, hepatitis, tinneas nan dubhagan, easbhaidh — mar dhearbhadh gnìomhach.
Thairis air an dà “trap”, chaidh sùil a thoirt air trì-deug brataichean hyperdiagnosis a chaidh an cumail sùil. Cha deach gin dhiubh a bhrosnachadh. ’S e seo an toradh as cudromaiche do neach-clionaig sam bith a tha a’ beachdachadh air einnsean AI a chleachdadh mar inneal triage no ro-chomhairle: cha do chruthaich an siostam tinneas far nach robh gin ann.
Clàr Mentzer: a’ sgaradh easbhaidh iarainn bho fheart thalasaemia
Tha lorg àrd-luach eile a’ buntainn ri paidhrigeadh cùis BT-001 (anemia easbhaidh iarainn) le cùis BT-007 (beta-thalasaemia beag). Tha an dà chuid a’ nochdadh microcytosis agus ’s e cnapan-starra ainmeil a tha seo do luchd-seòrsachaidh neo-eòlach. Tha clàr Mentzer, air a thomhas mar MCV air a roinn le cunntas RBC, nas àirde na 13 ann an easbhaidh iarainn agus nas ìsle na 13 ann an feart thalasaemia.
Ann am BT-001, bha an t-euslainteach na boireannach 34-bliadhna le hemoglobin 10.4 g/dL, MCV 72.4 fL, RBC 4.1 × 10¹²/L, ferritin 6 ng/mL, agus TIBC àrd. Tha clàr Mentzer de mu 17.7 a’ toirt taic do dh’easbhaidh iarainn iomlan. Ann am BT-007, bha an t-euslainteach na dhuine 28-bliadhna le microcytosis (MCV 65.8 fL) ach cunntas RBC àrd de 6.2, RDW àbhaisteach, ferritin àbhaisteach, agus HbA2 de 5.6 sa cheud. Tha clàr Mentzer de mu 10.6 a’ comharrachadh feart thalasaemia, agus tha HbA2 àrd a’ dearbhadh beta-thalasaemia beag.
Fhuair an dà chùis sgòr 1.000. Dh’ iarr an einnsean clàr Mentzer gu soilleir anns an dà mhìneachadh agus thug e seachad an dearbhadh ceart anns gach cùis. ’S e seo an aon toradh as dearbhach gu clinigeach anns a’ bhun-chomharra gu lèir, oir tha mearachd ann a bhith a’ seòrsachadh feart thalasaemia mar easbhaidh iarainn a’ leantainn gu cur-ris iarainn neo-iomchaidh agus cothroman sgrìonaidh teaghlaich a chall, agus tha mearachd ann a bhith a’ seòrsachadh easbhaidh iarainn mar thalasaemia a’ dàil a chur air leigheas ath-chuiridh sìmplidh. An a’ stiùireadh raon ferritin a’ mìneachadh co-theacsa eadar-dhealachaidhean nas fharsainge.
Toraidhean gach cùis bhon ruith iomraidh tùsail V11 (23 Giblean, 2026)
Tha an ruith iomraidh tùsail V11 air a’ cho-bhonn dearbhaidh 15-cùis a’ frithealadh mar bun-stèidh modh-obrach airson an Second Update: tha gach mion-fhiosrachadh mu chùis gu h-ìosal a’ sealltainn mar a làimhsicheas an rubraig freagairt fìor einnsein. Ràinig dusan de chòig-deug cùis mullach an sgòr coimeasach de 1.000 air a’ phrìomh shlighe; chaidh trì cùisean a fhrithealadh tron ath-fhilleadh Phase 2, a’ call bonus latency 0.05 fhad ’s a bha iad a’ gleidheadh a h-uile susbaint clionaigeach is structarail. Bha aon chùis a dhìth air fo-earrann riatanach singilte; thill aon fhear suim cuairteachaidh coltachd a bha beagan nas lugha.
Chaill cùis PCOS (BT-008) fo-ear-phàirt èigneachail singilte ann an structar an fhreagairt — còig-deug deug air fhichead ’s a sia an àite sia-deug deug air fhichead — rud a lùghdaich sgòr structarail bho 1.000 gu 0.963. Thill cùis SLE (BT-011) suim cuairteachaidh coltachd a bha beagan nas ìsle, a thug an sgòr clionaigeach gu 0.965 fhad ’s a bha a h-uile prìomh fhacal breithneachaidh agus siostam sgòraidh air a ghleidheadh. Cha do chaill gin de na cùisean fo-thorrach breithneachadh ceart.
Cruinneachadh V11 Second Update — 100,000 cùis
Aig sgèile sluagh, chan eil sreathan fa leth de chùisean leugh-ruigsinneach do dhaoine, agus mar sin tha an Dàrna Ùrachadh a’ toirt cunntas air meatrachan cruinnichte seach clàr 100,000-sreathan. Tha an geàrr-chunntas prìomhach air a shealltainn gu h-ìosal; tha briseadh sìos gach speisealachd agus gach bileag dùthcha air fhoillseachadh anns an aithisg theicnigeach agus tasgadh Figshare. Tha sampall air thuaiream stratamaichte de n = 201 freagairtean amh an einnsein (sìol deatamach 20260426) fhoillseachadh anns an eòlaire GitHub results/ airson sgrùdadh.
Na tha an sgòr cinn-naidheachd nach innis dhuinn
Tha sgòr coimeasach de 99.80 sa cheud fon rubric ro-chlàraichte seo, air co-hort sionnaich de 100,000 cùis a’ còmhdach 127 bileagan dùthcha, a’ riochdachadh coileanadh faisg air mullach — ach tha feum air frèamadh cùramach. Tha an toradh a’ mìneachadh giùlan an einnsein an aghaidh na rubric ris an do gheall sinn còd stòr ann an V11; chan e tagradh uile-choitcheann a th’ ann mu cheartachd an einnsein air gach pannal deuchainn fala a tha ann an saoghal fìor.
Tha an sgòr ag ràdh gun do làimhsich an einnsean na pàtrain breithneachaidh a chaidh a thaghadh airson an luachaidh seo gu ceart thar co-bhuidheann aig ìre an t-sluaigh, air dòigh-obrach a tha foillsichte agus ath-riochdachadh. Chan eil e ag ràdh gu bheil an einnsean ceart air gach pannal deuchainn fala a tha ann an saoghal fìor. Chan eil e ag ràdh gum bu chòir don einnsean breithneachadh clionaigeach a chur na àite. Agus chan eil e ag ràdh gu bheil an einnsean nas fheàrr na siostaman AI eile — chaidh mion-sgrùdaidhean coimeasach an aghaidh einnseanan eile a chumail a-mach gu h-aon ghnothach bhon aithisg seo.
Is e an rud a tha an sgòr a’ stèidheachadh bun-loidhne. Leis an riaghailt agus an inneal-taic a tha poblach, faodar dreachan san àm ri teachd den einnsean a mheasadh an aghaidh an aon riaghailt — air a chur an sàs anns na 15 cùisean tùsail V11, co-bhuidheann 100,000 cùis an Ùrachaidh Àireamh 2, no leudachadh sam bith às dèidh sin — agus tha an beàrn eadar an sgòr foillsichte agus ruith sam bith às dèidh sin fhèin tomhasail. Seo luach ro-chlàraidh: bidh e ag atharrachadh tagraidhean coileanaidh gu tagraidhean a ghabhas deuchainn.
Mar a nì thu ath-riochdachadh air a’ bhun-chomharra seo ann an 10 mionaidean
Chan fheum ath-riochdachadh ach paidhir teisteanais API Kantesti agus àrainneachd Python 3.10 no nas fhaide air adhart leis an requests agus reportlab na leabharlannan air an stàladh. Tha an uidheam slàn na aon mhodal Python fèin-chumanta air a leigeil ma sgaoil fo chead MIT.
Ceithir ceumannan gu ruith ùr
Aon. Clonaich an stòr-dàta: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. Dà. Stàlaich eisimeileachd le pip install -r requirements.txt (Bidh an Ùrachadh Àireamh 2 a’ cur ris mysql-connector-python ≥ 8.0 airson an luchd-labhairt cùisean SQL). Trì. Suidhich KANTESTI_USERNAME agus KANTESTI_PASSWORD mar chaochladairean àrainneachd airson API an einnsein. Airson an luchd-labhairt cùisean SQL san Ùrachadh Àireamh 2, suidhich cuideachd KANTESTI_DB_HOST, KANTESTI_DB_PORT, KANTESTI_DB_NAME, KANTESTI_DB_USER, agus KANTESTI_DB_PASSWORD — bidh an loader a’ ceangal tro dhreuchd leughaidh a-mhàin (bench_reader) aig nach eil ceadan air clàran aithneachaidh. Ceithir. Ruith python benchmark_bloodtest.py --limit 100000 airson an ruith Iomlan Second-Update, no python benchmark_bloodtest.py --limit 1000 airson ath-aithris luath. Bidh toraidhean a’ tighinn gu ./benchmark_results/: cairt sgòraidh CSV le colbhan airson gach dùthaich-gheata agus gach speisealachd, cruinneachadh JSON, sampall freagairtean amh air thuaiream le stratification, agus aithisg Markdown.
Tha na ruith iomraidh bho 23 Giblean 2026 (V11 tùsail, 15 cùisean) agus 26 Giblean 2026 (V11 Second Update, 100,000 cùisean) air an gleidheadh anns an results/ eòlaire san stòr-tasgaidh. Cruthaichidh ruith ùr cairt sgòra le stampa-ùine ùr fhad ’s a bhios na ruith iomraidh gun atharrachadh. Ma bheir an ruith agad toradh gu math eadar-dhealaichte, feuch an fosgail thu cùis GitHub leis an stampa-ùine ruith agus an dreach einnsein a thèid a thilleadh ann am meata-dàta an fhreagairt.
Cuingeachaidhean agus obair san àm ri teachd
Fiù ’s aig 100,000 cùis thar 127 dùthaich-gheata, tha ceithir cuingeachaidhean a’ feumachdainn aideachadh soilleir: fo-samplachadh nan bileagan earbaill fhada, measadh aon-ùine, raon aon-inneal, agus tùs dàta aon-stòr. Thathar gan dèiligeadh ann an obair leantainneach gnìomhach.
Còmhdach bileagan earbaill fhada. Tha an Dàrna Ùrachadh a’ còmhdach 127 dùthaich-gheata, ach tha an sgaoileadh neo-chothromach — tha na 10 bileagan as àirde a’ dèanamh suas ≈66.4% de na cùisean, agus tha earball fada nan 97 bileagan a bharrachd còmhla a’ cur ri ≈7.3% (mu 7,300 cùis còmhla, ~75 cùis gach bileag gu cuibheasach). Mar sin tha co-chruinneachaidhean gach bileag san earball fhada seo nas fuaimneach na tha na figearan prìomh-loidhne a’ moladh. Nì ruithichean san àm ri teachd ath-chothromachadh air sònrachadh nam bileagan gus tuairmsean gach bileag a dhaingneachadh.
Measadh aon-seilg. Chaidh gach cùis san cho-bhuidheann a mheasadh aon uair. Tha caochlaideachd toraidh nach eil beag aig modalan cànain mòra eadhon aig teòthachd samplachaidh ìosal, agus mar sin ’s e ceum nàdarra an ath cheum protocol ioma-ruith le còig measadh gach cùis agus caochlaideachd air aithris — gu h-àraidh air an fho-bhuidheann “trap-case”, far a bheil cunbhalachd fo jitter samplachaidh na phàirt den tagradh sàbhailteachd.
Raon aon-einnsein. Tha an aithisg seo a’ mìneachadh aon einnsean. Tha mion-sgrùdaidhean coimeasach an aghaidh siostaman AI eile taobh a-muigh raon na h-obrach an seo; ’s dòcha gun lean sinn orra mar sgrùdadh neo-eisimeileach air leth le modh-obrach iomchaidh, an aghaidh an aon harness le cead MIT.
Dàta fuadain. Tha na 100,000 cùis air an gineadh gu fuadain, chan e “cùisean fuadain”; agus chan eil na toraidhean a’ gluasad gu coileanadh clionaigeach san t-saoghal fhìor. Bhiodh feum air stiùireadh iomchaidh beusanta airson measadh air dàta fìor, le cead, a thàinig bho thùs taobh a-muigh, agus tha sin taobh a-muigh raon a’ bhenchmark fuadain seo.
A bharrachd air na ceithir sin, ’s e an leudachadh as buadhaiche a chaidh a phlanadh co-ionannachd ioma-chànanach gach uachdranas. Tha an Kantesti AI Engine a’ frithealadh air luchd-cleachdaidh ann an 75+ cànan, agus le bhith a’ ruith fo-bhuidhnean Second-Update le stratification a rèir cànain (Turcais, Gearmailtis, Spàinntis, Fraingis, Eadailtis, Portagailis, Arabais, Mandarin) tomhaisidh sin càileachd toraidh thar na cànanan a tha an einnsean a’ toirt taic dha. Thèid gach mion-sgrùdadh le stratification a rèir cànain fhoillseachadh le DOI fhèin agus meur harness fhèin.