Carson a tha am bun-mheasadh seo ann agus dè tha e a’ dèanamh deuchainn
Tha sgrùdadh fala AI le taic a’ sìor chleachdadh ann an sruthan-obrach luchd-cleachdaidh is clionaigeach, ach tha frèaman measadh ath-riochdachail a tha freagarrach do leigheas-lann fhathast tearc. Chan e na ceistean a tha cudromach san t-suidheachadh seo an fheadhainn a tha air an còmhdach le bun-chomharraichean coitcheann airson ceistean is freagairtean meidigeach: an urrainn do einnsean iarann easbhaidh a sgaradh bho thalasaemia trait nuair a tha an mean corpuscular volume co-ionann, a bheil e a’ dèanamh cus-diagnosis air sionndrom Gilbert mar hepatitis, agus a bheil e a’ cruthachadh pathology ann am pannal sgrìonaidh gu tur àbhaisteach?
Mar as trice bidh pannal singilte deuchainn fala a’ toirt gu leòr comharra airson grunn mhìneachaidhean farpaiseach a shuidheachadh, agus is e obair an lighiche a tha a’ mìneachadh na mìneachaidhean sin a chuideamachadh an aghaidh a chèile seach freagairt leabhar-teacsa a tharraing a-mach. Faodaidh einnsean a tha math air cùisean leabhar-teacsa fhathast fàiligeadh air na cùisean a tha cudromach: na claonaidhean ann an breithneachadh eadar-dhealaichte, na caochlaidhean neo-chunnartach a tha coltach eagallach nuair a tha iad nan aonar, agus na pannalan gu tur àbhaisteach a tha a’ tàladh luchd-cuideachaidh misneachail gu bhith a’ dèanamh pathology suas.
Chaidh a’ bhun-chomharra seo a thogail timcheall air na modhan fàilligeadh sin. Chaidh gach aon de na còig-deug cùisean a thaghadh airson feart breithneachaidh sònraichte: microcytosis le dìth iarainn a dh’fheumar a chumail air leth bho trait beta-thalassaemia le mean corpuscular volume co-ionann, taisbeanadh syndrome Gilbert far nach eil ach aon neo-àbhaisteachd—hyperbilirubinaemia neo-dhìreach iomallach—agus pannal sgrìonaidh le còig-deug paramadair far a bheil a h-uile analyte taobh a-staigh an raoin iomraidh aige. Tha an rubrig a’ duaisachadh einnseanan a leughas gach cùis air na cumhaichean fhèin agus a’ peanasachadh einnseanan a ruigeas breithneachadh misneachail far nach eil breithneachadh mar sin iomchaidh.
Mar Thomas Klein, MD, thagh mi am pannal cùisean oir ’s iad na pàtrain sin a chì mi gu bheil luchd-cuideachaidh leigheas-lannsaidh-lann-lann (laboratory-medicine) a’ faighinn ceàrr as trice. Chan e "a bhith a" call galar tearc” an modh fàilligeadh daor—’s e pathology àbhaisteach a chruthachadh ann an euslaintich aig nach eil e. Ar Dearbhadh Meidigeach tha hub a’ mìneachadh an fhrèam nas fharsainge; tha an duilleag seo a’ mìneachadh a’ chiad dearbhadh bun-bheachd V11 agus an V11 Second Update a thug e gu 100,000 cùis gun urra air an tarraing bho stòr-dàta clionaigeach le taic SQL a’ còmhdach 127 dùthaich — a’ cleachdadh an aon rubraidh sgòraidh, co-ionann ri byte, gun chead airson atharrachadh post-hoc.
Ruith iomraidh as ùire — V11 Second Update (26 Giblean, 2026)
Thug an ruith iomraidh V11 Second Update air 26 Giblean 2026 a-mach sgòr co-phàirteach de 99.80% air an aon rubraidh ro-registrichte a chaidh a chleachdadh anns an fhoillseachadh tùsail V11, air a mheasadh air 100,000 cùis gun urra air an tarraing bhon stòr-dàta clionaigeach le taic SQL Kantesti agus a’ còmhdach 127 dùthaich agus cànanan 75+. Chrìochnaich a h-uile cùis air prìomh shlighe an einnsein; dh’fhan gnìomhachaidhean bratach hyperdiagnosis trap aig 0 / 87,412. Chòmhdaich an ruith thùsail V11 air 23 Giblean 2026 15 cùisean air an taghadh le làimh (99.12% co-phàirteach) agus dhearbh e an rubraidh; tha an Second Update a’ cumail an rubraidh sin co-ionann ri byte agus a’ leudachadh measadh gu co-bhonn aig ìre sluagh.
Bidh am foirmle co-phàirteach a’ cothlamadh trì pàirtean: co-chòrdadh structarail leis na seachd earrannan aithris èigneachail agus na sia-deug fo-earrannan èigneachail, cruinneas clionaigeach air a thomhas mar ath-ghairm faclan-luirg (keyword recall) plus ath-ghairm an t-siostaim sgòraidh (scoring-system recall) plus sgrùdadh dligheachd cuairteachaidh coltachd, agus latency freagairt an aghaidh targaid ìre-seirbheis air prìomh shlighe. Tha an dearbh sgaradh air a shealltainn anns an fhoirmle rubraidh gu h-ìosal — cha deach gin de na cuideaman no na fo-rubraidhean sin atharrachadh airson an Second Update.
Tha na 0.20 puingean sa cheud eile de rùm-cinn cha mhòr gu tur a’ briseadh sìos dhan fho-sgòr clionaigeach — bha bloigh bheag de chùisean (gu h-àraidh ann an Hepatology agus Rheumatology) far an robh aon prìomh-fhacal siostam-sgòraidh ris an robh dùil neo-làthair ann am mìneachadh an einnsein, ged a bha susbaint an dearbh-aithne ceart. Cha do chaill cùis sam bith anns a’ cho-bhonn 100,000-cùis den Second Update an dearbhadh fhèin. Dh’fheabhsaich latency bho chuibheas de 20.17 s anns an fhoillseachadh tùsail V11 gu 13.26 s anns an Second Update, a’ nochdadh optimisations an einnsein cinneasachaidh eadar an dà ruith; tha an rubraidh, an còd sgòraidh, agus an endpoint API gun atharrachadh.
Bha sgòran co-phàirteach gach dùthaich a’ dol bho 0.9971 (Na h-Innseachan) gu 0.9985 (An Eilbheis) thar na 30 dùthchannan as riochdaiche. Sheall an earball fada de 97 dùthaich a bharrachd (≈7,300 cùis còmhla) gun chrìonadh siostamach. B’ iad na prìomh luchd-tabhartais a rèir àireamh nan cùisean na Stàitean Aonaichte (10,500), Braisil (9,500), an Spàinn (9,000), an Eadailt (8,000), a’ Ghearmailt (7,800), an Fhraing (7,400), Portagail (5,800), Türkiye (3,400), an Rìoghachd Aonaichte (2,900), agus Mexico (2,500).
Bho 15 cùisean gu 100,000: mean-fhàs a’ cho-bhainn thar 127 dùthaich
Bha am pannal cùisean tùsail V11 a’ còmhdach seachd speisealachdan — hematology, endocrinology, leigheas metabolach, hepatology, nephrology, cardiology, rheumatology — a bharrachd air dà chùis shònraichte hyperdiagnosis trap, le gach cùis na chlàr fìor euslaintich gun urra a thàinig bhon stòr-dàta clionaigeach Kantesti fo chead fiosraichte sgrìobhte. Tha an V11 Second Update a’ leudachadh measadh gu 100,000 cùis gun urra thar 127 dùthaich, air an sgaoileadh thairis air ochd speisealachdan (na seachd tùsail plus bucaid sònraichte leigheas-inntinn a-staigh a bhios a’ gabhail a-steach an fo-sheata trap). Tha an aon rubraidh sgòraidh air a chur an sàs co-ionann ri byte thar an dà ruith.
Chaidh dì-aithneachadh a dhèanamh fo dhòigh Safe Harbor: chaidh na h-aithnichean dìreach uile a thoirt air falbh no an cur nan àite, agus chaidh còd cùis-bhroinn iomraidh a shònrachadh do gach clàr ann an cruth BT-NNN-LABEL (V11 tùsail) no còd cùis gun urra seasmhach case_uid airson an Second Update. Chaidh giullachd a dhèanamh a rèir GDPR Artaigil 9(2)(j) airson rannsachadh saidheansail le dìonan iomchaidh, agus na h-aon ullachaidhean co-ionann ann an UK GDPR. Chan eil fiosrachadh sam bith a dh’fhaodadh aithne pearsanta a dhèanamh ri fhaicinn an àite sam bith anns a’ chùis-luachaidh a chaidh fhoillseachadh, anns an aithisg theicnigeach, no anns na seataichean dàta a chaidh an leigeil ma sgaoil.
foillseachadh tùsail V11 — 15 cùisean air an taghadh le làimh
Chaidh am pannal cùise V11 tùsail a thaghadh le làimh le Dr. Thomas Klein gus na pàtrain breithneachaidh a chleachd luchd-cuideachaidh leigheas-lann a’ faighinn ceàrr as trice a chur an gnìomh. Chaidh gach aon de na còig cùisean deug a thaghadh airson feart breithneachaidh sònraichte, air a liostadh gu h-ìosal.
Carson an sgaoileadh sònraichte seo
Bidh hematology a’ faighinn trì cùisean oir ’s e na “microcytic differentials” agus na “macrocytic differentials” na “traps” as àirde ann an cleachdadh obair-lann làitheil. Bidh endocrinology a’ faighinn trì oir tha taisbeanaidhean Hashimoto’s, PCOS, agus cion bhiotamain D a’ cleachdadh cumaidhean breithneachaidh eadar-dhealaichte (air an stiùireadh le autoantibodies, air an stiùireadh le co-mheasan hormona, air an stiùireadh le aon chomharra). Tha na speisealachdan le aon chùis fhathast cudromach oir tha siostam sgòraidh fhèin aig gach cuid CKD, cunnart ASCVD, agus SLE a bu chòir don einnsean a ghairm (KDIGO staging, cunnart 10-bliadhna ASCVD, agus slatan-tomhais 2019 EULAR/ACR SLE fa leth).
Ùrachadh Àrd-sgoile V11 — 100,000 cùis gun urra thar 127 dùthaich
Tha an Dàrna Ùrachadh a’ dol an àite an V11 tùsail le còd cruaidh 15-cùis Python le ceist SQL paramadaichte, leugh-a-mhàin an aghaidh an tasglainn clionaigeach Kantesti (anonymised_blood_panels). Bidh an ceist a’ sìoladh air consent_research = 1 AND released_for_benchmark = 1 agus tha i air a clò-bhualadh aig mullach gach ruith measaidh airson soilleireachd. Tha cuairteachadh na buidhne a rèir speisealachd air a shealltainn gu h-ìosal.
Sgaoileadh cruinn-eòlais — na 10 dùthchannan as fheàrr
Tha an co-bhonn a’ còmhdach 127 dùthaich (ISO 3166-1 alpha-2). Tha an Roinn Eòrpa a’ cur 57.7% ris, na h-Ameireaganaich 25.4%, Àisia-Pacific 6.2%, inntrigidhean ainmichte san Ear-Mheadhanach/Afraga 3.4%, agus earball fada de 97 dùthaich a bharrachd mu 7.3% còmhla. ’S e na deich prìomh luchd-tabhartais na Stàitean Aonaichte (10,500), Braisil (9,500), an Spàinn (9,000), an Eadailt (8,000), a’ Ghearmailt (7,800), an Fhraing (7,400), Portagail (5,800), Türkiye (3,400), an Rìoghachd Aonaichte (2,900), agus Mexico (2,500). Bha sgòran coimeasach gach dùthcha eadar 0.9971 (Na h-Innseachan) agus 0.9985 (An Eilbheis).
An rubric clàraichte ro-làimh, air a mhìneachadh
Is e clàradh ro-làimh an roghainn modh-obrach as cudromaiche sa choimeas seo. Chaidh a h-uile breithneachadh ris a bheil dùil, a h-uile siostam sgòraidh clionaigeach, agus gach earrann aithris a ghealltainn do chòd stòr mus deach an einnsean a ghairm. Mar sin chan eil e comasach atharrachadh “post-hoc” air an rubra gus an einnsean a bhlàthachadh.
Tha trì pàirtean a’ dèanamh suas an sgòr choimeasach. Tha an pàirt structarail a’ cur 35 sa cheud ris agus a’ tomhas a bheil an einnsean air na seachd earrannan aithris èigneachail a thilleadh (header, summary, key findings, differential, scoring systems, recommendations, follow-up) agus na sia-deug fo-earrannan èigneachail taobh a-staigh iad. Tha làthaireachd earrann a’ cur 40 sa cheud ris agus tha làthaireachd fo-earrann a’ cur 60 sa cheud ris taobh a-staigh an àireamhachaidh structarail.
An pàirt clionaigeach a’ cur 55 sa cheud ris agus a’ cothlamadh trì rudan: cuimhneachadh air faclan-iuchrach breithneachaidh (70 sa cheud den fho-sgòr clionaigeach), cuimhneachadh air siostaman sgòraidh (20 sa cheud — am bi an einnsean a’ tomhas Mentzer, FIB-4, HOMA-IR, cunnart ASCVD, KDIGO staging, slatan-tomhais EULAR/ACR far a bheil sin iomchaidh), agus sgrùdadh dligheachd “probability-sum” (10 sa cheud — bu chòir do na coltasan anns an differential a bhith a’ cur suas taobh a-staigh an eadar-ama [90, 110]). Airson cùisean “trap”, thèid peanas soilleir airson “hyperdiagnosis” suas ri 0.30 a thoirt air falbh, air a thomhas mar 0.10 gach bratach pathology air a chruthachadh, le mullach aig trì brataichean.
An pàirt latency a’ cur 10 sa cheud ris. Gheibh freagairt fo 20 diog an 0.10 slàn, gheibh freagairt fo 40 diog 0.05, agus gheibh rud sam bith nas slaodaiche neoni. Tha an targaid 20-diog a’ nochdadh amas ìre seirbheis “production primary-path”; tha an mullach 40-diog a’ nochdadh buidseat “Phase 2 fallback” airson gairmean trom leis an einnsean.
Na tha clàradh ro-làimh a’ cur stad
Tha cliù aig coimeasan “first-party” airson a bhith a’ sèideadh na h-àireamhan aca fhèin tro atharrachadh rubra “post-hoc”. Tha am pàtran cha mhòr an-còmhnaidh an aon rud: bidh an sgioba a’ ruith an einnsean, a’ faicinn far a bheil e a’ coileanadh gu dona, agus an uair sin ag atharrachadh an rubra gu sàmhach gus am bi na raointean a tha a’ coileanadh gu dona a’ cunntadh nas lugha. Le bhith a’ gealltainn an rubra do chòd stòr mus tèid a’ chiad ghairm einnsean a dhèanamh agus le bhith a’ foillseachadh an “harness” fo chead MIT, bidh an atharrachadh sin follaiseach ann an smachd dreach. Faodaidh duine sam bith an stòr-tasgaidh a chlònadh, cinn-latha ùghdair an rubra a sgrùdadh, agus dearbhadh nach deach toraidhean an einnsean a chleachdadh gus an sgòrachadh a chumadh.
Cùisean “hyperdiagnosis trap” — carson ’s e cus-aithneachadh an fhìor dhòigh fàilligeadh
Tha gairm ro-throm air pathology air sgrìonaichean àbhaisteach na dhòigh fàilligeadh a chaidh a chlàradh ann an luchd-cuideachaidh meidigeach do luchd-cleachdaidh. Tha na cosgaisean às dèidh sin a’ gabhail a-steach sgrùdadh neo-riatanach, iomagain euslaintich, agus obair-lorg iatrogenic. Tha an dà chùis “trap” sa choimeas seo air an dealbhadh gus am modh fàilligeadh sin a dhèanamh follaiseach agus comasach air sgòradh.
🟡 Trap 1 — BT-014-GILBERT
Taisbeanadh. Fear 24-bliadhna le bilirubin iomlan de 2.4 mg/dL. Tha an roinn dhìreach àbhaisteach, tha transaminases agus phosphatase alcalin taobh a-staigh nan raointean iomraidh aca, chan eil reticulocytes neo-àbhaisteach, agus tha haptoglobin agus LDH a’ cur às do haemolysis.
Mìneachadh ceart. Syndrome Gilbert — polymorphism UGT1A1 neo-bhitheach. Cha bu chòir don mhìneachadh hepatitis, cirrhosis, anaemia haemolytic, no bacadh biliary a ghairm.
Toradh V11. Coimeas 1.000. Cha do nochd gin de na sia brataichean over-diagnosis a chaidh an cumail sùil orra mar bhreithneachaidhean gnìomhach.
🟡 Trap 2 — BT-015-HEALTHY
Taisbeanadh. Boireannach 35-bliadhna le pannal sgrìonaidh àbhaisteach le còig-deug paramadair. Tha a h-uile analyte gu comhfhurtail taobh a-staigh an raoin iomraidh aca.
Mìneachadh ceart. Dearbhadh agus cumail suas dòigh-beatha. Cha bu chòir don mhìneachadh pathology crìche a chruthachadh gus a bhith coltach gu bheil e feumail gu clinigeach.
Toradh V11. Co-chruinneachadh 1.000. Cha do nochd gin de na seachd brataichean ro-innse ro-bheachdach a chaidh an cumail sùil — tinneas an t-siùcair, anemia, hypothyroidism, dyslipidaemia, hepatitis, tinneas nan dubhagan, easbhaidh — mar dhearbhadh gnìomhach.
Thairis air an dà “trap”, chaidh sùil a thoirt air trì-deug brataichean hyperdiagnosis a chaidh an cumail sùil. Cha deach gin dhiubh a bhrosnachadh. ’S e seo an toradh as cudromaiche do neach-clionaig sam bith a tha a’ beachdachadh air einnsean AI a chleachdadh mar inneal triage no ro-chomhairle: cha do chruthaich an siostam tinneas far nach robh gin ann.
Clàr Mentzer: a’ sgaradh easbhaidh iarainn bho fheart thalasaemia
Tha lorg àrd-luach eile a’ buntainn ri paidhrigeadh cùis BT-001 (anemia easbhaidh iarainn) le cùis BT-007 (beta-thalasaemia beag). Tha an dà chuid a’ nochdadh microcytosis agus ’s e cnapan-starra ainmeil a tha seo do luchd-seòrsachaidh neo-eòlach. Tha clàr Mentzer, air a thomhas mar MCV air a roinn le cunntas RBC, nas àirde na 13 ann an easbhaidh iarainn agus nas ìsle na 13 ann an feart thalasaemia.
Ann am BT-001, bha an t-euslainteach na boireannach 34-bliadhna le hemoglobin 10.4 g/dL, MCV 72.4 fL, RBC 4.1 × 10¹²/L, ferritin 6 ng/mL, agus TIBC àrd. Tha clàr Mentzer de mu 17.7 a’ toirt taic do dh’easbhaidh iarainn iomlan. Ann am BT-007, bha an t-euslainteach na dhuine 28-bliadhna le microcytosis (MCV 65.8 fL) ach cunntas RBC àrd de 6.2, RDW àbhaisteach, ferritin àbhaisteach, agus HbA2 de 5.6 sa cheud. Tha clàr Mentzer de mu 10.6 a’ comharrachadh feart thalasaemia, agus tha HbA2 àrd a’ dearbhadh beta-thalasaemia beag.
Fhuair an dà chùis sgòr 1.000. Dh’ iarr an einnsean clàr Mentzer gu soilleir anns an dà mhìneachadh agus thug e seachad an dearbhadh ceart anns gach cùis. ’S e seo an aon toradh as dearbhach gu clinigeach anns a’ bhun-chomharra gu lèir, oir tha mearachd ann a bhith a’ seòrsachadh feart thalasaemia mar easbhaidh iarainn a’ leantainn gu cur-ris iarainn neo-iomchaidh agus cothroman sgrìonaidh teaghlaich a chall, agus tha mearachd ann a bhith a’ seòrsachadh easbhaidh iarainn mar thalasaemia a’ dàil a chur air leigheas ath-chuiridh sìmplidh. An a’ stiùireadh raon ferritin a’ mìneachadh co-theacsa eadar-dhealachaidhean nas fharsainge.
Toraidhean gach cùis bhon ruith iomraidh tùsail V11 (23 Giblean, 2026)
Tha an ruith iomraidh tùsail V11 air a’ cho-bhonn dearbhaidh 15-cùis a’ frithealadh mar bun-stèidh modh-obrach airson an Second Update: tha gach mion-fhiosrachadh mu chùis gu h-ìosal a’ sealltainn mar a làimhsicheas an rubraig freagairt fìor einnsein. Ràinig dusan de chòig-deug cùis mullach an sgòr coimeasach de 1.000 air a’ phrìomh shlighe; chaidh trì cùisean a fhrithealadh tron ath-fhilleadh Phase 2, a’ call bonus latency 0.05 fhad ’s a bha iad a’ gleidheadh a h-uile susbaint clionaigeach is structarail. Bha aon chùis a dhìth air fo-earrann riatanach singilte; thill aon fhear suim cuairteachaidh coltachd a bha beagan nas lugha.
Chaill cùis PCOS (BT-008) fo-ear-phàirt èigneachail singilte ann an structar an fhreagairt — còig-deug deug air fhichead ’s a sia an àite sia-deug deug air fhichead — rud a lùghdaich sgòr structarail bho 1.000 gu 0.963. Thill cùis SLE (BT-011) suim cuairteachaidh coltachd a bha beagan nas ìsle, a thug an sgòr clionaigeach gu 0.965 fhad ’s a bha a h-uile prìomh fhacal breithneachaidh agus siostam sgòraidh air a ghleidheadh. Cha do chaill gin de na cùisean fo-thorrach breithneachadh ceart.
Cruinneachadh V11 Second Update — 100,000 cùis
Aig ìre sluagh, chan eil sreathan fa leth de chùisean leughaidh do dhaoine, agus mar sin tha an Second Update ag aithris meatrics cruinnichte seach clàr 100,000-sreath. Tha an prìomh sgòr cruinnichte air a shealltainn gu h-ìosal; tha briseadh sìos a rèir speisealachd agus a rèir dùthaich air fhoillseachadh anns an aithisg theicnigeach agus tasgadh Figshare. Thèid sampall air thuaiream stratamaichte de n = 201 freagairtean amh an einnsein (sìol deatamach 20260426) fhoillseachadh anns an eòlaire GitHub results/ airson sgrùdadh.
Na tha an sgòr cinn-naidheachd nach innis dhuinn
Tha sgòr co-phàirteach de 99.80 sa cheud fon riaghailt ro-chlàraichte shònraichte seo, air co-bhuidheann neo-aithnichte de 100,000 cùis a’ còmhdach 127 dùthaich, a’ riochdachadh coileanadh faisg air a’ mhullach — ach tha feum air frèamadh cùramach. Tha an toradh a’ mìneachadh giùlan an einnsein an aghaidh na riaghailt ris an do gheall sinn còd stòr ann an V11; chan e tagradh uile-choitcheann a th’ ann mu cheartas an einnsein air gach pannal deuchainn fala a tha ann an saoghal fìor.
Tha an sgòr ag ràdh gun do làimhsich an einnsean na pàtrain breithneachaidh a chaidh a thaghadh airson an luachaidh seo gu ceart thar co-bhuidheann aig ìre an t-sluaigh, air dòigh-obrach a tha foillsichte agus ath-riochdachadh. Chan eil e ag ràdh gu bheil an einnsean ceart air gach pannal deuchainn fala a tha ann an saoghal fìor. Chan eil e ag ràdh gum bu chòir don einnsean breithneachadh clionaigeach a chur na àite. Agus chan eil e ag ràdh gu bheil an einnsean nas fheàrr na siostaman AI eile — chaidh mion-sgrùdaidhean coimeasach an aghaidh einnseanan eile a chumail a-mach gu h-aon ghnothach bhon aithisg seo.
Is e an rud a tha an sgòr a’ stèidheachadh bun-loidhne. Leis an riaghailt agus an inneal-taic a tha poblach, faodar dreachan san àm ri teachd den einnsean a mheasadh an aghaidh an aon riaghailt — air a chur an sàs anns na 15 cùisean tùsail V11, co-bhuidheann 100,000 cùis an Ùrachaidh Àireamh 2, no leudachadh sam bith às dèidh sin — agus tha an beàrn eadar an sgòr foillsichte agus ruith sam bith às dèidh sin fhèin tomhasail. Seo luach ro-chlàraidh: bidh e ag atharrachadh tagraidhean coileanaidh gu tagraidhean a ghabhas deuchainn.
Mar a nì thu ath-riochdachadh air a’ bhun-chomharra seo ann an 10 mionaidean
Chan fheum ath-riochdachadh ach paidhir teisteanais API Kantesti agus àrainneachd Python 3.10 no nas fhaide air adhart leis an requests agus reportlab na leabharlannan air an stàladh. Tha an uidheam slàn na aon mhodal Python fèin-chumanta air a leigeil ma sgaoil fo chead MIT.
Ceithir ceumannan gu ruith ùr
Aon. Clonaich an stòr-dàta: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. Dà. Stàlaich eisimeileachd le pip install -r requirements.txt (Bidh an Ùrachadh Àireamh 2 a’ cur ris mysql-connector-python ≥ 8.0 airson an luchd-labhairt cùisean SQL). Trì. Suidhich KANTESTI_USERNAME agus KANTESTI_PASSWORD mar chaochladairean àrainneachd airson API an einnsein. Airson an luchd-labhairt cùisean SQL san Ùrachadh Àireamh 2, suidhich cuideachd KANTESTI_DB_HOST, KANTESTI_DB_PORT, KANTESTI_DB_NAME, KANTESTI_DB_USER, agus KANTESTI_DB_PASSWORD — bidh an loader a’ ceangal tro dhreuchd leughaidh a-mhàin (bench_reader) aig nach eil ceadan air clàran aithneachaidh. Ceithir. Ruith python benchmark_bloodtest.py --limit 100000 airson an ruith Iomlan Second-Update, no python benchmark_bloodtest.py --limit 1000 airson ath-aithris luath. Bidh toraidhean a’ tighinn gu ./benchmark_results/: cairt sgòra CSV le colbhan gach dùthaich agus gach speisealachd, cruinneachadh JSON, sampall freagairt amh le stratification-random, agus aithisg Markdown.
Tha na ruith iomraidh bho 23 Giblean 2026 (V11 tùsail, 15 cùisean) agus 26 Giblean 2026 (V11 Second Update, 100,000 cùisean) air an gleidheadh anns an results/ eòlaire san stòr-tasgaidh. Cruthaichidh ruith ùr cairt sgòra le stampa-ùine ùr fhad ’s a bhios na ruith iomraidh gun atharrachadh. Ma bheir an ruith agad toradh gu math eadar-dhealaichte, feuch an fosgail thu cùis GitHub leis an stampa-ùine ruith agus an dreach einnsein a thèid a thilleadh ann am meata-dàta an fhreagairt.
Cuingeachaidhean agus obair san àm ri teachd
Fiù ’s le 100,000 cùisean thar 127 dùthaich, tha ceithir cuingeachaidhean a’ feumachdainn aideachadh soilleir: fo-samplachadh air earball fada dhùthchannan, measadh aon-ùine, raon aon-einnsein, agus tùs dàta aon-stòr. Thathar gan dèiligeadh an-dràsta ann an obair leantainneach.
Còmhdach dùthchannan air earball fada. Tha an Second Update a’ còmhdach 127 dùthaich, ach tha an sgaoileadh neo-chothromach — tha na 10 prìomh luchd-tabhartais a’ dèanamh suas ≈66.4% de na cùisean, agus tha an earball fada de 97 dùthaich a bharrachd a’ cur ≈7.3% ris còmhla (mu 7,300 cùisean gu h-iomlan, ~75 cùis gach dùthaich gu cuibheasach). Mar sin tha co-chruinneachaidhean gach dùthaich san earball fhada nas fuaimneach na tha na figearan prìomh-loidhne a’ moladh. Bidh ruithichean san àm ri teachd a’ taghadh gu roghnach bho dhùthchannan le fo-samplachadh gus tuairmsean gach uachdranas a dhaingneachadh.
Measadh aon-seilg. Chaidh gach cùis san cho-bhuidheann a mheasadh aon uair. Tha caochlaideachd toraidh nach eil beag aig modalan cànain mòra eadhon aig teòthachd samplachaidh ìosal, agus mar sin ’s e ceum nàdarra an ath cheum protocol ioma-ruith le còig measadh gach cùis agus caochlaideachd air aithris — gu h-àraidh air an fho-bhuidheann “trap-case”, far a bheil cunbhalachd fo jitter samplachaidh na phàirt den tagradh sàbhailteachd.
Raon aon-einnsein. Tha an aithisg seo a’ mìneachadh aon einnsean. Tha mion-sgrùdaidhean coimeasach an aghaidh siostaman AI eile taobh a-muigh raon na h-obrach an seo; ’s dòcha gun lean sinn orra mar sgrùdadh neo-eisimeileach air leth le modh-obrach iomchaidh, an aghaidh an aon harness le cead MIT.
Tùs dàta aon-stòr. Tha na 100,000 cùisean nan clàran fìor euslaintich gun urra a thàinig bho aon stòr clionaigeach (an Kantesti stòr-dàta clionaigeach le taic SQL). Tha iad a’ riochdachadh sruth riochdachaidh fo-thaghadh agus chan eil iad nan tarraing air thuaiream a tha riochdachail don t-sluagh aig ìre na cruinne. Tha leudachadh an measadh gu dàta ioma-ionad a thig bho thùsan taobh a-muigh air an rathad.
A bharrachd air na ceithir sin, ’s e an leudachadh as buadhaiche a chaidh a phlanadh co-ionannachd ioma-chànanach gach uachdranas. Tha an Kantesti AI Engine a’ frithealadh air luchd-cleachdaidh ann an 75+ cànan, agus le bhith a’ ruith fo-bhuidhnean Second-Update le stratification a rèir cànain (Turcais, Gearmailtis, Spàinntis, Fraingis, Eadailtis, Portagailis, Arabais, Mandarin) tomhaisidh sin càileachd toraidh thar na cànanan a tha an einnsean a’ toirt taic dha. Thèid gach mion-sgrùdadh le stratification a rèir cànain fhoillseachadh le DOI fhèin agus meur harness fhèin.