Standardi i analizës së gjakut me AI Kantesti

Benchmark i Automatizuar Standard i Regjistruar paraprakisht i Benchmark-ut Përditësimi i Dytë i V11 — Prill 2026 I licencuar nga MIT I Riprodhueshëm · Të Dhëna të Hapura Kohoort sintetik prej 100 mijë · 127 etiketa vendesh

Rezultat i përbërë 99.80% sipas një rubrike të pararegistruar — Përditësimi i dytë V11, kohoort me 100,000 raste në 127 etiketa vendesh

Një benchmark teknik i automatizuar i pararegistruar, i bazuar në rubrikë, i motorit Kantesti mbi 100,000 raste testesh të gjeneruara në mënyrë sintetike, të etiketuar me 127 etiketa vendesh. Ai mat përputhshmërinë e daljes, jo saktësinë diagnostike. Rubrika u ngrinë në kodin burimor përpara publikimit fillestar të V11 dhe u mbajt identike në bajt për këtë Përditësim të Dytë; mjeti i vlerësimit është i licencuar nga MIT; një mostër e rastësishme e shtresëzuar e përgjigjeve të papërpunuara të motorit publikohet për inspektim. Të gjitha rastet janë sintetike; nuk përdoren të dhëna personale.

📖 ~14 minuta 📅 Publikuar më 23 prill 2026 · Përditësuar më 26 prill 2026 (Përditësimi i Dytë i V11) 🔗 DOI: 10.6084/m9.figshare.32095435

📝 Publikuar: 23 prill 2026 🔄 Përditësimi i Dytë i V11: 26 Prill 2026 🩺 Rishikuar mjekësisht: 26 Prill 2026 ✅ Rubrikë e Pararegistruar (Identike në Bajte) 🔓 Kod & të dhëna të hapura

Ky benchmark i automatizuar u projektua dhe u ekzekutua nga Julian Emirhan Bulut, Inxhinier i Lartë i AI dhe CEO i Kantesti Ltd. Vlerësimi është plotësisht i automatizuar në kodin burim; rubrika e vlerësimit dhe paneli i rasteve u zhvilluan me input klinik nga Dr. Thomas Klein, MD, Shef i Mjekësisë (Chief Medical Officer) në Kantesti AI, dhe u rishikuan nga Bordi Këshillimor Mjekësor i Kantestit AI. Është një benchmark i brendshëm i vetë-ekzekutuar, jo një benchmark i pavarur ose i verifikuar nga kolegë, i automatizuar teknik.

Autor Kryesor & Mbikëqyrje Klinike

Thomas Klein, MD

Kryemjeku, Kantesti AI

Dr. Thomas Klein është një hematolog klinik dhe internist i certifikuar nga bordi, me mbi 15 vjet përvojë në mjekësinë laboratorike. Si Shef Mjekësor në Kantesti AI, ai përzgjodhi panelin e rasteve për këtë benchmark, shqyrtoi përmbajtjen klinike dhe përgjigjet e pritshme të rasteve sintetike dhe miratoi rubrikën e pararegistruar përpara thirrjes së parë të motorit.

ORCID 0009-0009-1490-1321 Porta e Kërkimeve Google Scholar

Bashkëautor & Implementim

Julian Emirhan Bulut

Inxhinier i Lartë i AI & CEO, Kantesti Ltd

Julian Emirhan Bulut është themeluesi dhe CEO i Kantesti Ltd. Ai projektoi dhe implementoi mjetin e vlerësimit — duke përfshirë ngarkuesin e rasteve SQL të shtuar për Përditësimin e Dytë të V11 — kreu integrimin e API-së, realizoi si ekzekutimin fillestar referencë të V11 ashtu edhe ekzekutimin e Përditësimit të Dytë të V11 me 100,000 raste, dhe përgatiti agregimin statistikor. Themelues i platformës që nga viti 2019.

GitHub Rreth Kantestit

⚡ Përmbledhje e shpejtë Përditësimi i Dytë i V11 — 26 Prill 2026

Rezultat i përbërë 99.80% mbi 100,000 raste testesh sintetike të gjakut në tetë specialitete mjekësore dhe 127 etiketa vendesh (Përditësimi i Dytë V11).
Zero false-pozitive të hiperdianagnozës nëpër 87,412 mundësi të flamurit “trap-case” të monitoruara — e njëjta metodologji “trap-case” si në V11 fillestar, e shkallëzuar në nivel popullsie.
Rubrikë e pararegistruar i ngrirë në kodin burimor përpara ekzekutimit fillestar të V11 dhe i mbajtur identik në bajte për këtë Përditësim të Dytë — nuk ishte e mundur asnjë rregullim post-hoc.
Indeksi Mentzer u aplikua saktë për të dalluar aneminë nga mungesa e hekurit nga beta-talassemia e lehtë në publikimin fillestar të V11; sjellja diferenciale u ruajt në nivel popullsie.
Vetëm endpoint prodhimi — pa “privileged routing”, vlerësuar saktësisht siç do ta aksesonte një klient që paguan.
Latencë mesatare 13.26 sekonda end-to-end (intervali 9.0–16.94 s), me të gjitha 100,000 rastet që përfunduan në shtegun kryesor të motorit.
Kohoort sintetik. 100,000 raste testesh të gjeneruara në mënyrë sintetike të ngarkuara në kohë ekzekutimi. Nuk përdoren të dhëna sintetike dhe as të dhëna personale.
“Harness” me licencë MIT publikuar në GitHub me një mostër të rastësishme të shtresëzuar (n = 201) të përgjigjeve të plota të papërpunuara të motorit për inspektim.
DOI në Figshare: 10.6084/m9.figshare.32095435 · Pasqyruar në ResearchGate, Academia.edu, GitHub.

Pse ekziston ky benchmark dhe çfarë teston

interpretimi i analizave të gjakut me AI po përdoret gjithnjë e më shumë në procese pune për konsumatorë dhe në mjedise klinike, megjithatë kornizat e vlerësimit të riprodhueshme të përshtatura për mjekësinë laboratorike mbeten të rralla. Pyetjet që kanë më shumë rëndësi në këtë kontekst nuk janë ato të mbuluara nga standardet e përgjithshme të pyetje-përgjigjes mjekësore: a mundet një motor të dallojë mungesën e hekurit nga tipari i talasemisë kur vëllimi mesatar korpuskular është identik, a e diagnostikon gabimisht sindromën e Gilbert-it si hepatit, dhe a prodhon patologji në një panel kontrolli plotësisht normal?

Një panel i vetëm i analizave të gjakut zakonisht përmban sinjal të mjaftueshëm për të mbështetur disa interpretime konkurruese, dhe puna e mjekut që interpreton është t’i peshojë ato interpretime kundrejt njëra-tjetrës, jo të rikuperojë një përgjigje si në tekst shkollor. Një motor që ia del mirë në rastet “nga teksti” mund të dështojë ende në ato raste që kanë më shumë rëndësi: kurthet e diagnozës diferenciale, variantet beninje që duken alarmante kur merren veçmas, dhe panelet plotësisht normale që i tundin asistentët e sigurt të prodhojnë patologji të fabrikuar.

Ky benchmark u ndërtua pikërisht rreth këtyre mënyrave dështimi. Secili prej pesëmbëdhjetë rasteve u zgjodh për një veçori të caktuar diagnostike: një mikrocitozë nga mungesa e hekurit që duhet të mbahet e veçuar nga një tipar i beta-talassemisë me vëllim mesatar të eritrociteve identik, një paraqitje e sindromës së Gilbert-it ku e vetmja anomali është një hiperbilirubinemi e izoluar indirekte, dhe një panel shqyrtimi me pesëmbëdhjetë parametra ku çdo analit qëndron brenda intervalit të tij të referencës. Rubrika shpërblen motorët që e lexojnë çdo rast sipas kushteve të veta dhe penalizon motorët që arrijnë në një diagnozë të sigurt kur një diagnozë e tillë nuk justifikohet.

Si Thomas Klein, MD, e zgjodha panelin e rasteve sepse këto janë modelet që i shoh se asistentët e mjekësisë laboratorike i ngatërrojnë më shpesh. Mënyra e shtrenjtë e dështimit nuk është "të humbasësh një sëmundje të rrallë" — është të fabrikohet patologji rutinë te pacientët që nuk e kanë atë. Tonë Validimi Mjekësor hub përshkruan kornizën më të gjerë; kjo faqe përshkruan provën fillestare të V11 dhe Përditësimin e Dytë V11 që e shkallëzoi atë në 100,000 raste sintetike të nxjerra nga një grup rastesh sintetik që përfshin 127 etiketa vendesh — duke përdorur të njëjtën rubrikë vlerësimi, identike në bajt, pa lejuar akordim post-hoc.

Ekzekutimi i fundit i referencës — V11 Përditësimi i Dytë (26 prill 2026)

Ekzekutimi i referencës së V11 Përditësimit të Dytë më 26 prill 2026 prodhoi një rezultat të përbërë prej 99.80% në të njëjtën rubrikë të pararegistruar të përdorur në publikimin fillestar të V11, vlerësuar në 100,000 raste sintetike të nxjerra nga grupi i rasteve sintetike të Kantesti dhe që shtrihen në 127 etiketa vendesh dhe gjuhët 75+. Çdo rast u përfundua në shtegun kryesor të motorit; aktivizimet e flamurit të hiperdetektimit të rasteve-trap mbetën në 0 / 87,412. Ekzekutimi origjinal i V11 më 23 prill 2026 mbuloi 15 raste të kuruara manualisht (rezultat i përbërë 99.12%) dhe verifikoi rubrikën; Përditësimi i Dytë e mban atë rubrikë identike në nivel bajtesh dhe e shtrin vlerësimin në një grup në shkallë popullsie.

I përbërë 99.80% 100,000 nga 100,000 raste me rezultat

1.000 Rezultati strukturor

0.996 Rezultati klinik

13.26 s Mesatarja e vonesës

0 / 87,412 Pozitivë të rremë në kurthe

Formula e përbërë kombinon tre komponentë: përputhshmëria strukturore me shtatë seksionet e detyrueshme të raportimit dhe gjashtëmbëdhjetë nënseksionet e detyrueshme, saktësia e përmbajtjes e matur si rikujtim i fjalëkyçeve plus rikujtim i sistemit të pikëzimit plus një kontroll i vlefshmërisë së shpërndarjes së probabilitetit, dhe vonesa e përgjigjes kundrejt objektivit të shërbimit në shtegun kryesor. Dekompozimi i saktë tregohet në formulën e rubrikës më poshtë — asnjë nga këto pesha apo nën-rubrika nuk u ndryshua për Përditësimin e Dytë.

I përbërë = 0.35 × Struktura + 0.55 × Klinika + 0.10 × Vonesa

Pikat e mbetura të hapësirës (headroom) prej 0.20 përqindësh dekompozohen pothuajse tërësisht në nën-rezultatin klinik — një pjesë e vogël e rasteve (kryesisht në Hepatologji dhe Reumatologji) kishin një fjalë kyçe të pritur të sistemit të vlerësimit që mungonte në interpretimin e motorit, pavarësisht se përmbajtja diagnostike ishte e saktë. Asnjë rast në grupin e Përditësimit të Dytë me 100,000 raste nuk e humbi vetë diagnozën. Latenca u përmirësua nga një mesatare prej 20.17 s në publikimin fillestar të V11 në 13.26 s në Përditësimin e Dytë, duke reflektuar optimizimet e motorit të prodhimit midis dy ekzekutimeve; rubrika, kodi i vlerësimit dhe endpoint-i i API-së janë të pandryshuara.

Rezultatet e përbëra për etiketë varionin nga 0.9971 deri në 0.9985 në 30 etiketat më të përfaqësuara të vendeve. Fundi i gjatë i 97 etiketave shtesë (≈7,300 raste të kombinuara) nuk tregoi degradim sistematik. Etiketat më të shpeshta sipas numrit të rasteve ishin Shtetet e Bashkuara (10,500), Brazili (9,500), Spanja (9,000), Italia (8,000), Gjermania (7,800), Franca (7,400), Portugalia (5,800), Türkiye (3,400), Mbretëria e Bashkuar (2,900) dhe Meksika (2,500).

Nga 15 raste në 100,000: evolucion i kohoortit në 127 etiketa vendesh

Paneli origjinal i rasteve V11 mbulonte shtatë specialitete — hematologji, endokrinologji, mjekësi metabolike, hepatologji, nefrologji, kardiologji, reumatologji — plus dy raste të dedikuara “hyperdiagnosis trap”, ku secili rast ishte një panel analizash gjaku i gjeneruar në mënyrë sintetike. Përditësimi i Dytë V11 e shtrin vlerësimin në 100,000 raste sintetike në 127 etiketa vendesh, të shpërndara në tetë specialitete (shtatë origjinale plus një kategori e dedikuar e mjekësisë së brendshme që përthith nën-grupin trap). E njëjta rubrikë vlerësimi aplikohet identike në nivel bajtesh në të dy ekzekutimet.

Meqë të gjitha rastet janë të gjeneruara në mënyrë sintetike, nuk ka identifikues realë për t’u hequr dhe nuk përfshihen të dhëna personale. Çdo rast sintetik mban një kod të brendshëm të rastit për benchmark (BT-NNN-LABEL në grupin fillestar të V11, një case_uid në Përditësimin e Dytë). Asnjë e dhënë personale nuk shfaqet askund në mjetin e publikuar, raportin teknik ose në grupet e të dhënave të lëshuara.

publikimin fillestar të V11 — 15 raste të kuruara manualisht

Paneli origjinal i rastit V11 u përzgjodh me dorë nga Dr. Thomas Klein për të ushtruar modelet diagnostike që asistentët e mjekësisë laboratorike i ngatërrojnë më shpesh. Secili nga pesëmbëdhjetë rastet u zgjodh për një veçori të caktuar diagnostike, e renditur më poshtë.

Hematologji (3) BT-001, BT-006, BT-007 Anemi nga mungesa e hekurit · Mungesë e B12 · Talasemi beta e lehtë (minor)

Endokrinologji (3) BT-002, BT-008, BT-012 Tiroiditi i Hashimoto-s · PCOS me rezistencë ndaj insulinës · Mungesë e rëndë e vitaminës D

Metabolike (2) BT-003, BT-013 T2DM me sindromë metabolike · Hiperurikemi me rrezik për përdhes

Hepatologji (2) BT-004, BT-009 NAFLD / NASH · Hepatit akut viral

Nefrologji · Kardiologji · Reumatologji (3) BT-005, BT-010, BT-011 Sëmundje kronike e veshkave (CKD) faza 3 · Dislipidemi aterogjene · Lupus eritematoz sistemik

Rastet “trap” (2) BT-014, BT-015 Sindroma e Gilbert-it (hiperbilirubinemi e izoluar indirekte) · Skriningu i të rriturve plotësisht normal

Pse kjo shpërndarje e veçantë

Hematologjia merr tre raste, sepse diferencialet mikrocitike dhe diferencat makrocitike janë kurthet me volumin më të lartë në praktikën reale të laboratorit. Endokrinologjia merr tre, sepse paraqitjet e Hashimoto-s, PCOS dhe mungesës së vitaminës D ushtrojnë forma të ndryshme diagnostikuese (të drejtuara nga autoantitrupat, të drejtuara nga raportet hormonale, të drejtuara nga një marker i vetëm). Specialitetet me një rast janë ende domethënëse, sepse secila prej CKD, rrezikut ASCVD dhe SLE ka sistemin e vet të pikëzimit që motori duhet ta thërrasë (stazhimi KDIGO, rreziku 10-vjeçar ASCVD, kriteret 2019 EULAR/ACR për SLE, përkatësisht).

Përditësimi i Dytë V11 — 100,000 raste sintetike në 127 etiketa vendesh

Përditësimi i Dytë zëvendëson literal-in origjinal të ngurtë 15-rastesh të Python-it të V11 me një grup më të madh, të gjeneruar në mënyrë programatike, të rasteve sintetike. Grupi i rasteve ngarkohet në fillim të çdo ekzekutimi dhe konfigurimi regjistrohet për transparencë. Shpërndarja e kohoortit sipas fushës së përmbajtjes tregohet më poshtë.

Endokrinologji 23,900 raste (23.9%) Tiroidja, PCOS, mungesë e vitaminës D, boshti gonadal, hipofiza

Mjekësi metabolike 21,900 raste (21.9%) T2DM, sindromë metabolike, panele lipidike, hiperurikemi

Hematologji 15,400 raste (15.4%) Diferenciale mikrocitike dhe makrocitike, B12/folat, studime të hekurit

Hepatologji 12,400 raste (12.4%) NAFLD/NASH, hepatit viral, FIB-4, kolestazë

Mjekësi e brendshme (përfshirë nën-pjesën “trap”) 9,000 raste (9.0%) Prezantime të përziera dhe 8,723 raste të dedikuara “hyperdiagnosis trap”

Kardiologji 7,500 raste (7.5%) Rreziku ASCVD, dislipidemia aterogjenike, hs-CRP

Reumatologji 6,000 raste (6.0%) SLE, RA, vaskulit, panele të autoantitrupave (kriteret EULAR/ACR)

Nefrologji 4,000 raste (4.0%) Stadifikimi i CKD (KDIGO), trendet e eGFR, çrregullim i elektroliteve

Shpërndarja sintetike e etiketave të vendeve — top 10 etiketa

100,000 rastet sintetike mbajnë 127 etiketa vendesh (ISO 3166-1 alpha-2) për të ushtruar trajtimin e lokalitetit. Caktimi i etiketës: Evropa 57.7%, Amerikët 25.4%, Azia-Paqësori 6.2%, etiketa të emërtuara për Lindjen e Mesme/Afrikën 3.4% dhe një bisht i gjatë prej 97 etiketash shtesë afërsisht 7.3% të kombinuara. Dhjetë etiketat më të shpeshta sipas numrit të rasteve janë Shtetet e Bashkuara (10,500), Brazili (9,500), Spanja (9,000), Italia (8,000), Gjermania (7,800), Franca (7,400), Portugalia (5,800), Türkiye (3,400), Mbretëria e Bashkuar (2,900) dhe Meksika (2,500). Rezultatet e përbëra për etiketë varionin nga 0.9971 deri në 0.9985. Këto numërime etiketash janë veti të rasteve të gjeneruara të përdorura për të ushtruar trajtimin e lokalitetit — ato nuk janë përdorues realë dhe as mbulim gjeografik real në botën reale.

Rubrika e regjistruar paraprakisht, e shpjeguar

Regjistrimi paraprak është zgjedhja metodologjike e vetme më e rëndësishme në këtë benchmark. Çdo diagnozë e pritur, çdo sistem klinik pikëzimi dhe çdo seksion raporti u angazhuan në kodin burim përpara se të thirrej motori. Prandaj, akordimi post-hoc i rubrikës për ta bërë motorin të duket më mirë është i pamundur.

Tre komponentë përbëjnë rezultatin e përbërë. Komponenti strukturor kontribuon me 35 për qind dhe mat nëse motori ktheu shtatë seksionet e detyrueshme të raportit (titulli, përmbledhja, gjetjet kryesore, diferencimi, sistemet e pikëzimit, rekomandimet, ndjekja) dhe gjashtëmbëdhjetë nënseksionet e detyrueshme brenda tyre. Prania e seksionit peshon 40 për qind dhe prania e nënseksionit peshon 60 për qind brenda llogaritjes strukturore.

I/E/Të/Të komponenti klinik kontribuon me 55 për qind dhe kombinon tre gjëra: rikujtimi i diagnozës sipas fjalëkyçit (70 për qind e nën-pikës klinike), rikujtimi i sistemit të pikëzimit (20 për qind — a llogarit motori Mentzer, FIB-4, HOMA-IR, rrezikun ASCVD, stazhimin KDIGO, kriteret EULAR/ACR kur është relevante), dhe një kontroll i vlefshmërisë së shumës së probabiliteteve (10 për qind — probabilitetet e diferencës duhet të mblidhen brenda intervalit [90, 110]). Për rastet kurth, zbritet një penalitet i qartë për hiperdetajim deri në 0.30, i llogaritur si 0.10 për çdo flamur patologjie të fabrikuar, i kufizuar në tre flamuj.

I/E/Të/Të komponenti i vonesës kontribuon me 10 për qind. Një përgjigje nën 20 sekonda fiton 0.10 të plotë, një përgjigje nën 40 sekonda fiton 0.05, dhe çdo gjë më e ngadaltë fiton zero. Objektivi 20-sekondësh pasqyron objektivin kryesor të nivelit të shërbimit të prodhimit; kufiri 40-sekondësh pasqyron buxhetin e rikthimit të Fazës 2 për thirrje të rënda të motorit.

Çfarë parandalon regjistrimi paraprak

Benchmark-et e palës së parë janë të njohura për fryrjen e numrave të tyre përmes akordimit post-hoc të rubrikës. Modeli është pothuajse gjithmonë i njëjtë: ekipi e ekzekuton motorin, sheh ku nënperformon, pastaj rregullon në heshtje rubrikën që zonat që nënperformojnë të llogariten më pak. Duke e angazhuar rubrikën në kodin burim përpara thirrjes së parë të motorit dhe duke publikuar pajisjen nën licencën MIT, ky rregullim bëhet i dukshëm në kontrollin e versioneve. Çdokush mund ta klonojë depozitën, të kontrollojë datat e autorit të rubrikës dhe të verifikojë që rezultatet e motorit nuk u përdorën për të formësuar pikëzimin.

Rastet “kurth i hiperdiagnostikimit” — pse thirrja e tepërt është mënyra reale e dështimit

Thirrja agresive e patologjisë në ekrane normale është një mënyrë dështimi e dokumentuar e asistentëve mjekësorë për konsumatorë. Kostot e saj pasuese përfshijnë hetime të panevojshme, ankth te pacienti dhe punë mjekësore të shkaktuar nga ndërhyrja (iatrogjene). Dy rastet kurth në këtë benchmark janë projektuar për ta bërë këtë mënyrë dështimi të dukshme dhe të matshme.

🟡 Kurthi 1 — BT-014-GILBERT

Paraqitja. Një mashkull 24-vjeçar me bilirubinë totale 2.4 mg/dL. Fraksioni direkt është normal, transaminazat dhe fosfataza alkaline qëndrojnë brenda intervaleve të tyre të referencës, retikulocitet janë pa veçori, dhe haptoglobina dhe LDH përjashtojnë hemolizën.

Interpretimi i saktë. Sindroma e Gilbert-it — një polimorfizëm beninj i UGT1A1. Interpretimi nuk duhet të thërrasë hepatit, cirrozë, anemi hemolitike ose obstruksion biliar.

Rezultati V11. Kompoziti 1.000. Asnjë nga gjashtë flamujt e monitoruar për mbi-diagnostikim nuk u shfaq si diagnozë aktive.

🟡 Kurthi 2 — BT-015-HEALTHY

Paraqitja. Një panel rutinë skriningu me pesëmbëdhjetë parametra. Çdo analit qëndron rehat brenda intervalit të tij të referencës.

Interpretimi i saktë. Sigurim dhe ruajtje e stilit të jetesës. Interpretimi nuk duhet të krijojë patologji kufitare vetëm që të duket klinikisht i dobishëm.

Rezultati V11. Përbërësi 1.000. Asnjë nga shtatë flamujt e monitoruar për mbi-diagnostikim — diabeti, anemia, hipotiroidizmi, dislipidemia, hepatiti, sëmundja e veshkave, mungesa — nuk u shfaq si diagnozë aktive.

Në të dyja “trap”-et, u kontrolluan trembëdhjetë flamuj të monitoruar për hiperdetektim. Asnjë nuk u aktivizua. Ky është rezultati që ka më shumë rëndësi për çdo klinicist që po mendon të përdorë një motor AI si mjet triage ose para-konsultimi: sistemi nuk shpiku sëmundje aty ku nuk ekzistonte.

Indeksi Mentzer: ndarja e mungesës së hekurit nga tipari i talasemisë

Një gjetje e dytë me vlerë të lartë lidhet me çiftëzimin e rastit BT-001 (anemi nga mungesa e hekurit) me rastin BT-007 (talasemi beta e vogël). Të dyja paraqiten me mikrocitozë dhe janë një pengesë e njohur për klasifikuesit naivë. Indeksi Mentzer, i llogaritur si MCV pjesëtuar me numrin e RBC, tejkalon 13 te mungesa e hekurit dhe bie nën 13 te tipari i talasemisë.

Në BT-001, pacientja ishte një grua 34-vjeçare me hemoglobinë 10.4 g/dL, MCV 72.4 fL, RBC 4.1 × 10¹²/L, ferritinë 6 ng/mL dhe TIBC të rritur. Indeksi Mentzer prej afërsisht 17.7 mbështet mungesën absolute të hekurit. Në BT-007, pacienti ishte një burrë 28-vjeç me mikrocitozë (MCV 65.8 fL), por me një numër të lartë RBC prej 6.2, RDW normal, ferritinë normale dhe HbA2 prej 5.6 për qind. Indeksi Mentzer prej afërsisht 10.6 tregon për tiparin e talasemisë, dhe HbA2 e rritur konfirmon talaseminë beta të vogël.

Anemi nga mungesa e hekurit Mentzer > 13 Ferritinë e ulët, TSAT e ulët, TIBC e lartë, RDW e rritur

Tipari i talasemisë beta Mentzer < 13 Ferritinë normale, RDW normale, HbA2 e rritur (>3.5%), numër i lartë RBC

Të dy rastet shënuan 1.000. Motori e përdori në mënyrë eksplicite indeksin Mentzer në të dy interpretimet dhe dha diagnozën e saktë në secilin rast. Ky është rezultati i vetëm më qetësues klinikisht në të gjithë benchmark-un, sepse keqklasifikimi i tiparit të talasemisë si mungesë hekuri çon në suplementim të papërshtatshëm me hekur dhe në humbje të mundësive për shqyrtim të historisë familjare, ndërsa keqklasifikimi i mungesës së hekurit si talasemi e vonon terapinë e thjeshtë zëvendësuese. Tonë për intervalin e ferritinës shpjegon kontekstin më të gjerë të diferencimit.

Rezultatet për rast nga ekzekutimi fillestar referencë i V11 (23 prill 2026)

Ekzekutimi origjinal referencë i V11 në koortën provë-koncept me 15 raste shërben si themeli metodologjik i Second Update: çdo detaj për rastin më poshtë tregon se si rubrika trajton një përgjigje reale të motorit. Dymbëdhjetë nga pesëmbëdhjetë rastet arritën rezultatin maksimal të përbërë prej 1.000 në rrugën kryesore; tre raste u shërbyen përmes rikthimit të Phase 2, duke humbur bonusin e latencës 0.05 ndërkohë që ruajtën të gjithë përmbajtjen klinike dhe strukturore. Një rast mungonte një nënseksion i vetëm i detyrueshëm; një tjetër ktheu një shumë të shpërndarjes së probabilitetit paksa të reduktuar.

ID e rastit Specialiteti I përbërë Latency Path

BT-001-IDAHematologji1.00017.8 sprimary

BT-006-B12Hematologji1.00018.4 sprimary

BT-007-THALHematologji1.00017.0 sprimary

BT-002-HASHEndokrinologji0.95037.0 srikthim (fallback)

BT-008-PCOSEndokrinologji0.98718.6 sprimary

BT-003-T2DMMetabolike1.00019.1 sprimary

BT-013-GOUTMetabolike1.00019.4 sprimary

BT-004-NAFLDHepatologji1.00019.6 sprimary

BT-009-VIRHEPHepatologji0.95023.4 srikthim (fallback)

BT-014-GILBERTKurth (Trap)1.00018.9 sprimary

BT-005-CKDNefrologji1.00017.4 sprimary

BT-010-ASCVDKardiologji1.00019.7 sprimary

BT-011-SLEReumatologji0.98118.2 sprimary

BT-012-VITDEndokrinologji1.00019.3 sprimary

BT-015-HEALTHYKurth (Trap)1.00018.7 srikthim (fallback)

Rasti i PCOS (BT-008) humbi një nënseksion të detyrueshëm në strukturën e përgjigjes — pesëmbëdhjetë nga gjashtëmbëdhjetë në vend të gjashtëmbëdhjetë nga gjashtëmbëdhjetë — gjë që uli pikën strukturore nga 1.000 në 0.963. Rasti i SLE (BT-011) ktheu një shumë të lehtë të reduktuar të shpërndarjes së probabilitetit që e uli pikën klinike në 0.965, duke ruajtur çdo fjalë kyçe diagnostike dhe sistem pikëzimi. Asnjë nga dy rastet nën-optimale nuk humbi një diagnozë të saktë.

Agregati V11 Second Update — 100,000 raste

Në shkallë popullsie, rreshtat individualë të rasteve nuk janë të lexueshëm nga njeriu, prandaj Përditësimi i Dytë raporton metrika të agreguara, jo një tabelë me 100,000 rreshta. Agregati kryesor tregohet më poshtë; zbërthimet sipas specialitetit dhe sipas etiketës së vendit publikohen në raportin teknik dhe në depozitimin Figshare. Një mostër e rastësishme e shtresëzuar e n = 201 përgjigjeve të papërpunuara të motorit (farë deterministe 20260426) publikohet në direktorinë GitHub results/ për inspektim.

Rezultati i përbërë Fillestar V11: 0.9912 (99.12%) → Second Update: 0.9980 (99.80%) Δ = +0.0068 në koortën me 100,000 raste

Rezultati strukturor (mesatar) Fillestar V11: 0.998 → Second Update: 1.000 Konformitet perfekt strukturor në shkallë popullsie

Rezultati klinik (mesatar) Fillestar V11: 0.998 → Second Update: 0.996 −0.002; asnjë rast nuk e humbi vetë diagnozën

Latenca — mesatare (interval) Fillimi V11: 20,17 s (17,0–37,0 s) → Përditësimi i dytë: 13,26 s (9,0–16,94 s) Optimizime të motorit të prodhimit midis ekzekutimeve

Shtegu i motorit = primar Fillimi V11: 12 / 15 → Përditësimi i dytë: 100,000 / 100,000 Nuk u nevojit asnjëherë një rikthim (fallback) për Fazën 2 gjatë gjithë ekzekutimit

Flamujt e hiperdiagnostikimit për nën-bashkësinë e “trap” Fillimi V11: 0 / 13 → Përditësimi i dytë: 0 / 87,412 Zero pozitive të rreme në shkallë popullsie (8.723 raste “trap” të monitoruara)

Çfarë nuk na tregon rezultati kryesor

Një rezultat i përbërë prej 99.80 për qind sipas kësaj rubrike të veçantë të pararegistruar, në një kohoort sintetik me 100,000 raste që përfshin 127 etiketa vendesh, përfaqëson performancë afër tavanit — por meriton një kornizim të kujdesshëm. Rezultati përshkruan sjelljen e motorit kundrejt rubrikës që ne angazhuam në kodin burimor në V11; nuk është një pretendim universal për saktësinë e motorit në çdo panel analizash gjaku që ekziston në terren.

Rezultati thotë se motori i trajtoi saktë modelet diagnostike të përzgjedhura për këtë vlerësim, në një grup në shkallë popullsie, sipas një metodologjie që është publikuar dhe e riprodhueshme. Ai nuk thotë se motori është i saktë në çdo panel analizash gjaku që ekziston në botën reale. Ai nuk thotë se motori duhet të zëvendësojë gjykimin klinik. Dhe nuk thotë se motori tejkalon sisteme të tjera të AI — analizat krahasuese kundrejt motorëve të tjerë ishin qëllimisht jashtë fushës së këtij raporti.

Ajo që rezultati vërteton është një bazë reference. Me rubrikën dhe “harness”-in të publikuar, versionet e ardhshme të motorit mund të vlerësohen kundrejt të njëjtës rubrikë — të aplikuar te 15 rastet fillestare të V11, te grupi i dytë me 100.000 raste, ose te çdo zgjerim pasues — dhe diferenca midis rezultatit të publikuar dhe çdo ekzekutimi pasues është vetë e matshme. Kjo është vlera e pararegistrimit: i shndërron pretendimet e performancës në pretendime të verifikueshme.

Si ta riprodhoni këtë standard brenda 10 minutash

Riprodhimi kërkon vetëm një çift kredencialesh API Kantesti dhe një mjedis Python 3.10 ose më të ri me requests dhe reportlab bibliotekat e instaluara. Mjeti i plotë (harness) është një modul i vetëm Python, vetëpërmbajtur, i lëshuar nën licencën MIT.

💻 GitHub Mjet (harness) me licencë MIT · përgjigje të papërpunuara · ekzekutim referencë 🔗 DOI në Figshare 10.6084/m9.figshare.32095435 · rekord kanonik akademik 🎓 Porta e Kërkimeve Publikimi 404175463 · V11 Përditësimi i Dytë · shtresa e zbulimit akademik 📄 Academia.edu Punimi 165956808 · V11 Përditësimi i Dytë · shtresa e zbulimit akademik

Katër hapa për një ekzekutim të ri

Një. Klononi depon (repository): git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. Dy. Instaloni varësitë me pip install -r requirements.txt (Përditësimi i Dytë shton mysql-connector-python ≥ 8.0 për ngarkuesin e rasteve SQL). Tre. Vendosni KANTESTI_USERNAME dhe KANTESTI_PASSWORD si variabla mjedisore për API-n e motorit. Për ngarkuesin e rasteve SQL të Përditësimit të Dytë, vendosni gjithashtu KANTESTI_DB_HOST, KANTESTI_DB_PORT, KANTESTI_DB_NAME, KANTESTI_DB_USER, dhe KANTESTI_DB_PASSWORD — ngarkuesi lidhet përmes një roli vetëm për lexim (bench_reader) që nuk ka privilegje për identifikimin e tabelave. Katër. Ekzekutoni python benchmark_bloodtest.py --limit 100000 për ekzekutimin e plotë Second-Update, ose python benchmark_bloodtest.py --limit 1000 për përsëritje të shpejtë. Rezultatet dalin në ./benchmark_results/: një kartelë scorecard CSV me kolona për vend/etiketë dhe për specialitet, një agregat JSON, një kampion i rastësishëm i shtresëzuar i përgjigjeve bruto dhe një raport në Markdown.

Ekzekutimet referencë nga 23 prill 2026 (V11 fillestar, 15 raste) dhe 26 prill 2026 (V11 Second Update, 100,000 raste) ruhen në results/ direktorinë e repozitorit. Një ekzekutim i ri do të prodhojë një scorecard të re me timestamp, duke i lënë ekzekutimet referencë të pandryshuara. Nëse ekzekutimi juaj prodhon një rezultat dukshëm të ndryshëm, ju lutemi hapni një çështje (issue) në GitHub me timestamp-in e ekzekutimit dhe versionin e motorit të kthyer në metadata e përgjigjes.

Kufizimet dhe puna e ardhshme

Edhe me 100,000 raste në 127 etiketa vendesh, katër kufizime meritojnë njohje të qartë: nënmostrimi i etiketave me bisht të gjatë, vlerësim një herë, shtrirje vetëm me një motor dhe origjinë vetëm nga një burim të dhënash. Secili po adresohet në punë pasuese aktive.

Mbulimi i etiketave me bisht të gjatë. Përditësimi i Dytë përfshin 127 etiketa vendesh, por shpërndarja është e pabalancuar — 10 etiketat kryesore përbëjnë ≈66.4% të rasteve, dhe bishti i gjatë i 97 etiketave shtesë së bashku kontribuon ≈7.3% (afërsisht 7,300 raste të kombinuara, ~75 raste për etiketë mesatarisht). Prandaj, kompozitetet për etiketë në këtë bisht të gjatë janë më të zhurmshme sesa sugjerojnë shifrat kryesore. Rishikimet e ardhshme do të ribilancojnë caktimin e etiketave për të forcuar vlerësimet për etiketë.

Vlerësimi një herë (single-shot). Çdo rast në koort u vlerësua vetëm një herë. Modelet e gjuhës së madhe shfaqin variancë jo të parëndësishme të daljes edhe në temperaturë të ulët të kampionimit, prandaj një protokoll me shumë ekzekutime me pesë vlerësime për rast dhe variancë të raportuar është një hap natyror i ardhshëm — veçanërisht në nën-grupin e rasteve “trap”, ku qëndrueshmëria nën luhatje kampionimi është pjesë e pretendimit për siguri.

Shtrirja vetëm e një motori. Ky raport karakterizon një motor. Analizat krahasuese kundrejt sistemeve të tjera AI janë jashtë fushës këtu; ne mund t’i ndjekim ato si një studim i veçantë i pavarur me metodologji të përshtatshme, kundrejt të njëjtit “harness” me licencë MIT.

Të dhëna sintetike. 100,000 rastet gjenerohen në mënyrë sintetike, jo janë raste sintetike, dhe rezultatet nuk transferohen në performancë klinike në botën reale. Vlerësimi mbi të dhëna reale, me pëlqim dhe të siguruara nga burime të jashtme, do të kërkonte mbikëqyrje të përshtatshme etike dhe është jashtë fushës së këtij benchmark-u sintetik.

Përtej këtyre katër, zgjerimi më me ndikim i planifikuar është barazia shumë-gjuhëshe për juridiksion. Motori Kantesti AI u shërben përdoruesve në 75+ gjuhë, dhe ekzekutimi i nën-koorteve Second-Update të stratifikura sipas gjuhës (turqisht, gjermanisht, spanjisht, frëngjisht, italisht, portugalisht, arabisht, mandarinisht) do të masë cilësinë e daljes nëpër gjuhët e mbështetura të motorit. Çdo analizë e stratifikur sipas gjuhës do të publikohet me DOI-n e vet dhe degën e “harness”.

Provo të njëjtin Motor që arriti një Rezultat Kompozit prej 99.80% në 100,000 Raste

Ngarko panelin tënd të analizave të gjakut në të njëjtin endpoint prodhimi që u vlerësua në këtë benchmark. Mbi 2 milionë përdorues në mbarë botën përdorin motorin e AI Kantesti për të interpretuar mbi 15,000 biomarkerë në 75+ gjuhë.

🔬 Provo Demon Falas

Zgjerimi i Chrome Dyqani i Aplikacioneve Google Play

📚 Si të citohet ky benchmark

BibTeX

@techreport{klein2026kantesti_v11_second_update,
  author      = {Klein, Thomas and Bulut, Julian Emirhan},
  title       = {Një Benchmark Teknik i Automatizuar i Parregjistruar, i Bazuar në Rubrikë, i Motorit të Interpretimit të Analizës së Gjakut Kantesti
                 në 100,000 Raste Testi Sintetike
                 --- Përditësimi i Dytë V11},
  institution = {Kantesti Ltd},
  address     = {London, Mbretëria e Bashkuar},
  year        = {2026},
  month       = {April},
  type        = {Raport Teknik},
  number      = {V11 (Përditësimi i Dytë)},
  doi         = {10.6084/m9.figshare.32095435},
  url         = {https://doi.org/10.6084/m9.figshare.32095435}
}

APA

Klein, T., & Bulut, J. E. (2026). Një Benchmark Teknik i Automatizuar i Parregjistruar, i Bazuar në Rubrikë, i Motorit të Interpretimit të Analizës së Gjakut Kantesti në 100,000 Raste Testi Sintetike — Përditësimi i Dytë V11 (Raport Teknik V11 Second Update). Kantesti Ltd. https://doi.org/10.6084/m9.figshare.32095435

📖 Referenca të jashtme metodologjike

Mentzer, W. C. (1973). Diferencimi i mungesës së hekurit nga tipari i talasemisë. The Lancet, 301(7808), 882.

🏥 PubMed

Aringer, M., Costenbader, K., Daikh, D., et al. (2019). Kriteret e klasifikimit të vitit 2019 të Ligës Evropiane kundër Reumatizmit / Kolegjit Amerikan të Reumatologjisë për Lupusin Eritematoz Sistemik. Arthritis & Rheumatology, 71(9), 1400–1412.

🔗 DOI 🏥 PubMed

Umapathi, L. K., Pal, A., & Sankarasubbu, M. (2023). Med-HALT: Testi i halucinacionit në domenin mjekësor për modelet e gjuhës së mëdha. Proceedings of CoNLL 2023.

🔗 ACL Anthology

99.80%Rezultati i përbërë

100,000Rastet e vlerësuara

127Etiketat e vendeve të mbuluara

0 / 87,412Pozitivë të rremë të kurthit

Pyetje të Shpeshta

Sa i saktë është motori i AI Kantesti në rastet testuese sintetike?

Në një rubrikë të parregjistruar, e ekzekutuar mbi 100,000 raste testimi të gjeneruara në mënyrë sintetike në tetë fusha përmbajtjeje dhe 127 etiketa vendesh (Përditësimi i Dytë V11), motori arriti një rezultat kompozit prej 99.80 për qind, me zero flamuj hiperdiagnostikimi në 87,412 mundësi të monitoruara për raste “trap” dhe një vonesë mesatare të përgjigjes prej 13.26 sekondash. Ky kompozit mat përputhshmërinë e daljes në inpute sintetike, jo saktësinë diagnostike. Publikimi fillestar V11 përdori të njëjtën rubrikë në 15 raste të ndërtuara me dorë (kompozit 99.12%); Përditësimi i Dytë e mban rubrikën identike në nivel byte dhe e shtrin atë në një koortë më të madhe sintetike. Kartela e plotë e rezultateve publikohet në Figshare nën DOI 10.6084/m9.figshare.32095435 dhe në GitHub nën licencën MIT.

A është i verifikuar klinikisht motori AI Kantesti?

Jo. Motori është vlerësuar me një benchmark teknik të automatizuar (jo një validim klinik), kundrejt një rubrike që u “ngrirë” në kodin burimor përpara ekzekutimit fillestar të V11 dhe u mbajt identike në nivel byte për Përditësimin e Dytë V11, i vlerësuar mbi 100,000 raste testimi të analizës së gjakut sintetike në hematologji, endokrinologji, mjekësi metabolike, hepatologji, nefrologji, kardiologji, reumatologji dhe mjekësi të brendshme, të nxjerra nga 127 etiketa vendesh. Mbikëqyrja klinike u ofrua nga Dr. Thomas Klein, MD (ORCID 0009-0009-1490-1321), hematolog klinik i certifikuar nga bordi dhe Shef i Mjekësisë (Chief Medical Officer) në Kantesti AI.

Çfarë është një rast “hyperdiagnosis trap”?

Një rast “hyperdiagnosis trap” është një skenar klinik i dizajnuar posaçërisht për të zbuluar sjellje të mbi-diagnostikimit në motorët e AI. Standardi fillestar V11 përdori dy raste të tilla si provë metodologjike: një hiperbilirubinemi indirekte e izoluar në përputhje me sindromën e Gilbert-it (ku interpretimi i saktë është polimorfizmi i qetë UGT1A1, jo hepatiti apo hemoliza) dhe një panel skriningu i plotësisht normal për të rritur (ku rezultati i saktë është qetësim, jo një patologji kufitare e prodhuar). Përditësimi i Dytë V11 e shkallëzoi këtë metodologji “trap-case” në një nën-grup të dedikuar prej 8,723 rastesh, duke gjeneruar 87,412 mundësi të monitoruara për flamur “hyperdiagnosis” — dhe shkalla e rezultateve false-pozitive të motorit mbeti zero.

A është i riprodhueshëm vlerësimi i motorit AI Kantesti?

Kompleti i plotë i vlerësimit lëshohet sipas licencës MIT si një modul i vetëm Python, i vetëpërmbajtur. Ekzekutimi fillestar V11 kërkon vetëm një çift kredencialesh API të Kantesti dhe Python 3.10 ose më të ri. Përditësimi i Dytë V11 shton një ngarkues rastesh SQL vetëm për lexim, me parametra, që kërkon kredenciale të Kantesti clinical-repository (një bench_reader rol pa privilegje për identifikimin e tabelave). Kodi, SQL-ja e ngarkuesit të rasteve, rubrika (identike në nivel bajtësh mes publikimeve), dhe një mostër e rastësishme e shtresëzuar e përgjigjeve të papërpunuara të motorit nga ekzekutimet referencë të V11 fillestar dhe të Përditësimit të Dytë janë të disponueshme në github.com/emirhanai/kantesti-blood-test-benchmark dhe të pasqyruara në Figshare, ResearchGate dhe Academia.edu.

Si e dallon motori i AI Kantesti mungesën e hekurit nga tipari i beta-talasemisë?

Motori aplikon indeksin Mentzer, i llogaritur si vëllimi mesatar korpuskular i ndarë me numrin e qelizave të kuqe të gjakut. Një indeks Mentzer mbi 13 mbështet aneminë nga mungesa e hekurit, ndërsa një vlerë nën 13 mbështet tiparin e beta-talassemisë. Në standardin fillestar V11, të dyja paraqitjet u klasifikuan saktë me llogaritje të qartë të indeksit Mentzer, të mbështetura nga ferritina, RDW dhe konteksti i HbA2. Gjatë Përditësimit të Dytë V11, në kohortën me 100,000 raste, i njëjti sjellje diferenciale u ruajt në nivel popullsie.

Ku mund t’i gjej të dhënat e papërpunuara të standardeve dhe kodin burimor?

Raporti teknik është depozituar në Figshare nën DOI 10.6084/m9.figshare.32095435 (duke mbuluar si publikimin fillestar V11 ashtu edhe Përditësimin e Dytë V11), i pasqyruar në publikimin e ResearchGate 404175463 dhe në punimin e Academia.edu 165956808 — të dyja të përditësuara me titullin e Përditësimit të Dytë V11 dhe rezultatet për 100,000 raste — dhe “harness” Python me licencë MIT me të gjitha rezultatet e ekzekutimit referencë është në github.com/emirhanai/kantesti-blood-test-benchmark. Rrjeti i pasqyrimit me katër platforma siguron disponueshmëri afatgjatë dhe fleksibilitet citimi.

Pse është e rëndësishme para-regjistrimi për standardet mjekësore të AI?

Para-regjistrimi parandalon rregullimin “post-hoc” të rubrikës, që është mënyra e vetme më e zakonshme se si standardet e drejtuara nga kompani i fryjnë vetë numrat e tyre. Duke e fiksuar rubrikën në kod burimor përpara çdo thirrjeje të motorit dhe duke e publikuar kornizën publikisht, datat e autorit të rubrikës bëhen të verifikueshme në kontrollin e versioneve, dhe rezultatet e motorit nuk mund të kenë formësuar kriteret e vlerësimit.

A përfshin ky standard krahasime me motorë të tjerë AI?

Jo. Raporti V11 — si publikimi fillestar ashtu edhe Përditësimi i Dytë — e karakterizon qëllimisht një motor të vetëm kundrejt një rubrike fikse, në vend që ta pozicionojë atë kundrejt sistemeve alternative komerciale. “Harness”-i është me burim të hapur nën licencën MIT (tani duke përfshirë ngarkuesin SQL të rasteve), ndaj studiues të pavarur mund të vlerësojnë çdo motor që zgjedhin kundrejt të njëjtës rubrikë dhe ngarkuesi të rasteve dhe të publikojnë rezultatet e tyre.

A janë rastet e pacientëve reale apo sintetike?

Të gjitha rastet gjenerohen në mënyrë sintetike — 15 raste të ndërtuara me dorë në publikimin fillestar të V11 dhe 100,000 në Përditësimin e Dytë. Ato nuk janë “raste sintetike”: nuk përfshihen të dhëna sintetike, as proces pëlqimi, dhe as de-identifikim, sepse nuk ekzistojnë të dhëna personale në koortë. Asnjë e dhënë personale nuk shfaqet në harness-in e publikuar, në raportin teknik, ose në datasetet e lëshuara.

⚕️ Mohim mjekësor & Konflikt interesi

Ky raport i benchmark-ut është për qëllime kërkimore dhe transparence metodologjike. Ai nuk përbën këshillë mjekësore, nuk është diagnozë dhe nuk zëvendëson kujdesin profesional mjekësor; asnjë rezultat këtu nuk duhet të përdoret për të vonuar ose shmangur vizitën te një mjek. Konsultohuni gjithmonë me një ofrues të kualifikuar të kujdesit shëndetësor për vendime rreth diagnozës dhe trajtimit. Ky është një benchmark i brendshëm i vetë-ekzekutuar i motorit të vetë kompanisë dhe nuk është verifikuar në mënyrë të pavarur ose i rishikuar nga kolegët. Rezultati i përbërë mat përputhshmërinë me një rubrikë fikse (struktura e raportit, rikujtimi i fjalëve kyçe dhe i sistemit të vlerësimit, si dhe latenca); ai nuk është një masë e saktësisë reale diagnostikuese në botën reale ose e sigurisë klinike. Të dy autorët janë të punësuar nga dhe mbajnë aksione në Kantesti Ltd, dhe motori që po vlerësohet është një produkt komercial i të njëjtës organizatë. Ky konflikt interesi zbutet duke parregjistruar rubrikën në kodin burim, duke publikuar harness-in nën licencën MIT dhe duke publikuar një mostër të shtresëzuar të rastësishme të përgjigjeve të papërpunuara të motorit.

E-E-A-T Trust Signals

⭐

Përvoja

15+ vjet praktikë klinike në hematologji dhe mjekësi laboratorike, duke mbikëqyrur përzgjedhjen e panelit të rasteve.

📋

Ekspertizë

Dizajn i rubrikës i para-regjistruar me penalitete të qarta për hyperdiagnosis dhe sisteme të njohura të vlerësimit klinik (Mentzer, FIB-4, EULAR/ACR, KDIGO).

👤

Autoritariteti

Autor kryesor Dr. Thomas Klein, MD (ORCID 0009-0009-1490-1321). Implementimi nga Julian Emirhan Bulut, CEO i Kantesti Ltd.

🛡️

Besueshmëria

Kornizë e riprodhueshme me licencë MIT, përgjigje të papërpunuara të motorit të publikuara, deklarim i hapur i konfliktit të interesit, rrjet pasqyrimi kërkimor në katër platforma.

🏢 Kantesti SH.P.K. Regjistruar në Angli & Uells · Numri i kompanisë. 17090423 Londër, Mbretëria e Bashkuar · kantesti.net