Kial ekzistas ĉi tiu komparnormo kaj kion ĝi testas
AI-helpata interpretado de sangoanalizo estas ĉiam pli uzata en konsumantaj kaj klinikaj laborfluoj, tamen reprodukteblaj taksaj kadroj adaptitaj al laboratoriamedicino restas maloftaj. La demandoj, kiuj plej gravas en ĉi tiu kunteksto, ne estas tiuj kovritaj de ĝeneralaj medicinaj demando-respondo-komparnormoj: ĉu motoro povas apartigi feromankon de talasemio-trajto kiam la meza korpuskula volumeno estas identa, ĉu ĝi tro-diagnostikas Gilbert-malsanon kiel hepatiton, kaj ĉu ĝi fabrikas patologion en plene normala ekzamena panelo?
Ununura panelo de sangoanalizo kutime enhavas sufiĉe da signalo por subteni plurajn konkurantajn interpretojn, kaj la tasko de la interpretanta klinikisto estas pesi tiujn interpretojn unu kontraŭ la aliajn prefere ol serĉi respondon el lernolibro. Motoro kiu bone funkcias en lernolibraj kazoj povas tamen malsukcesi en la kazoj kiuj plej gravas: la kaptiloj de diferenciala diagnozo, la benignaj variantoj kiuj aspektas alarmigaj kiam ili estas izolitaj, kaj la tute normalaj paneloj kiuj tentigas memcertajn asistantojn fabrikadi patologion.
Ĉi tiu benchmark estis konstruita ĝuste ĉirkaŭ tiuj fiaskoreĝimoj. Ĉiu el la kvin-dek kazoj estis elektita por specifa diagnoza propraĵo: fer-manka mikrocitozo kiu devas esti konservita aparta de beta-talasemio-trajto kun identa meza korpuskula volumeno, prezento de sindromo de Gilbert kie la sola anomalio estas izolita nerekta hiperbilirubinemio, kaj kvin-dek-parametra skanada panelo en kiu ĉiu analito troviĝas ene de sia referenca intervalo. La rubriko rekompencas motorojn kiuj legas ĉiun kazon laŭ ĝiaj propraj kondiĉoj kaj punas motorojn kiuj serĉas memcertan diagnozon kiam tia diagnozo ne estas pravigita.
Kiel Thomas Klein, MD, mi elektis la panelon de kazoj ĉar ĉi tiuj estas la ŝablonoj kiujn laboratorimedicinaj asistantoj plej ofte eraras. La multekosta fiaskoreĝimo ne estas "mankanta rara malsano" — ĝi estas fabrikado de rutina patologio ĉe pacientoj kiuj ne havas ĝin. Nia Medicina Validigo hub priskribas la pli larĝan kadron; ĉi tiu paĝo priskribas la V11 komencan pruvon de koncepto kaj la V11 Duan Ĝisdatigon, kiuj skaligis ĝin al 100,000 anonimigitaj kazoj el SQL-subtenata klinika deponejo tra 127 landoj — uzante la saman poentadan rubrikon, bajt-identan, sen permesita post-hoc agordado.
Plej nova referenca rulo — V11 Dua Ĝisdatigo (la 26-an de aprilo 2026)
La referenca rulo de la V11 Dua Ĝisdatigo de la 26-a de aprilo 2026 produktis kombinitan poentaron de 99.80% sur la sama antaŭregistrita rubriko uzita en la V11 komenca eldono, taksita sur 100,000 anonimigitaj kazoj el la Kantesti SQL-subtenata klinika deponejo kaj tra 127 landoj kaj 75+ lingvoj. Ĉiu kazo finiĝis sur la ĉefa vojo de la motoro; trap-kaza hiperdiaĝnosa flago-aktivigoj restis ĉe 0 / 87,412. La originala V11 rulo de la 23-a de aprilo 2026 kovris 15 mane kuratajn kazojn (kombinita 99.12%) kaj validigis la rubrikon; la Dua Ĝisdatigo konservas tiun rubrikon bajt-identa kaj etendas taksadon al populacia-skala kohorto.
La kompozita formulo kombinas tri komponantojn: struktura konformeco kun la sep devigaj raportsekcioj kaj dek ses devigaj subsekcioj, klinika precizeco mezurita kiel ŝlosilvorta revoko plus revoko de la poentadsistemo plus validec-kontrolo de probabla distribuo, kaj responda latenco kontraŭ la ĉefa-vojo servnivela celo. La ĝusta malkomponado estas montrita en la rubrika formulo malsupre — neniu el tiuj pezoj aŭ sub-rubriko estis ŝanĝita por la Dua Ĝisdatigo.
La ceteraj 0.20 procentpunktoj da marĝeno malkomponas preskaŭ tute en la klinikan sub-poentaron — malgranda frakcio de kazoj (plejparte en Hepatologio kaj Reŭmatologio) havis unu atenditan ŝlosilvorton de la poentadsistemo forestanta el la interpreto de la motoro, malgraŭ ke la diagnoza enhavo estis ĝusta. Neniu kazo en la 100,000-kaza kohorto de la Dua Ĝisdatigo maltrafis la diagnozon mem. Latenco pliboniĝis de mezumo de 20.17 s en la V11 komenca eldono al 13.26 s en la Dua Ĝisdatigo, reflektante produktajn motorajn optimumigojn inter la du ruloj; la rubriko, la poentada kodo, kaj la API-fina punkto estas senŝanĝaj.
Per-landa kombinitaj poentaroj variis de 0.9971 (Hindio) ĝis 0.9985 (Svislando) tra la 30 plej-reprezentitaj landoj. La longa vosto de 97 pliaj landoj (≈7,300 kazoj kune) montris neniun sisteman degradiĝon. Ĉefaj kontribuantoj laŭ kaznombro estis Usono (10,500), Brazilo (9,500), Hispanio (9,000), Italio (8,000), Germanio (7,800), Francio (7,400), Portugalio (5,800), Türkiye (3,400), Britio (2,900), kaj Meksiko (2,500).
De 15 kazoj al 100,000: kohorta evoluo tra 127 landoj
La originala V11-kaza panelo kovris sep fakojn — hematologio, endokrinologio, metabola medicino, hepatologio, nefrologio, kardiologio, reŭmatologio — plus du dediĉitajn hiperdiaĝnosa-trapajn kazojn, kun ĉiu kazo anonimigita reala pacienca registro eltirita el la Kantesti klinika datuma deponejo sub skribita informita konsento. La V11 Dua Ĝisdatigo etendas taksadon al 100,000 anonimigitaj kazoj tra 127 landoj, distribuitaj en ok fakojn (la originalaj sep plus dediĉita interna-medicina sitelo kiu absorbas la trap-subaron). La sama poentada rubriko estas aplikata bajt-identa tra ambaŭ ruloj.
De-identigo estis farita laŭ la Safe Harbor-abordmaniero: ĉiuj rektaj identigiloj estis forigitaj aŭ anstataŭigitaj, kaj ĉiu registro ricevis benchmark-internan kazkodon en la formato BT-NNN-LABEL (V11 komenca) aŭ stabilan anonimigitan case_uid por la Dua Ĝisdatigo. Pretigo estis farita laŭ GDPR Artikolo 9(2)(j) por scienca esplorado kun taŭgaj protektaj rimedoj, kaj la ekvivalentaj provizaĵoj de UK GDPR. Neniu persone identigebla informo aperas ie ajn en la publikigita testinstalaĵo, la teknika raporto, aŭ la eldonitaj datumaroj.
V11 komenca eldono — 15 mane kurataj kazoj
La originala V11-kaza panelo estis mane elektita de d-ro Thomas Klein por ekzerci la diagnozajn ŝablonojn, kiujn laboratorimedicinaj asistantoj plej ofte eraras. Ĉiu el la dek kvin kazoj estis elektita por specifa diagnoza propraĵo, listigita malsupre.
Kial ĝuste tiu ĉi distribuo
Hematologio ricevas tri kazojn, ĉar mikrocitaj diferencialoj kaj makrocitaj diferencialoj estas la plej alt-volumaj kaptiloj en reala laboratoria praktiko. Endokrinologio ricevas tri, ĉar la prezentoj de Hashimoto, PCOS kaj manko de vitamino D ekzercas malsamajn diagnozajn formojn (aŭtoantikorp-movataj, hormon-proporciaj movataj, ununura-signa movata). La unu-kaza specialaĵoj tamen estas signifaj, ĉar ĉiu el CKD, ASCVD-risko kaj SLE havas sian propran poentadsistemon, kiun la motoro devus alvoki (KDIGO-stadiajigo, ASCVD 10-jara risko, 2019 EULAR/ACR SLE-kriterioj respektive).
V11 Dua Ĝisdatigo — 100,000 anonimecigitaj kazoj tra 127 landoj
La Dua Ĝisdatigo anstataŭigas la originalan V11 hardkoditan 15-kazan Python-literalon per parametrigita, nurlegebla SQL-demando kontraŭ la klinika deponejo Kantesti (anonymised_blood_panels). La demando filtrilas per consent_research = 1 AND released_for_benchmark = 1 kaj estas presita ĉe la supro de ĉiu kompar-kuraĝo por travidebleco. La kohorta distribuo laŭ fako estas montrita malsupre.
Geografia distribuo — supraj 10 landoj
La kohorto ampleksas 127 landojn (ISO 3166-1 alpha-2). Eŭropo kontribuas 57.7%, la Amerikoj 25.4%, Azio-Pacifiko 6.2%, nomitaj enskriboj Mezoriento/Afriko 3.4%, kaj longa vosto de 97 pliaj landoj entute proksimume 7.3%. La dek plej grandaj kontribuantoj estas Usono (10,500), Brazilo (9,500), Hispanio (9,000), Italio (8,000), Germanio (7,800), Francio (7,400), Portugalio (5,800), Türkiye (3,400), Britio (2,900) kaj Meksiko (2,500). Per-landa kompozita poentaro variis de 0.9971 (Hindio) ĝis 0.9985 (Svislando).
La antaŭregistrita rubriko, klarigita
Antaŭregistriĝo estas la ununura plej grava metodika elekto en ĉi tiu komparnormo. Ĉiu atendata diagnozo, ĉiu klinika poentadsistemo, kaj ĉiu raporta sekcio estis engaĝitaj al fontkodo antaŭ ol la motoro estis alvokita. Posta alĝustigo de la rubriko por flati la motoron do estas neebla.
Tri komponantoj konsistigas la kompozitan poentaron. La struktura komponanto kontribuas 35 procentojn kaj mezuras ĉu la motoro resendis la sep devigajn raportaĵojn (kaplinio, resumo, ŝlosilaj trovoj, diferencialo, poentadsistemoj, rekomendoj, sekvado) kaj la dek ses devigajn subsekciojn ene de ili. Sekcia ĉeesto pezas 40 procentojn kaj subsekcia ĉeesto pezas 60 procentojn ene de la struktura kalkulo.
La klinika komponanto kontribuas 55 procentojn kaj kombinas tri aferojn: rememoro de diagnoz-ŝlosilvortoj (70 procentoj de la klinika subpoentaro), rememoro de poentadsistemoj (20 procentoj — ĉu la motoro kalkulas Mentzer, FIB-4, HOMA-IR, ASCVD-risko, KDIGO-stadiajigo, EULAR/ACR-kriteriojn kie konvene), kaj validec-kontrolon de probabla sumo (10 procentoj — la diferencialaj probabloj devas sumiĝi ene de la intervalo [90, 110]). Por kaptilaj kazoj, eksplicita hiperdiaĝnosa puno ĝis 0.30 estas subtrahata, kalkulata kiel 0.10 por ĉiu fabrikita patologia flago, limigata al tri flagoj.
La latencia komponanto kontribuas 10 procentojn. Respondo sub 20 sekundoj ricevas la plenan 0.10, respondo sub 40 sekundoj ricevas 0.05, kaj ĉio pli malrapida ricevas nulo. La 20-sekunda celo reflektas la produktadan primaran servonivelan celon; la 40-sekunda plafono reflektas la Fazon 2-rezervbuĝeton por pezaj alvokoj de la motoro.
Kion antaŭregistriĝo malhelpas
Unuflankaj komparnormoj estas fifamaj pro inflado de siaj propraj nombroj per postaj alĝustigoj de la rubriko. La ŝablono preskaŭ ĉiam estas la sama: la teamo rulas la motoron, vidas kie ĝi subefikas, kaj poste trankvile ĝustigas la rubrikon tiel ke la subefikaj areoj kalkulu por malpli. Per tio, ke la rubriko estas engaĝita al fontkodo antaŭ la unua alvoko de la motoro kaj la testilo estas publikigita sub MIT-licenco, tiu alĝustigo fariĝas videbla en versia administrado. Ĉiu povas kloni la deponejon, kontroli la datojn de la rubrik-aŭtoro, kaj konfirmi ke la rezultoj de la motoro ne estis uzataj por formi la poentadon.
Kazoj de hiperdiaĝnoza kaptilo — kial tro-frazo estas la vera fiaskoreĝimo
Akriga tro-alvoko de patologio sur normalaj ekranoj estas dokumentita fiaskomodo de konsumant-orientitaj medicinaj helpantoj. Ĝiaj postaj kostoj inkluzivas nenecesan esploradon, paciencan angoron, kaj iatrogenan laborprilaboron. La du kaptilaj kazoj en ĉi tiu komparnormo estas desegnitaj por fari tiun fiaskomodon videbla kaj poentebla.
🟡 Kaptilo 1 — BT-014-GILBERT
Prezento. 24-jaraĝa viro kun totala bilirubino de 2.4 mg/dL. La rekta frakcio estas normala, transaminazoj kaj alkala fosfatazo troviĝas ene de siaj referencaj intervaloj, retikulocitoj estas nenotindaj, kaj haptoglobino kaj LDH ekskludas hemolizon.
Ĝusta interpretado. La sindromo de Gilbert — bonigna polimorfismo de UGT1A1. La interpretado ne devus alvoki hepatiton, cirozon, hemolizan anemion, aŭ bilian obstrukcon.
Rezulto de v11. Kompona 1.000. Neniu el la ses monitoritaj flagoj de tro-diagnosado aperis kiel aktiva diagnozo.
🟡 Kaptilo 2 — BT-015-HEALTHY
Prezento. 35-jaraĝa virino kun dek kvin-parametra rutina rastruma panelo. Ĉiu analito komforte troviĝas ene de sia referenca intervalo.
Ĝusta interpretado. Trankviligo kaj prizorgado de vivstilo. La interpretado ne devas inventi liman patologion por soni klinike utila.
Rezulto de v11. Komponita 1.000. Neniu el la sep kontrolitaj flagoj pri troa diagnozado — diabeto, anemio, hipotiroidismo, dislipidemio, hepatito, rena malsano, manko — aperis kiel aktivaj diagnozoj.
En ambaŭ testujoj, dek tri kontrolitaj flagoj pri hiperdiaĝnozado estis kontrolitaj. Neniu estis ekigita. Ĉi tio estas la rezulto, kiu plej gravas por iu ajn klinikisto, kiu konsideras uzi AI-motoron kiel triaĝan aŭ antaŭkonsultan ilon: la sistemo ne inventis malsanon, kie neniu ekzistis.
Mentzer-indekso: apartigado de fera manko de talasemio-trajto
Dua altvalora trovo koncernas la parigon de kazo BT-001 (fermanka anemio) kun kazo BT-007 (beta-talasemio minor). Ambaŭ prezentas kun mikrocitozo kaj estas bone konata obstaklo por naivaj klasigiloj. La Mentzer-indekso, kalkulita kiel MCV dividita per RBC-nombro, superas 13 en fermanka anemio kaj falas sub 13 en talasemio-trajto.
En BT-001, la paciento estis 34-jara virino kun hemoglobino 10.4 g/dL, MCV 72.4 fL, RBC 4.1 × 10¹²/L, feritino 6 ng/mL, kaj levita TIBC. La Mentzer-indekso de proksimume 17.7 subtenas absolutan feromankon. En BT-007, la paciento estis 28-jara viro kun mikrocitozo (MCV 65.8 fL) sed alta RBC-nombro de 6.2, normala RDW, normala feritino, kaj HbA2 de 5.6 procentoj. La Mentzer-indekso de proksimume 10.6 indikas talasemio-trajton, kaj la levita HbA2 konfirmas beta-talasemion minor.
Ambaŭ kazoj gajnis 1.000. La motoro eksplicite uzis la Mentzer-indekson en ambaŭ interpretadoj kaj liveris la ĝustan diagnozon en ĉiu okazo. Ĉi tio estas la sola plej klinike trankviliga rezulto en la tuta komparilo, ĉar misklasifiki talasemio-trajton kiel fermanka anemio kondukas al netaŭga feraldono kaj al maltrafitaj ŝancoj por familia ekzamenado, kaj misklasifiki fermankan anemion kiel talasemion prokrastas simpligitan anstataŭan terapion. Nia gvidilo pri feritina gamo klarigas la pli larĝan diferencialan kuntekston.
Rezultoj per kazo el la V11 komenca referenca rulado (la 23-an de aprilo 2026)
La originala V11 referenca rulado sur la 15-kaza pruvo-de-koncepta kohorto servas kiel la metodologia bazo de la Dua Ĝisdatigo: ĉiu detalo per kazo malsupre montras kiel la rubriko traktas realan motoran respondon. Dek du el dek kvin kazoj atingis la plafonan kompozitan poentaron de 1.000 sur la ĉefa vojo; tri kazoj estis servitaj per la Fazo 2-fallback, perdante la 0.05 latencan gratifikon dum konservante ĉiujn klinikajn kaj strukturajn enhavojn. Unu kazo mankis unu devigan subsekcion; unu redonis marĝene reduktitan probablan distribu-sumon.
La kazo de PCOS (BT-008) perdis unu devigan subsekcion en la responda strukturo — dek kvin el dek ses anstataŭ dek ses el dek ses — kio reduktis la strukturpoentaron de 1.000 al 0.963. La kazo de SLE (BT-011) redonis marĝene reduktitan probablodistribuan sumon, kiu malaltigis la klinikan poentaron al 0.965, konservante ĉiun diagnozan ŝlosilvorton kaj poentadsistemon. Nek el la subperfektaj kazoj maltrafis ĝustan diagnozon.
V11 Dua Ĝisdatigo agrega — 100,000 kazoj
Je populacia skalo, individuaj kazaj vicoj ne estas homlegeblaj, do la Dua Ĝisdatigo raportas agregitajn metrikojn prefere ol tablon de 100,000 vicoj. La ĉefa agregaĵo estas montrita malsupre; malkomponoj laŭ fako kaj laŭ lando estas publikigitaj en la teknika raporto kaj en la Figshare-deponaĵo. Stratigita hazarda provaĵo de n = 201 krudaj motoraj respondoj (determinisma semo 20260426) estas publikigita en la GitHub results/ dosierujo por inspektado.
Kion la ĉefpoentaro ne diras al ni
Komponita poentaro de 99,80 procentoj laŭ ĉi tiu aparta antaŭregistrita rubriko, en 100.000-kaza anonimeca kohorto tra 127 landoj, reprezentas preskaŭ-ĉelan rendimenton — sed ĝi meritas zorgeman kadriĝon. La rezulto priskribas la konduton de la motoro kontraŭ la rubriko, kiun ni engaĝiĝis uzi en la fontkodo en V11; ĝi ne estas universala aserto pri la ĝusteco de la motoro por ĉiu sangoanaliza panelo, kiu ekzistas en la reala mondo.
La poentaro diras, ke la motoro pritraktis la diagnozajn ŝablonojn elektitajn por ĉi tiu taksado ĝuste tra kohorto je populacia skalo, laŭ metodaro kiu estas publikigita kaj reproduktebla. Ĝi ne diras, ke la motoro estas ĝusta por ĉiu sangoanaliza panelo, kiu ekzistas en la reala mondo. Ĝi ne diras, ke la motoro devus anstataŭi klinikan juĝon. Kaj ĝi ne diras, ke la motoro superas alternativajn AI-sistemojn — komparaj analizoj kontraŭ aliaj motoroj estis intence ekster la amplekso de ĉi tiu raporto.
Kion la poentaro ja establas, estas bazo. Kun la rubriko kaj la testilo publike haveblaj, estontaj versioj de la motoro povas esti taksataj kontraŭ la sama rubriko — aplikita al la V11 komencaj 15 kazoj, la Dua Ĝisdatigo 100.000-kaza kohorto, aŭ ajna posta vastiĝo — kaj la breĉo inter la publikigita poentaro kaj iu ajn posta rulo estas mem mezurebla. Jen la valoro de antaŭregistrado: ĝi transformas asertojn pri agado en testeblajn asertojn.
Kiel reprodukti ĉi tiun komparnormon en 10 minutoj
Reproduktado postulas nur paron de Kantesti API-atestiloj kaj Python 3.10 aŭ pli posta medio kun la requests kaj reportlab instalitaj bibliotekoj. La plena testilo estas unuopa, memstara Python-modulo publikigita sub la MIT-licenco.
Kvar paŝoj por nova rulo
Unu. Klonu la deponejon: git clone https://github.com/emirhanai/kantesti-blood-test-benchmark.git. Du. Instalu dependecojn per pip install -r requirements.txt (Dua Ĝisdatigo aldonas mysql-connector-python ≥ 8.0 por la SQL-kazŝargilo). Tri. Agordu KANTESTI_USERNAME kaj KANTESTI_PASSWORD kiel mediaj variabloj por la motora API. Por la Dua Ĝisdatigo SQL-kazŝargilo, ankaŭ agordu KANTESTI_DB_HOST, KANTESTI_DB_PORT, KANTESTI_DB_NAME, KANTESTI_DB_USER, kaj KANTESTI_DB_PASSWORD — la ŝargilo konektiĝas per nurlega rolo (bench_reader) kiu ne havas privilegiojn por identigi tabelojn. Kvar. Rulu python benchmark_bloodtest.py --limit 100000 por la plena Dua-Ĝisdatiga rulado, aŭ python benchmark_bloodtest.py --limit 1000 por rapida ripetado. Eligoj alvenas en ./benchmark_results/: CSV-poentokarto kun po-landa kaj po-faka kolumnoj, JSON-aggregato, stratigita-hazarda provaĵo de krudaj respondoj, kaj Markdown-raporto.
La referencaj ruladoj de la 23-a de aprilo 2026 (V11 komenca, 15 kazoj) kaj la 26-a de aprilo 2026 (V11 Dua Ĝisdatigo, 100,000 kazoj) estas konservitaj en la results/ dosierujo de la deponejo. Nova rulado produktos novan tempomarkitan poentokarton dum la referencaj ruladoj restas netuŝitaj. Se via rulado produktas signife malsaman rezulton, bonvolu malfermi GitHub-eldonaĵon kun la tempomarko de la rulado kaj la motorversio redonita en la responda metadato.
Limigoj kaj estonta laboro
Eĉ ĉe 100,000 kazoj tra 127 landoj, kvar limigoj meritas eksplicitan agnoskon: long-vosta subprova kovrado de landoj, unufoja taksado, unu-motora amplekso, kaj unu-fonta datenorigino. Ĉiu el ili estas traktata en aktiva sekva laboro.
Long-vosta landokovrado. La Dua Ĝisdatigo ampleksas 127 landojn, sed la distribuado estas neekvilibra — la supraj 10 kontribuantoj respondecas pri ≈66.4% de la kazoj, kaj la long-vosta parto de 97 pliaj landoj kune kontribuas ≈7.3% (proksimume 7,300 kazoj entute, ~75 kazoj per lando averaĝe). Tial la po-landoj kompozitaĵoj en ĉi tiu long-vosta parto estas pli bruaj ol la ĉefaj ciferoj sugestas. Estontaj ruladoj preferos rekruti el subprovitaj landoj por fiksi taksojn laŭ jurisdikcio.
Unufoja taksado. Ĉiu kazo en la kohorto estis taksita unufoje. Grandaj lingvomodeloj montras ne-trivialan variadon de eligo eĉ ĉe malalta prova temperaturo, do plur-rula protokolo kun kvin taksadoj per kazo kaj raportita varianco estas natura sekva paŝo — precipe sur la trap-kaza subaro, kie konsistenco sub provaĵa ĝiterado estas parto de la sekureca aserto.
Unu-motora amplekso. Ĉi tiu raporto karakterizas unu motoron. Komparaj analizoj kontraŭ alternativaj AI-sistemoj estas ekster la amplekso ĉi tie; ni povas okupiĝi pri ili kiel aparta sendependa studo kun taŭga metodaro, kontraŭ la sama MIT-permesita testilo.
Unu-fonta origino de datumoj. La 100,000 kazoj estas anonimecitaj realaj pacientaj registroj el unu klinika deponejo (la Kantesti SQL-subtenata klinika datuma magazeno). Ili reprezentas kuracitan produktadan fluon kaj ne estas populacia-reprezenta hazarda elekto sur la tutmonda nivelo. Etendi la taksadon al ekstere fontitaj plurcentraj datumoj estas en la vojo.
Preter ĉi tiuj kvar, la plej efika planita etendo estas plurlingva egaleco laŭ jurisdikcio. La Kantesti AI-Motoro servas uzantojn en 75+ lingvoj, kaj ruli lingvo-stratigitajn Dua-Ĝisdatigajn subkohortojn (turka, germana, hispana, franca, itala, portugala, araba, mandarena) kvantigos la kvaliton de eligo tra la subtenataj lingvoj de la motoro. Ĉiu lingvo-stratigita analizo estos publikigita kun sia propra DOI kaj testila branĉo.