1. Garanci të forta për vendimmarrje ndërvepruese me koeficientin e vlerësimit të vendimeve (arXiv)

Autor:Dylan J. Foster, Noah Golowich, Yanjun Han

Abstrakt:Një problem themelor në të mësuarit përforcues dhe vendimmarrjen ndërvepruese është të kuptojmë se cilat supozime modelimi çojnë në garancitë e të mësuarit me efikasitet të mostrës dhe cilat parime të dizajnit të algoritmit arrijnë kompleksitetin optimal të mostrës. Kohët e fundit, Foster et al. (2021) prezantoi Koeficientin Vendim-Vlerësues (DEC), një masë e kompleksitetit statistikor që çon në kufijtë e sipërm dhe të poshtëm të kompleksitetit optimal të mostrës për një klasë të përgjithshme problemesh që përfshijnë banditë dhe të mësuarit përforcues me përafrim të funksionit. Në këtë punim, ne prezantojmë një variant të ri të DEC, Koeficientin e Vlerësimit të Kufizuar të Vendimit, dhe e përdorim atë për të nxjerrë kufij të rinj të poshtëm që përmirësohen me punën e mëparshme në tre fronte:
- Ata qëndrojnë në pritje, pa kufizime mbi klasën e algoritmeve në shqyrtim.
- Ato qëndrojnë globalisht dhe nuk mbështeten në nocionin e lokalizimit të përdorur nga Foster et al. (2021).
- Më interesantja është se ato lejojnë që modeli i referencës në lidhje me të cilin DEC është përcaktuar të jetë i pahijshëm, duke vërtetuar se modelet e referencës jo të duhura luajnë një rol themelor.
Ne ofrojmë kufijtë e sipërm për keqardhjen e asaj shkalle me të njëjtën sasi, duke mbyllur kështu të gjitha boshllëqet midis kufijve të sipërm dhe të poshtëm përveç njërit në Foster et al. (2021). Rezultatet tona zbatohen si për kornizën e keqardhjes, ashtu edhe për kornizën PAC, dhe përdorin disa teknika të reja të analizës dhe projektimit të algoritmit që ne parashikojmë se do të gjejnë përdorim më të gjerë.

2. Mbi vlerësuesit e imputimit të rregulluar me regresion të efektit mesatar të trajtimit (arXiv)

Autor:Zhexiao Lin, Fang Han

Abstrakt : Imputimi i rezultateve të mundshme të munguara duke përdorur një funksion të vlerësuar të regresionit është një ide e natyrshme për vlerësimin e efekteve shkakësore. Në literaturë, vlerësuesit që kombinojnë përshtatjet e imputimit dhe të regresionit besohet të jenë të krahasueshëm me peshimin e shtuar të probabilitetit të anasjelltë. Prandaj, njerëzit për një kohë të gjatë supozuan se vlerësues të tillë, ndërsa shmangin ndërtimin e drejtpërdrejtë të peshave, janë gjithashtu dyfish të fortë (Imbens, 2004; Stuart, 2010). Duke përgjithësuar një rezultat të mëparshëm të autorëve (Lin et al., 2021), ky punim zyrtarizon këtë hamendje, duke treguar se një klasë e madhe e metodave të imputimit të rregulluara me regresion janë me të vërtetë dyfish të forta për të vlerësuar efektin mesatar të trajtimit. Për më tepër, ato janë dukshëm gjysmëparametrikisht efikase për sa kohë që të dy modelet e densitetit dhe regresionit janë specifikuar saktë. Shembuj të dukshëm të metodave të imputimit të mbuluara nga teoria jonë përfshijnë përputhjen e bërthamës, përputhjen e fqinjit më të afërt (të ponderuar), përputhjen lineare lokale dhe pyjet e rastësishme (të ndershme).