STATISTICA Scorecard je mocný nástroj k vyhodnocování kreditního rizika a bonity klientů, umožňuje vytvářet pokročilé skóringové modely ve formě tzv. skórkarty, které se kromě skórování žádostí a behaviorálního skóringu běžně aplikují v marketingu, kde pomáhají vytvářet efektivní reklamu nebo strategii pro udržení stávajících zákazníků. STATISTICA Scorecard je kompletní řešení pro vývoj, vyhodnocení a monitorování modelu typu „skórkarta“. Modul zahrnuje sadu nástrojů pro následující úlohy:
Tento modul se používá pro výběr a vyjmutí nedůležitých či redundantních proměnných se základní množiny charakteristik. Lze vytvořit hodnocení proměnné pomocí dvou měr celkové prediktivní síly, jedná se o informační kritérium a Cramérovo V. Na základě těchto měr můžete identifikovat, které charakteristiky mají důležitý vliv na kredit risk a ty poté vybrat do další fáze vývoje modelu. Navíc je zde možnost vybrat reprezentanty, která Vám umožní identifikovat redundanci mezi numerickými proměnnými bez nutnosti analyzování matice všech korelací. Tento modul vytvoří svazky proměnných, které jsou obecně mezi sebou korelované pomocí faktorové analýzy s rotací. V každém svazku jsou proměnné s vysokou korelací se stejným faktorem (a často také mezi sebou), což Vám umožní vybrat pouze menší množinu reprezentantů.
Slouží pro stanovení významných interakcí mezi proměnnými, současně je schopen identifikovat pravidla, která významně ovlivňují odezvu (toto se děje aplikací stromových algoritmů či logistické regrese). Vytvořená a následně uživatelem vybraná pravidla lze vyexportovat jako nové proměnné, lze také vygenerovat makro, report či zdrojový kód pro Pravidla, který je schopen vytvořit nové proměnné následně automaticky.
Zde je možné připravit si profily pro každou proměnnou (diskretizace). Můžete použít automatický algoritmus (je založen na CHAID algoritmu) nebo manuální mód, můžete rozdělit proměnnou do (jinak známou jako charakteristika) do tříd (atributů) dosahujících stejné risky. Počáteční atributy mohou být nastaveny manuálně tak, aby naplnily obchodní i statistické požadavky, jako hladkost profilu nebo jednoduchost interpretace. Pro vybudování správných profilů jsou uživateli k dispozici statistické míry kvality predikce pro každý atribut (WoE – weight of evidence a informační hodnota). Kvality WoE dělení může být dosaženo díky využití grafu trendu WoE. Celý proces může být uložen jako XML kód (či soubor typu Pravidla) a použit později ve fázi přípravy skórkarty.
Modul Výstavba modelu je určen k vytvoření skórkarty založené na připravených atributech a logistické regresi. Proces od dat k vytvoření skórkarty může být urychlen akceptováním defaultního nastavení. Pokročilí uživatelé si mohou vybrat rekódování prvnotních proměnných na atributy (WoE nebo sigma omezená parametrizace) a vybrat si typ výstavby modelu – postupné vkládání, postupné odebírání, dopředná a zpětná kroková logistická regrese a hledání nejlepší podmnožiny. Jakmile je model vystavěn, může být generována množina statistik (jako AIC, BIC, test poměrem věrohodností) a reporty (jako eliminace nedůležitých proměnných). Finálním stádiem přípravy skórkarty je odhadnout parametry logistického regresního modelu a specifikovat škálovací hodnoty pro transformování na formát skórkarty. Jednotlivá skóre lze dále ještě manuálně upravovat. Kartu lze vyexportovat ve formátu Excelovské tabulky, xml či SVB kódu.
Tvorba skóringových modelů s využitím Coxova modelu proporcionálního rizika. Budete schopni odhadnout skóringový model za využití dodatečné informace o času defaultu (kdy dlužník přestane platit). Na základě tohoto modelu jste schopni vypočítat pravděpodobnost defaultu v daném čase (například za 6 měsíců, rok, atd.).
Tvorba skóringových modelů s využitím Coxova modelu proporcionálního rizika. Budete schopni odhadnout skóringový model za využití dodatečné informace o času defaultu (kdy dlužník přestane platit). Na základě tohoto modelu jste schopni vypočítat pravděpodobnost defaultu v daném čase (například za 6 měsíců, rok, atd.).
Tato metoda slouží k tomu, abychom do modelu nevnášeli vychýlení způsobené zamítnutím některých případů. V některých případech je potřeba vzít v úvahu zamítnuté případy. Protože u nich nemáme informaci o tom, jestli by patřili nakonec k dobrým nebo špatným, musí být tato informace doplněna užitím jiných algoritmů na základě ostatních údajů o žadateli (k dispozici je metoda k-nejbližších sousedů a „parceling“metoda). Po analýze jsou vytvořena nová data s kompletní doplněnou informací.
Vyhodnocení a porovnání různých skórkartových modelů včetně vytvoření detailních reportů obsahujících následující statistické přehledy: informační hodnoty, Kolmogorov-Smirnovovy statistiky, Giniho indexy, divergence, Hosmer – Lemeshowovy statistiky, křivky ROC, grafy lift a gain, grafy šancí, bad rate,…). Tím pomahá vybrat model, který splňuje Vaše očekávání.
Definování optimální hodnoty skóre pro rozlišení zamítnutých a přijatých žadatelů. Můžete rozšířit rozhodovacá postup přidáním jednoho nebo dvou bodů useknutí (například žadatelé se skóre pod 520 budou zamítnuti, žadatelé nad 580 budou přijali a ti, kteří jsou mezi těmito hodnotami budou požádáni o dodání doplňujících informací). Body mohou být definovány manuálně, na základě ROC křivky pro zvolené náklady za špatnou klasifikaci. Navíc, můžete zvolit optimální bod useknutí, simulací výdělku spojeného s hladinou useknutí. Kvalita vybraného bodu useknutí může být obhájena na základě různých reportů.
Je možné oskórovat nové případy na základě modelu skórkarty uloženého jako XML skript. Můžete spočítat celkové skóre, parciální skóre pro každou proměnnou a pravděpodobnost defaultu (z modelu logistické regrese) upravené o apriorní pravděpodobnost defaultu pro celou populaci (dodanou uživatelem).
Kalibrační testy dovolují testovat, zda je či není pravděpodobnost předpovědi defaultu ta, která aktuálně nastala. Jsou k dispozici testy binomického a normálního rozdělení, které určí, zda model nepodceňuje výsledky ohodnocení. Kritérium zvané „Austrian Supervision Criterion“ je také implementováno.
Poskytuje analytické nástroje pro porovnání dvou datových sad, např. současných a historických, pro odhalení významných změn ve struktuře charakteristik a populací žadatelů. Výstupy poskytují také detailní porovnání výsledků skóringu na obou datových sadách, tyto výstupy dávají oporu ke stanovení, jestli je daný model ještě aktuální či je potřeba model aktualizovat. Tento modul popisuje populaci a charakteristiky vhodnými grafickými výstupy.