КРАСОВИЦЬКИЙ, ДанилоДанилоКРАСОВИЦЬКИЙ2026-03-172026-03-172025-01-26КРАСОВИЦЬКИЙ, Д. (2025). DEVELOPMENT OF RETAIL LOAN SCORECARD USING MACHINE LEARNING. Bulletin of Taras Shevchenko National University of Kyiv. Economics(1), 64–71. https://doi.org/10.17721/1728-2667.2025/226-1/810.17721/1728-2667.2025/226-1/8https://ir.library.knu.ua/handle/15071834/12889B a c k g r o u n d . Banks use credit scoring to track loan performance, manage provisions, and adjust lending policies. Thismethod assigns points based on a borrower's loan history and unique characteristics, enabling lenders to predict default risk and improve credit conditions for low-risk borrowers. With increased data access and computing power, it is possible to do credit scoring via new methods with possibly better predictive power. This study aims to develop a scorecard for Ukrainian retail borrowers using Credit Registry data, exploring the effectiveness of logistic regression and Support Vector Machine (SVM) methods. Key research questions address the potential for binning data to improve model interpretability, the accuracy probability of default estimates, and differences in decision thresholds across scorecards built with logistic and SVM models. M e t h o d s . The study applies Weight of Evidence (WoE) binning, a technique that transforms variables to establish a monotonic relationship with default risk, thereby improving interpretability and model robustness. Using this binned data, the paper constructs scorecards with logistic regression and SVM. Each scorecard uses predictor variables such as Debt Service to Income (DSTI), age, interest rates, and days overdue to assess default likelihood. Scores are assigned based on each variable's impact on default probability. R e s u l t s . Findings indicate that it is possible to develop a scorecard based on Credit Registry data. Logistic regression and SVM models yield similar score distributions, with high predictive accuracy and robustness as measured by accuracy and F1-score. The scorecard approach provides transparency and interpretability; for instance, borrowers with a DSTI exceeding 40% receive lower scores, indicating higher risk. C o n c l u s i o n s . Banks may use both logistic and SVM models for real-time credit assessments, leveraging accessible borrower characteristics to streamline decision-making. For regulators, the scorecards can support policy frameworks that restrict lending based on borrower risk bins, thus mitigating risks arising from specific retail lending segments.В с т у п . Банки використовують кредитний скоринг, щоб відстежувати обслуговування кредитів, формувати резерви та коригувати політику кредитування. В основі методу лежить призначення балів на основі кредитної історії та унікальних характеристик позичальника, що дозволяє кредиторам передбачити ризик дефолту та покращити кредитні умови для позичальників з низьким рівнем ризику. Із розширеним доступом до даних і обчислювальною потужністю стало можливим проводити оцінювання кредитоспроможності за допомогою нових методів з кращою прогностичною потужністю. Це дослідження спрямоване на розробку скорингової карти для українських роздрібних позичальників з використанням даних Кредитного реєстру, порівняння ефективності логістичної регресії та методів методу опорних векторів. Ключові питання дослідження стосуються потенціалу групування даних для покращення інтерпретації моделі, покращенням точності оцінок і відмінностей у порогових значеннях для прийняття рішень у системах, створених за допомогою логістичної моделі та методу опорних векторів. М е т о д и . У дослідженні застосовано аналіз ваги доказів, який перетворює змінні для встановлення монотонного зв'язку з ризиком дефолту, тим самим покращуючи інтерпретацію та стійкість моделі. Використовуючи ці згруповані дані, у статті будуються скорингові карти за допомогою логістичної регресії та методу опорних векторів. Для оцінювання ймовірності дефолту кожна скорингова карта використовує передбачувані змінні, такі як співвідношення обслуговування боргу до доходу (DSTI), вік, процентні ставки та кількість днів прострочення. Оцінки призначаються на основі впливу кожної змінної на ймовірність дефолту. Р е з у л ь т а т и . Висновки свідчать про те, що можна розробити скорингову карту на основі даних Кредитного реєстру. Логістична регресія та метод опорних векторів дають схожі розподіли балів з високою точністю прогнозування та надійністю за показником F1. Скорингова карта забезпечує прозорість та можливість інтерпретації, наприклад, позичальники з DSTI понад 40 % отримують нижчі бали, що вказує на вищий ризик. В и с н о в к и . Банки можуть використовувати як логістичні моделі, так і моделі методу опорних векторів для оцінювання кредитоспроможності в реальному часі, використовуючи доступні характеристики позичальника для спрощення прийняття рішень. Для регуляторів скорингова карта може допомогти формувати політики, які обмежують кредитування, таким чином пом'якшуючи ризики, пов'язані з конкретними сегментами роздрібного кредитування.ukmachine learningscorecarddefault predictionlogistic regressionsupport vector machineC38C45C58G21G51машинне навчанняскорингова картапрогноз дефолтулогістична регресіяметод опорних векторівDEVELOPMENT OF RETAIL LOAN SCORECARD USING MACHINE LEARNINGРОЗРОБКА РОЗДРІБНОЇ СКОРИНГОВОЇ КАРТИ ЗА ДОПОМОГОЮ МАШИННОГО НАВЧАННЯСтаття